‘마크다운인가, HTML인가’ 그 너머의 질문 [이승현의 AI 네이티브]

지난 주말, 인공지능(AI) 관련 SNS에서 주목을 받은 글이 있었다. 앤트로픽의 엔지니어 타리크 시히파르(Thariq Shihipar)의 "The unreasonable effectiveness of HTML"이다. 거창한 라이브러리도, 새로운 프레임워크도 아니지만 그는 에이전트에게 마크다운 대신 HTML로 답하게 했고, 그 결과물 스무 건의 놀라운 예시를 보여줬다.

왜 HTML이 효과적인가

시히파르는 스무 개의 사례를 통해, 각각 기존의 마크다운으로는 불가능하거나 어려운 결과물을 보여줬다.

나란히 비교하기. "세 가지 코드 접근법을 비교해줘"라고 했을 때, HTML 기반은 그냥 세 단락을 차례로 쓰지 않았다. 세가지 안을 가로로 늘어놓고 트레이드오프를 옆에 단 한 페이지를 만들었다. 시각 디자인 시안도 마찬가지다. 색감 세 개를 글로 묘사받는 것과 실제 팔레트 세 장을 라이브로 받는 것은 의사결정 속도에서 수 배의 차이를 만든다. 인간의 눈은 본래 여러 대상을 동시에 보지만 마크다운은 그 능력을 강제로 줄여버린다는 것이다.

공간 구조를 그대로 보존하기. 코드 리뷰가 가장 인상적인 예다. 풀 리퀘스트는 마진에 주석이 달리고 심각도 태그가 붙고 점프 링크가 박힌 한 페이지짜리 문서로 렌더된다. 그런데, HTML은 "이 함수가 저 함수를 부른다"는 산문이 아니라, 박스와 화살표로 그려진 의존도 그래프로 결과를 보여준다. 코드의 본질은 공간 구조임에도 불구하고, 그동안 그 구조를 굳이 평문으로 풀어 받느라 괜히 어려운 인지 비용을 치러왔다.

좀더 설명하자면, 정보를 단순히 나열하는 대신 그리드와 계층 구조로 공간에 배치하면, 사용자는 긴 글을 정독하지 않고 한 번의 시각적 스캐닝만으로 데이터의 맥락과 관계를 잡아낼 수 있다는 것이다.

만져봐야 아는 것을 만지게 하기. 프로토타이핑은 HTML 없이는 거의 불가능한 영역이다. 슬라이더로 트랜지션 속도를 조정하고 네 개의 화면을 클릭으로 넘겨보며 이 인터랙션이 맞는지를 5초에 판단한다. 모션과 인터랙션은 묘사할 수 없고, 오직 해봐야 안다. 그 차이를 마크다운은 결코 메꿀 수 없다. 텍스트는 특정 시점의 정적인 상태만 서술하지만, HTML 아티팩트는 슬라이더나 토글 같은 상호작용 요소로 사용자가 직접 변수를 조작하고 시스템의 피드백을 실시간으로 받아보는 능동적 탐색 환경을 제공한다.

일회용 도구로 인간-에이전트의 루프를 닫기. "30장의 티켓을 Now/Next/Later/Cut으로 드래그해서 분류하고, 마지막에 그 순서를 마크다운으로 복사할 수 있게 해줘." 이게 한 번에 만들어진다. 인간이 텍스트로 표현하기 어려운 의도를 일회용 화면으로 잡아두고, 그 결과를 export 버튼으로 다시 에이전트의 입력으로 되돌려보낸다. 에이전트와 함께 일한다는 말이 이런 것이다.

이외에도 디자인 토큰 카탈로그, 다이어그램, 슬라이드 덱, 주간 상태 보고, 사고 후 타임라인, 콘셉트 설명 페이지 같은 사례를 설명하고 있다. 공통점은 받은 사람이 스킴하고 잊는 게 아니라, 실제로 읽고 조작하는 결과물이 된다는 것이다.

그래도 문제는 있다

그렇다고 HTML로 답하는 에이전트가 무조건 대안일까? 아니다. 효과가 실재하는 만큼 그 비용도 실재한다.

첫째, 토큰값이 많이 들어간다. 같은 의미를 담아도 HTML은 마크다운 대비 출력 토큰이 기본적으로 통상 2~5배다. `## 헤더`가 '

헤더

...

`로 커지고, 스타일과 스크립트까지 포함되면 더 늘어난다. API 단가로 환산하면, 사내 수만 건의 호출에서 이 차이는 그대로 비용과 응답 지연으로 누적된다. 일회성 큰 의사결정은 몰라도, 매일 수백 건씩 도는 일상 보고에는 맞지 않다.

둘째, 검색·이식이 어렵다. 마크다운은 git에서 라인 단위로 깔끔히 diff되고 검색되고 슬랙, 노션, 깃허브 어디에나 그대로 붙는다. HTML은 이게 어렵다. 한 줄을 고치려면 구조를 헤집어야 하고, 변경 이력은 의미 없는 태그 변화에 찾기 힘들다. 협업 결과물의 가치는 결국 얼마나 쉽게 다시 손댈 수 있는가에서 나오는데, HTML은 이 점에서 마크다운에 진다.

셋째, 다음 에이전트가 다시 읽기 어렵다. 이것이 가장 결정적인 문제라고 생각한다. AI 네이티브 조직의 진짜 자산은 다음 에이전트가 참조할 컨텍스트다. 그런데 HTML 결과물은 다음 에이전트의 입력으로 재투입했을 때 그 효과가 좋지 않다. 의미는 시각 구조에 흩어져 있고, LLM은 그것을 다시 평문으로 바꿔서 정보를 잃는다. 사람이 읽기 좋게 만든 HTML이 거꾸로 에이전트가 다시 읽기 어려운 HTML이 되기 쉽다. 마크다운은 여전히 LLM 입장에서는 일종의 모국어이고, 누적 자산의 관점에서 이 점은 절대 간단한 문제가 아니다.

넷째, 결과물이 매번 다르게 생긴다. 디자인 체계가 깔리지 않은 환경에서 에이전트가 즉흥적으로 만들어내는 HTML은 매번 다른 모습이다. 어제의 카드와 오늘의 카드가 다르고 팀 A의 보고서와 팀 B의 보고서가 다르다. 결과물이 자산이 되려면 형태가 누적되어야 하는데, 즉흥적 HTML은 누적되지 않고 흩어져 버린다. 시히파르의 스무 개 사례가 깔끔해 보이는 이유 중 하나는 결국 일관된 한 사람의 손에서 나왔기 때문이다.

그렇다면 어떻게 가야 하나

결국 중요한 건 한 가지 형식으로 통일하는 길이 아니라, 일의 단계마다 다른 그릇에 담는 길이다. 결과물의 형식을 가려 쓰는 안목, 그 자체가 AI 네이티브 조직의 경쟁력이 된다.

대략의 분담은 이렇게 그릴 수 있다. 슬랙 한 줄 응답이나 시스템 로그는 그냥 평문이면 된다. 일상 보고, 회의록, 기술 문서, 에이전트끼리 주고받는 컨텍스트는 마크다운이 표준이어야 한다. 가볍고, 검색되고, 어디든 붙고, 다음 에이전트가 다시 읽기 때문이다. 비교 의사결정, 시각 검토, 인터랙티브 프로토타입, 외부 공유처럼 한 번 깊게 읽힐 결과물에는 HTML이 필요하다. 공식 발표와 결재에는 PPT와 PDF가 여전히 남는다. 기계 사이의 인터페이스에는 CSV와 JSON이 있다.

핵심은 어느 형식이 우월한지가 아니라, 어떤 결정 단위에서 어떤 그릇이 비용 대비 가장 잘 읽히는가다. 분기 사업계획을 임원진 앞에 올리는 자리라면, 세 시나리오의 ROI 가정을 슬라이더로 즉시 바꿔볼 수 있는 HTML 한 페이지가 30쪽 PDF보다 훨씬 잘 먹힐 것이다. 그러나 그 회의가 끝난 뒤 부서별로 액션 아이템을 분배하고 추적하는 단계라면 그릇은 다시 마크다운으로 돌아올 수 밖에 없다. 지라 티켓에 붙고, 슬랙에 인용되고, 다음 주간 보고에서 검색되기 때문이다. 한 건의 의사결정이 단계마다 다른 그릇을 거쳐 흘러갈 수 밖에 없다면, 그 흐름을 설계하는 일은 단일 도구를 도입하는 일이 아니라 진짜 인공지능 전환(AX)일 것이다.

이번 주에 해볼 것

마지막으로 한번 시도해볼 만한 내용을 정리해보았다,

첫째, 에이전트나 AI 산출물 형식을 의식적으로 골라보자 "이 결과는 누가, 어디서, 몇 번 읽을 것인가"를 먼저 묻고, 그에 맞는 형식을 골라보자. 한 번 깊게 읽힐 비교 검토라면 HTML로, 매일 도는 운영 보고라면 마크다운으로.

둘째, 일회용 도구를 한 번 만들어보자. 손으로 반복하는 분류, 우선순위 조정, 견적 편집 작업 등을 떠올려, 그 작업을 처리할 HTML 한 페이지를 에이전트에게 요청해보자. 반드시 끝에 export 버튼을 넣어 결과를 마크다운으로 되돌릴 것. 그래야 자산이 계속 누적될 수 있다.

셋째, 조직의 결과물 분담을 한 장으로 그려보자. 우리 조직, 우리 팀에서 어떤 의사결정이 어떤 형식으로 진행되나? 그 분담은 비용 대비 효과 면에서 합리적인가? 모든 것이 PPT로 흐르고 있다면, 어느 정도부터 마크다운으로 옮겨갈 수 있는가? 이러한 정리가 거창한 AI 플랫폼 도입보다 조직의 AI에 대한 인지 속도를 더 빨리 끌어올린다.

에이전트가 내놓는 결과물로서 HTML의 효과성은 분명히 있다. 하지만 마크다운의 합리적 효율성도 함께 실재한다. 결국 우리에게 남는 질문은 어느 하나를 고르는 일이 아니라, 그 사이에서 옳은 분담을 그려내는 일이다. 그 안목이 결과적으로는 AI 네이티브 조직과 그렇지 않은 조직을 가르는 결정적인 격차가 될 것이다.

※ 외부필자의 원고는 IT조선의 편집방향과 일치하지 않을 수 있습니다.

이승현 포티투마루 부사장은 스타트업 창업가 출신의 AI 전문가다. 디지털플랫폼정부위원회 인공지능플랫폼혁신국장으로서 재직하면서 대한민국 공공 AI의 초석을 닦았으며, 현재는 법무법인 린의 공공AX 고문을 겸하며 기술과 정책의 가교 역할을 하고 있다. 이론에 머물지 않는 현장형 전략가로서 국가 전반의 AI 네이티브 전환을 이끌고 있다.

IT조선에서 직접 확인하세요. 해당 언론사로 이동합니다.

속보

‘마크다운인가, HTML인가’ 그 너머의 질문 [이승현의 AI 네이티브]