블룸버그GPT도 나왔다...블 대리, 이제 좀 친절해질까? [류현정의 아하! 스토리]
<아하! 스토리> 뉴스레터 구독하기 ☞ https://page.stibee.com/subscriptions/231530
※ 스토리와 테크놀로지는 뗄레야 뗄 수 없습니다. 테크놀러지 전문 기자가 현대 스토리 비즈니스가 어떻게 돌아가는지 짚어드립니다.
‘데이터 = 돈’
마이클 블룸버그(Michael Bloomberg)는 이 빛나는 부(富)의 공식을 가장 빨리 알아차린 현대 인물 가운데 한명입니다. 블룸버그는 1966년 살로먼브러더스의 주식 트레이더로 입사해 1979년 파트너에 올랐지만, 1981년 하루아침에 해고를 당합니다.
충격적인 해고는 창업의 기회였습니다. 블룸버그는 금융 정보를 실시간으로 제공하는 단말기(terminal)를 만들어 판매했습니다. 개인용 컴퓨터(PC)와 인터넷이 널리 쓰이기 전인 1981년 주가 정보를 수집해 월가에 팔기 시작했다는 것이 흥미롭습니다.
‘누가 돈 주고 정보를 보겠느냐’고 했지만, 체계적으로 모은 정보가 컴퓨터에 흐르는 데이터가 되자, 돈으로 바뀌는 데는 얼마 걸리지 않았습니다. 1982년 메릴린치에서 블룸버그 단말기 22대를 구매했고 이듬해엔 다른 여러 증권사로부터 5000대의 주문이 들어왔습니다.
블룸버그는 단말기에 정보와 기능을 지속적으로 추가했습니다. 주식 트레이더나 외환 딜러들은 블룸버그 단말기에서 주가·환율·채권 같은 정보도 찾아보지만, 메시지 전송(채팅) 기능도 많이 씁니다. 블룸버그는 24시간 방송하는 라디오·텔레비전과 잡지까지 거느리고 전 세계 1만9000여 명을 고용하는 거대 그룹이 되었습니다.
데이터 비즈니스의 신화를 써내려간 블룸버그가 요즘 가장 ‘핫한’ 인공지능(AI)에도 오랫동안 투자한 것으로 드러났습니다. 최근 금융 분야에 특화한 대규모 언어 모델(LLM) ‘블룸버그GPT’를 개발했다고 깜짝 발표한 것입니다. 금융 분야에서 둘째가라면 서러울 정도로 말을 잘하는 AI를 만들었다는 것입니다.
오늘날 ‘데이터 = AI’입니다. 지난 40년 동안 금융 데이터를 차곡차곡 모아온 블룸버그가 부의 공식을 새롭게 보여줄 태세입니다.
블룸버그GPT가 무엇인지, 블룸버그가 AI기술을 어떻게 활용할 것인지를 차근차근 알아보는 시간을 마련했습니다. 생소한 용어를 가능한 쉽게 풀고 관련 링크를 여러 개 넣어 두겠습니다. <아하! 스토리>는 ‘스토리와 테크놀로지는 뗄레야 뗄 수 없다’고 봅니다. 블룸버그GPT야말로 이 구호와 꼭 맞는 사례입니다.
◇ “작지만 강하다”...불과 500억 파라미터로 언어 모델을 만들다
컴퓨터가 대량의 언어 데이터 패턴을 학습하면 스스로 문장도 만들고 일종의 추론도 하게 됩니다. 엄청나게 큰 계산식과 이 계산식을 푸는 슈퍼컴퓨터로 구성된 언어 모델을 ‘대규모 언어 모델(Large language model·LLM)’이라고 합니다.
스타트업 오픈AI가 개발한 ‘챗GPT’는 GPT(Generative Pretrained Transformer)라는 대규모 언어 모델로 신통방통한 언어 구사 능력을 발휘하며 전 세계를 깜짝 놀라게 했지요. ‘챗GPT’의 언어 모델을 자세하게 알고 싶다면, 다음 박스를 참조하시면 됩니다.
GPT (Generative Pretrained Transformer)
오픈AI가 공개한 대규모 언어 모델. GPT는 ‘Generative (생성하는) Pre-trained(미리 학습된) Transformer (트랜스포머)’의 약자입니다. GPT 이름 자체가 언어 모델의 특징 3가지를 잘 나타내고 있습니다. 첫째, ‘Generative (생성하는)’. GPT는 자연어를 생성하는 모델입니다. 이 모델은 이전 단어를 기반으로 다음 단어를 맞추는 방식으로 단어를 생성합니다. 둘째, ‘Pre-trained (미리 학습된)’. GPT는 대규모의 사전 학습을 통해 성능을 개선했습니다. 셋째, ‘Transformer’. GPT는 2017년 구글이 한 기념비적인 딥러닝 아키텍처인 트랜스포머를 기반으로 만든 언어 모델입니다. 트랜스포머는 단어와 단어 사이의 맥락을 학습시켜 컴퓨터의 언어 이해 수준을 크게 끌어올렸습니다. GPT로 할 수 있는 여러 응용 서비스 중 하나가 ‘챗GPT’입니다. 챗GPT는 자연어를 구사하는 대화형 AI이지요.
보통 계산식에 들어가는 매개 변수(파라미터·parameter)의 수(數)로 언어 모델의 크기를 가늠합니다. 매개 변수는 사람의 뇌로 따지면 시냅스(뇌신경 세포의 연결부) 역할을 합니다.
일반적으로 매개 변수가 많으면 더 정확한 결과를 내놓는 것으로 알려져 있는데요, 오픈AI의 챗GPT(GPT-3)의 경우 매개 변수가 1750억 개이고 구글의 팜(PalM)의 매개 변수는 5400억 개에 달합니다. 모델 크기가 크면 운영비도 기하급수적으로 늘어납니다. 김주영 KAIST 교수는 챗GPT 운영비만 연간 수조 원에 달할 것이라고 말했습니다.
블룸버그GPT의 매개 변수 개수는 500억 개로 최근 나온 대규모 언어 모델 중에서는 적은 편입니다. 그런데도 일반 자연어 성능 테스트(벤치마크)에서 밀리지 않는 성능을 보였다는 것이 블룸버그의 설명입니다. 금융 관련 작업에선 기존 모델보다 확실히 우수한 성능을 나타냈고요.
블룸버그 머신러닝(ML·기계학습) 연구팀은 블룸버그GPT 논문만 발표하고 챗GPT처럼 사용가능한 서비스를 아직 내놓지 않았습니다. 블룸버그GPT가 논문에서 언급한 대로 뛰어난 성능을 보인다면, 특정 영역에서 대규모 데이터를 보유한 업체들이 너도나도 자체 언어 모델을 만들겠다고 뛰어들 것입니다.
언어 모델을 만들 때 가장 중요한 것이 데이터입니다. ‘데이터 = AI’라고 해도 과언이 아닌 이유입니다. 양질의 데이터를 확보하면 머신러닝이 잘 됩니다. 컴퓨터를 잘 훈련시킬 수 있다는 뜻이죠.
컴퓨터는 글이나 문서를 단어(word)나 문자(character)로 분해하면 더 잘 이해합니다. 글·문서를 분해한 단위를 토큰(token)이라고 하는 데, 블룸버그GPT는 총 7080억 개에 달하는 토큰으로 학습했습니다. 구체적으로 금융 데이터에서 3630억 토큰, 비금융 데이터에서 3450억 토큰으로 블룸버그GPT를 훈련하는 학습용 데이터 세트를 만들었다고 합니다. 여기에는 미국 증권거래위원회(SEC)에 기업들이 제출한 각종 서류, 인터넷에 긁어모은 금융 뉴스와 보도자료, 블룸버그 자체 보유한 금융 정보 등이 포함됩니다.
블룸버그의 머신러닝 제품 및 연구팀 책임자인 기드온 만이 보도자료에서 강조한 것 역시 데이터입니다. 그는 “머신 러닝과 자연어 처리 모델의 품질은 모델에 입력하는 데이터에 따라 결정된다”면서 “블룸버그가 40년 이상 모아온 금융 자료 덕분에 금융 언어 모델을 훈련할 적합한 데이터 세트를 만들 수 있었다”고 말했습니다. 그는 “블룸버그GPT를 활용해 자연어 기반으로 업무 처리를 개선하고 고객을 만족시키는 새 방법을 구상할 것”이라고 덧붙였습니다.
◇ 불친철한 블 대리, 이제 달라질까요
블룸버그 단말기는 ‘블 대리’라는 별명으로 불립니다. 대리급 연봉에 맞먹는 연간 수천만 원에 달하는 사용료 때문입니다. 지금도 블룸버그 단말기는 ‘황금알을 낳는 거위’입니다. 블룸버그 연간 총 매출 122억 달러(16조1180억원)의 80~85%를 차지할 정도입니다. 전 세계 곳곳에서 설치된 블룸버그 단말기 대수는 30만 대가 훌쩍 넘습니다.
블 대리는 불친절하기로 악명이 높습니다. 블룸버그 단말기 사용법을 익히려면 별도 교육을 받고도 오랫동안 써봐야 합니다. 가령, 세 자리 혹은 네 자리의 코드를 암기하고 단축키를 알아야 하는 식입니다. 대부분의 고객이 블룸버그가 지원하는 기능 중 극히 일부만 활용한다는 평가가 나올 정도입니다.
이런 약점 때문에 합리적인 가격을 내세워 블룸버그 단말기를 대체하겠다는 데이터 서비스 업체들이 우후죽순 등장하고 있습니다. 레피니티브(Refinitiv), 팩트셋(FactSet), S&P글로벌마켓인텔리전스(S&P Global Market Intelligence), 캐피탈IQ(Capital IQ), 피치북(PitchBook), 알파센스(AlphaSense), 센티에오(Sentieo), 코이핀(Koyfin), IHS마킷(IHS Markit) 등 줄잡아도 수십 개사에 이릅니다.
블룸버그GPT의 첫 번째 임무는 불친절한 블룸버그 단말기를 쉽게 사용할 수 있는 길을 열어주는 것입니다. 단말기 입력창에 자연어, 즉 사람이 쓰는 말로 묻고 지시해도 말귀를 알아먹고 정보를 출력한다면 사람들이 열광할 것입니다. 가령, “애플의 3분기 실적과 애널리스트 반응을 정리해줘” “디즈니의 주요 주주를 나열해줘” BBB 이상 등급 기업 중 가장 수익률이 좋은 회사채를 찾아줘”라고 지시하면 블룸버그GPT가 데이터를 찾아 똑부러지게 정리해주는 것입니다.
챗GPT와 같이 방대한 데이터를 학습한 인공지능은 묻는 말에 척척 대답도 하고 시나리오도 쓰고 사업 계획서도 짜줍니다. 블룸버그GPT도 마치 블룸버그통신 기자인 양 기사를 써내려 갈 수도 있습니다.
자미엘 세이크 체인하우스(Chainhaus) 창업자 겸 CEO는 블룸버그GPT의 활용 사례를 다음과 같이 5가지로 정리했습니다.
(1) 블룸버그GPT가 미국 증권거래위원회에 제출할 각종 서류의 초안을 써준다
(2) 복잡한 금융 보고서의 핵심을 뽑아 요약해 준다
(3) 개별 기업과 임원에 대한 정보를 구조화해 준다
(4) 시장 보고서(market report) 초안을 작성해준다
(5) 기업 재무제표의 특정 요소를 검색해준다.
◇ 금융 데이터 전쟁은 AI 전쟁이 될 것
2020년 미국 신용 평가 회사 스탠더드앤드푸어스(S&P)글로벌이 금융 정보 제공 업체 IHS마킷을 440억 달러(약 49조 원)에 인수합니다. 세계 3대 신용평가 회사와 막대한 양의 경제·기업·시장 정보를 보유한 정보 제공 회사가 결합하기로 한 것입니다. 이 거래는 400억 달러(약 44조1200억 원) 규모였던 엔비디아의 ARM홀딩스 인수를 제치고 2020년 공표된 인수·합병(M&A) 가운데 최대 규모였습니다.
S&P글로벌은 신용평가 사업과 금융 정보 제공 사업, 상품 및 에너지 정보 제공 사업, S&P 500지수를 비롯한 각종 지수 제공 사업 등을 하는 금융 서비스 업체입니다. IHS마킷은 2016년 IHS와 마킷의 합병으로 탄생한 금융 정보 업체로 채권시장과 파생상품 분석에서 전문성을 자랑합니다.
조만간 합병이 마무리되는 S&P글로벌과 IHS마킷도 AI 기반 새로운 분석 플랫폼을 만들고 있습니다. S&P의 켄쇼(Kensho)가 제공하는 AI 도구와 아마존웹서비스(AWS)의 클라우드를 활용할 계획이라고 합니다.
리얼타임으로 지구촌의 돈과 물자의 흐름을 보도하는 경제뉴스서비스 3강(强)은 로이터, 다우존스, 블룸버그입니다. 지난해 9월 세계뉴스미디어총회에서 강연자로 나선 마이클 영 로이터 CTO도 “AI를 활용한 다양한 콘텐츠 생산에 전력투구하고 있다”고 말했습니다. 전 세계 금융 데이터 전쟁은 곧 AI 전쟁으로 바뀔 것입니다.
◇ “좌천은 행운이었다”
다시 마이클 블룸버그의 이야기로 돌아가 봅니다. 1981년 살로몬이 원자재 트레이딩 업체 피브로라는 회사와 합병하면서 블룸버그는 39살의 나이에 15년간 일한 회사에서 해고됐습니다. 이것이 그가 회사 생활에서 겪은 첫 번째 좌절은 아니었습니다. 1972년 파트너 승진자 발표에서 그의 이름이 빠져 있었고 그는 눈물이 앞을 가릴 정도로 울었습니다. 블룸버그가 파트너로 승진한 것은 3개월 후였습니다.
또 그는 1978년 증권 거래 부서에서 IT부서로 이동했습니다. 증권 회사에서 트레이더가 IT부서로 발령 나는 것은 일종의 좌천이었습니다. 블룸버그가 15년 다니던 회사에서 갑자기 해고통보를 받고 세운 회사 이름은 이노베이티브마켓시스템즈(IMS, 블룸버그의 전신). IT부서에서 배운 컴퓨터가 창업에 큰 도움이 됐음은 두말할 나위가 없습니다.
마이클 블룸버그는 “좌천과 퇴직이 나에게는 행운이었다”고 회고했습니다.
TMI(Too Much Information)
사업으로 성공한 마이클 블룸버그는 정치에도 도전합니다. 골수 민주당 당원이었던 그는 루돌프 줄리아니 전 시장이 건강상의 이유로 사임하자 당적을 바꿔 공화당의 뉴욕 시장 후보가 됩니다. 뉴욕 시장을 3선을 했고요(2001년, 2005년, 2009년 뉴욕 시장 선거 당선), 도널드 트럼프의 재선을 막겠다며 2020년 미국 대통령 선거에도 출마하기도 했습니다. 2020년 포브스 부호 순위에서 블룸버그는 16위(480억 달러), 트럼프는 352위(25억달러)였습니다.
<아하! 스토리> 뉴스레터 구독하기 ☞ https://page.stibee.com/subscriptions/231530
※ 뉴스레터를 구독해주시는 분께는 다음 메모를 전달해드립니다.
2016년 알파고 취재 후기 : 10개월 된 딸에게 보낸 편지
Copyright © 조선일보. 무단전재 및 재배포 금지.
- 드디어 국내 출시! 애플 비전프로 24시간 사용기[형테크]
- [오늘의 운세] 11월 17일 일요일 (음력 10월 17일 乙酉)
- [오늘의 운세] 11월 16일 토요일(음력 10월 16일 甲申)
- 김동연, 이재명 판결에 “사법부 판단 매우 유감”
- 한동훈 “인생 걸고 시험보는 수험생들 생각해 野주말시위 취소해달라”
- 오세훈, “이재명 1심 선고 다행, 존재 자체가 대한민국 위협”
- 민주, 李 징역형 확정땐 434억 반환해야...與, ‘선거비 먹튀 방지법’ 발의
- 대구지검, 마약 투약 후 운전한 조폭 구속 기소
- 이재명 ‘당선무효형’ 선고 후 “우리 대표님이 뭘 잘못했냐” 곳곳서 오열
- 北 170㎜ 자주포 우크라전 투입?…러시아서 운송 사진 포착