초거대 AI가 뭐길래…데이터 학습만 수백억, MS·구글 ‘쩐의 전쟁’

박수호 매경이코노미 기자(suhoz@mk.co.kr) 2023. 7. 12. 22:15
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

‘대AI(인공지능) 시대’.

빌 게이츠 마이크로소프트 창업자가 최근 AI가 주목되는 상황을 ‘대항해 시대’에 빗대어 한 표현이다. 챗GPT와 같은 AI 기술이 PC나 인터넷만큼이나 세상에 큰 영향을 미칠 것이라는 전망이 핵심이다. 빌 게이츠는 “AI는 우리 세상을 근본적으로 바꿀 것”이라고 강조했다. 특히 업계에서는 글로벌 시장에서 빅테크 간 초거대 AI 전쟁이 벌어질 것이라는 예상이 지배적이다. 여기서 잠깐. AI는 알겠는데 초거대 AI는 또 뭘까.

초거대 AI 개념 무엇?

챗GPT가 AI 혁명 실마리

초거대 AI는 기존 AI보다 수백 배 이상의 대용량 데이터 학습을 통해 판단 능력이 인간의 뇌에 더 가깝게 향상된 대규모 시스템을 뜻한다. 많은 기업과 스타트업이 AI를 활용한 다양한 서비스를 선보이고 있기는 하다. 이는 응용 상품이라고 보면 된다.

초거대 AI는 이런 상품과 서비스의 근간이 되는 인공신경망 기술 중에서도 연산에 활용하는 매개변수를 수천억 개로 대폭 확장한 대규모 인공지능을 뜻한다. 이때 핵심 변수는 스스로 학습하고 사고하며 판단하는 능력을 갖고 있느냐다.

우리는 이미 알파고를 통해 초거대 AI의 단면을 목도한 바 있다. 비록 바둑 한 분야에 특화돼 있었지만 초거대 AI는 때에 따라서 여러 가지 다양한 상황에 스스로 학습해서 역할을 수행한다.

이를 가장 잘 보여주는 예가 오픈AI다.

2015년 11월, 테슬라의 일론 머스크와 와이컴비네이터 샘 알트만이 공동 설립한 실리콘밸리 AI 기업 ‘오픈AI’는 ‘챗(Chat)GPT’를 선보였다. 챗GPT는 방대한 양의 텍스트 데이터를 학습하고, 대화형 인터페이스를 통해 정보를 제공하는데, AI 챗봇과 달리 챗GPT는 사람과 구분할 수 없을 만큼 자연스러운 대화가 가능하다.

챗GPT로 대변되는 초거대 AI는 간단한 질문에 답변할 수 있을 뿐 아니라, 복잡한 내용을 정리하고 요약하는 등의 고도화된 작업을 수행할 수 있다. 또한 스스로의 실수를 인정하고, 잘못된 전제에 이의를 제기하거나 부적절한 요청에 대해서는 답변을 거부하는 능력도 있다. 예를 들어 차를 훔치는 방법에 대해 물어 보면 “차를 훔치는 것은 심각한 범죄”라며 답변을 거부하는 식이다. 또한 대부분 AI 챗봇이 이전 대화를 기억하지 못하는 반면, 챗GPT는 사용자와 이전에 나눴던 대화를 기억하고 답변에 반영한다.

배경훈 LG AI연구원장은 “초거대 AI는 단순히 업무 효율을 높이고 작업자를 보조하는 역할을 넘어, 인간과의 협업을 통해 기존에 없던 새로운 콘텐츠와 서비스를 생성하고 오랫동안 인류가 해결하지 못했던 난제를 해결할 수 있는 촉진제가 될 것”이라고 말했다.

해외 동향은?

MS·구글 전쟁에 메타·알리바바 참전

인공지능 기술의 급속한 발전과 초거대 언어 모델(LLM·Large Language Model) 출현에 따라 IT 분야는 물론이고 일반 기업의 비즈니스 패러다임이 빠르게 변화하고 있다.

해외 선진 IT 기업들은 이 같은 시장 변화에 선제적으로 대응하고 있다. 오픈AI의 챗GPT와 GPT-4를 시작으로, 구글 바드(Bard), 메타(구 페이스북)의 라마(LLaMa) 등 글로벌 IT 업체마다 초거대 AI 모델을 경쟁적으로 발표하기 시작했다. 투자 금액 역시 천문학적이지만 물러서는 곳이 없다. 실제로 오픈AI가 2020년 공개한 언어 처리 모델 ‘GPT-3’는 한 번 데이터를 학습하는 데 100억~200억원의 비용이 드는 것으로 알려졌는데, 이런 과정을 수없이 반복하면서 점점 더 고도화되고 있고 실제 이용자 수도 늘어나고 있다.

실제 챗GPT는 5일 만에 100만 사용자를 달성해 눈길을 끌었다. 이후 오픈AI는 불과 3개월 뒤인 2023년 3월, 기존의 챗GPT의 ‘환각 현상’을 개선하고 대용량 텍스트 처리 능력을 강화한 챗GPT-4를 정식으로 공개하는 동시에, 마이크로소프트(MS)와의 파트너십을 통해 공격적으로 시장을 선점해가고 있다.

마이크로소프트는 2023년 1월 오픈AI와의 파트너십을 발표하고 100억달러(약 12조3500억원) 투자를 약속하며 글로벌 초거대 AI 경쟁에 불을 붙였다. 최근 MS 검색엔진 빙(Bing)에 AI 기반 챗봇을 적용하고 오피스 365에 GPT를 통합한 코파일럿을 발표하는 등, 초거대 AI 분야에 적극적으로 진출하고 있다.

구글 모회사 알파벳은 알파고를 만든 딥마인드와 구글 AI팀인 구글브레인을 합병, 새로운 통합본부를 설립하면서 맞불을 놓는 형국이다. 올해 5월 진행된 개발자 연례 행사인 구글 I/O에서는 챗GPT의 3배에 가까운 5300억개 매개변수를 적용한 ‘팜2(PaLM)’를 선보였다. 팜2는 과학과 수학에서 추론도 가능하고, 프로그램 코딩 작업도 가능하며, 이용자 질문에 이미지나 그래프로 답할 수 있으며, 이미지나 동영상에 대한 질문에도 답할 수 있다는 것이 주요 특징이다.

대기업이 주도하는 초거대 AI 시장에 대응해 누구나 사용할 수 있는 초거대 AI를 만들자는 움직임도 있다. 일루더에이아이(Eluther AI)와 같은 자발적인 연구 커뮤니티를 비롯, 메타는 라마를 기반으로 GPT-3와 유사한 성능의 초거대 AI 모델을 오픈소스로 공개했다. 이외에도 중국의 알리바바클라우드는 중국어 특화 초거대 AI를 발표했으며, 아랍에미리트(UAE)는 아랍어 대규모 언어 모델을 공개했다. 향후 국가나 대기업 주도 초거대 AI와 오픈소스 진영의 경쟁도 중요한 관전 포인트 중 하나다.

오픈AI 창업자 샘 알트만. (연합뉴스)
한국은 어떤 대응?

네이버, LG, KT 한국형 AI 차별화

국내 업체도 생성형 초거대 AI 시장에 적극적으로 대응하고 있다. 네이버의 하이퍼클로바(HyperCLOVA), LG AI연구원의 엑사원(EXAONE), KT 믿음(Mi:dm) 등이 올해 하반기 구체적인 사업 계획을 선보일 예정이다.

네이버는 ‘하이퍼클로바X’를 8월 말 공개할 예정이라고 밝힌 바 있다. 기존 GPT나 바드와 달리 세계에서 한국어를 제일 잘하면서 영어도 유창한 한국형 AI 모델이 될 수 있을 것이라고 밝혔다. 네이버 관계자는 “한국이 글로벌 빅테크의 초거대 AI 전장이 될 것”이라며 자신감을 드러냈다.

LG AI연구원에서 만든 엑사원 역시 주목할 만하다. 전문가를 위한 초거대 AI로 차별화했는데 특히 LG 측은 기존 초거대 AI와 엑사원의 차별화 포인트로 ‘신뢰성’을 꼽고 있다. 현재 초거대 AI는 정확하지 않은 답변을 생성하는 기술적 한계가 있다. 엑사원은 전문 분야별로 학습한 데이터로부터 답변이 정확하게 일치하는지와 함께 명확하게 근거를 제시할 수 있는 부분이 차별화됐다고 소개했다.

KT의 초거대 AI 믿음 역시 시작부터 산업 상용화를 목표로 다양한 AI 분야에 활용할 수 있는 멀티태스킹 능력을 확보하는 방향으로 개발하고 있다는 후문. 경량화 기술 등도 동시에 개발을 하고 있다. AI 전문상담, AI 감성케어 서비스, AI컨택센터(AICC) 등에 적용, 은행, 카드, 보험 등 B2B AI 컨택센터 시장을 주도하는 것을 목표로 삼았다.

이외에도 SKT와 카카오가 각각 에이닷(A.), 코GPT 등의 모델을 개발 중에 있으며, 인공지능 기술 스타트업 포티투마루(42Maru)의 LLM42와 같은 기업용 경량화 버전도 속속 출시되고 있다.

정부 역시 AI 시장 선점 지원에 적극적이다. 과학기술정보통신부는 지난 4월 ‘디지털 경제 가속화를 위해 국민과 함께하는 똑똑한 인공지능’이라는 비전 아래 ‘초거대 AI 경쟁력 강화 방안’을 발표했다.

민간 차원에서도 정부와 손잡고 ‘AI 주권 지키기’에 힘을 합치려는 분위기다.

한국소프트웨어산업협회(KOSA)는 최근 ‘초거대 AI 추진협의회 발족식’을 열었다. 협의회는 네이버, LG 등 국내 대표 주요 AI 기업들이 모여 초거대 AI 기술과 산업 발전에 협력하는 협의체다. 협의회에는 통신, IT 서비스, AI 벤처·강소기업 등 국내 대·중소 105개 기업이 회원사로 참여했다.

김유원 네이버클라우드 대표는 “업계 목소리를 한데 모아 산업 현안을 해소하고, 기업 간의 협업을 통해 AI 기반의 다양한 응용 서비스를 창출하는 허브 역할을 할 수 있도록 적극적으로 활동할 예정”이라고 말했다.

챗GPT에 맞서 구글이 내놓은 초거대 AI ‘바드’. (구글 제공)
AI 전쟁 어떻게 흘러갈까

2028년 670조원 규모로 급성장

인공지능 기술의 빠른 발전으로 챗GPT 같은 생성형 AI가 주목받으면서 인공지능 시장도 급격하게 성장하고 있다. 해외 전문 조사기관에 따르면, 세계적으로 인공지능 시장은 연 35%씩 성장, 2028년에는 670조원 규모로 성장할 것이라는 예상이다. 특히 생성형 AI 시장 규모는 2022년 13조원에서 2030년 142조원까지 급격하게 성장할 것으로 내다본다.

스탠퍼드대 인공지능 인덱스 2023 보고서에는 “생성형 AI 기술이 현재 변곡점에 도달했으며, 이는 빠른 시일 내에 인류가 풀기 어려웠던 난제를 해결할 수 있는 가능성을 내포한다”는 내용이 들어 있다. 이런 흐름은 인공지능 기술의 지속적인 발전을 예고하며, 그 영향력이 점점 넓어지고 있음을 시사한다. 앞으로 누구도 예상치 못할 ‘AI가 주도하는 미래’가 현실화될 수 있다는 의미다.

지난 5월 가짜 뉴스 사진으로 뉴욕 증시가 들썩였다. (연합뉴스)
장밋빛 미래만 있을까

AI가 가짜 뉴스 공장 될 수도

물론 초거대 AI가 장밋빛 미래만 제시하는 것은 아니다.

올해 5월 미국 뉴욕 증시는 한 차례 가짜 뉴스에 곤욕을 치렀다. 미국 국방부 청사 인근 폭발 장면이라는 사진이 소셜미디어(SNS)상에 돌면서다. 결국 AI로 만든 가짜 이미지로 판명 났지만 이런 사건은 연이어 터지고 있다.

더불어 저작권 이슈에서도 자유롭지 못하다.

초거대 AI가 학습하는 기초 데이터베이스, 즉 상당수 빅데이터는 저작권이 분명한 데이터다. 그런데 이를 마구잡이로 활용, 새로운 콘텐츠를 만들고 이를 바탕으로 수익화하는 이들이 생기면서 이와 관련한 규제 마련이 필요하다는 목소리가 팽배하다. 이미 게티이미지 등 종전 이미지 보유 업체들은 AI 업체를 상대로 소송을 제기한 상태기도 하다.

UN은 물론 각 나라 정부 역시 이를 예의 주시, 관련 규제를 강화하겠다는 입장이다. 유럽연합(EU) 입법기관인 유럽의회가 최근 AI에 대한 세계 최초의 포괄적 규정안을 의결했는가 하면 미국 상원에서도 ‘보안(Security), 책임성(Accountability), 민주적 토대(Foundations), 설명 가능성(Explainability)’ 등의 대원칙 아래 AI 정책 논의에 들어간 상황이다.

국내에서도 관련 논의가 활발하다. 과기정통부는 정보통신정책연구원(KISDI)과 한국정보통신기술협회(TTA) 등과 제2차 인공지능(AI) 윤리 정책 포럼을 열었다. 이 자리에서 엄열 과기정통부 인공지능기반정책관은 “인공지능 윤리 정책 포럼에서 논의된 사항을 반영해 기업이 자율적으로 AI 윤리·신뢰성을 확보할 수 있도록 가이드라인 제시와 검증 체계 마련 등을 지원하겠다”고 말했다.

인터뷰/ 김동환 포티투마루 대표
김동환 포티투마루 대표(포티투마루 제공)
초거대AI가 국가 경쟁력 좌우 ... 챗GPT 환각현상 잡겠다

Q. 초거대 AI가 말 그대로 핫하다. 실제 우리 산업 현장에서도 활용되고 있나?

혁신적인 기업에서는 이미 선도적으로 인공지능 기술을 각 산업 분야에 융합하고 있다. 전자, 통신과 같은 ICT 분야를 비롯해, 은행, 보험, 증권, 카드 등의 금융 분야, 조선해양, 건설과 같은 엔지니어링 분야, 자동차, 법률, 교육, 의료, 헬스케어 등 포티투마루의 AI 기술을 활용하고 있는 기업만 하더라도 분야를 가리지 않고 다양하다.

Q. 최근에 기업용 초거대 모델 경량화 버전인 LLM42를 출시했다. 기업용 경량화 버전이 어떤 의미인가?

초거대 AI를 실무에 적용하려면, 환각(hallucination), 보안, 고비용 3가지 문제를 해결해야 한다. 초거대 모델은 구조적으로 솔루션 구축과 학습 비용은 물론이고, 운영 과정에서도 상당한 비용이 필요한데, 기업에 필요한 기능만으로 설계한 경량화 버전을 통해 개발, 운영 비용을 크게 절감할 수 있다. 또한 기업 내부 시스템에 설치할 수 있는 프라이빗(Private, 맞춤형) 모드를 지원해 기업 내부 데이터와 민감한 고객 정보 유출 걱정 없이 안전하게 사용할 수 있는 장점이 있다. 특히 챗GPT를 써보면 일단 질문에 무조건 답하기 위해 거짓정보도 서슴없이 갖다쓰는 사례를 많이 봤을 것이다. 이것이 전문용어로 환각(hallucination) 현상이라고 한다. 포티투마루는 이 틈새시장에 주목했다. 99% 이상의 정확도로 검증된 통합 QA(Question Answering) 모델과의 엔지니어링으로 완벽히 환각현상을 제거할 수 있다. 잘못된 정보 제공으로 인한 의사결정 오류를 방지해준다는 점 때문에 국내는 물론 이미 영국 등 유럽권에서 먼저 도입하겠다는 기업이 줄을 서고 있다.

Q. 이미 글로벌 대기업들이 초거대 모델을 개발하고 있는데, 스타트업에서 초거대 AI를 직접 개발하는 이유가 있는가?

예전에는 새로운 기술이 나오더라도 특정 분야에서만 적용되고 활용됐다. 그런데 AI 기술은 일상 생활을 비롯해, 정치, 경제, 산업, 사회, 문화, 교육, 법률, 의료 등 우리의 삶 전반에서 영향력을 발휘하게 될 것이다. 외산 기술에 의존하게 되면, 1차적으로는 기술 종속으로 인한 자본 유출과 이로 인한 문화 종속으로까지 이어질 수 있기 때문에, AI 모델의 보유 여부가 국가경쟁력의 근간이 될 수 있다. 자칫 이 기회를 놓치면 디지털 식민지에 놓일 수 있다. 앞으로 국제질서 패권은 핵무기를 보유하고 있는 국가와 아닌 국가가 있는 것처럼, 초거대 AI를 보유하고 있는 국가와 아닌 국가로 나뉘게 될 것이다.

[본 기사는 매경이코노미 제2217호 (2023.07.12~2023.07.18일자) 기사입니다]

Copyright © 매경이코노미. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?