불붙은 한국어 AI모델 경쟁…네·카오 이어 스타트업 가세

김주완 2023. 8. 14. 18:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

국내 인공지능(AI) 시장 확대와 맞물려 한국어 AI 대규모 언어모델(LLM) 경쟁이 가열되고 있다.

국내 IT 대기업도 한국어 AI 언어모델 개발에 역량을 집중하고 있다.

최근 국내 기업들이 한국어 AI 언어모델 개발에 속도를 낸 것은 오픈AI의 AI 챗봇 '챗GPT'의 파급력 때문이다.

지난 3월 오픈AI가 공개한 최신 AI 언어모델 GPT-4의 한국어 실력은 챗GPT(GPT-3.5)의 영어 실력을 앞섰다는 평가다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

챗GPT 등 한국어 기능 강화하자
업스테이지, 1조 토큰 데이터 확보

국내 인공지능(AI) 시장 확대와 맞물려 한국어 AI 대규모 언어모델(LLM) 경쟁이 가열되고 있다. 해외 정보기술(IT) 기업은 물론 국내 빅테크 업체와 스타트업도 앞다퉈 기술 고도화에 나서고 있다. AI 서비스에 필수인 AI 언어모델 수요가 급격히 늘고 있기 때문이다.

AI 스타트업 업스테이지는 고성능 한국어 AI 언어모델을 개발하기 위해 ‘1T 클럽’(1조 토큰 클럽)을 발족한다고 14일 밝혔다. 3000만~4000만 단어 이상의 한국어 데이터 확보에 기여할 수 있는 파트너사를 찾기 위해서다. 앞서 업스테이지가 개발한 AI 언어모델은 최근 글로벌 AI 플랫폼 허깅페이스의 LLM 성능 순위에서 평가점수 평균 72.3점을 받아 1위에 올랐다. 업스테이지는 ‘1T 클럽’을 구성해 자사 AI 언어모델의 한국어 실력을 높일 계획이다.

국내 IT 대기업도 한국어 AI 언어모델 개발에 역량을 집중하고 있다. 네이버는 기존 AI 언어모델 ‘하이퍼클로바’를 업그레이드한 ‘하이퍼클로바X’를 24일 공개한다. 50년 치 국내 뉴스와 9년 치 네이버 블로그의 한국 데이터를 학습해 자연스러운 한국어 표현이 가능한 것으로 알려졌다. 카카오도 자체 AI 언어모델 ‘코지피티(KoGPT)’의 한국어 기능을 개선한 모델을 연내 내놓을 계획이다. KT도 자체 AI 언어모델 ‘믿음’을 개발하고 있다.

최근 국내 기업들이 한국어 AI 언어모델 개발에 속도를 낸 것은 오픈AI의 AI 챗봇 ‘챗GPT’의 파급력 때문이다. 지난해 12월 출시된 챗GPT는 한국어 구사 능력도 뛰어나 이 시스템을 업무에 도입하는 국내 기업이 늘고 있다. 지난 3월 오픈AI가 공개한 최신 AI 언어모델 GPT-4의 한국어 실력은 챗GPT(GPT-3.5)의 영어 실력을 앞섰다는 평가다. 세계에서 AI 관련 투자를 가장 많이 하는 기업인 구글도 올 5월 AI 챗봇 ‘바드’에서 한국어 기능을 강조하는 등 한국 시장을 적극 노리고 있다.

국내외 기업의 한국어 LLM 개발 경쟁은 국내 AI 시장을 선점하기 위해서라는 분석이다. 최근 전 산업에서 AI 도입이 확산하고 있는데, 핵심 AI 기술 중 하나가 LLM이다. 챗봇, 이미지 생성 등 국내에서 잇따라 나오는 생성형 AI 서비스도 대부분 LLM이 필수다.

김주완 기자 kjwan@hankyung.com

클래식과 미술의 모든 것 '아르떼'에서 확인하세요
한국경제신문과 WSJ, 모바일한경으로 보세요

Copyright © 한국경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?