해외 AI "이미 한국어 77% 숙달"

황순민 기자(smhwang@mk.co.kr), 고민서 기자(esms46@mk.co.kr) 2023. 5. 14. 17:51
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

GPT-4 정확도 영어에 근접
韓 생태계 종속 우려 커져

생성형 인공지능(AI) 분야에서 마이크로소프트(MS), 구글, 메타 등 빅테크가 한국어를 지원하거나 언어 능력을 크게 개선한 진화형 언어모델(LLM)을 앞세워 한국 시장 공략을 본격화하고 있다. 비영어권으로 'AI 주도권' 경쟁이 확대되는 가운데 한국이 최전선으로 부상했다는 분석이다. 그만큼 한국 AI 산업 기반이 글로벌 빅테크에 종속될 수 있다는 우려가 커지고 있다.

14일 매일경제 취재를 종합하면 구글과 오픈AI의 최신형 언어모델인 팜2와 GPT-4는 성능 개선을 위해 필수적인 한국어 데이터를 학습시킨 것으로 확인됐다. 실제로 오픈AI의 최신 LLM인 GPT-4는 회사가 자체적으로 실시한 인문학, 사회과학, 수학 문제풀이에서 한국어 정확도가 77%로 영어(85.5%)에 버금가는 수준까지 올라왔다. 구글 '바드'는 언어모델 개발 소스에 한국어 음성과 비디오 데이터도 포함시킨 것으로 파악된다.

GPT-3.5를 기반으로 한 챗GPT가 처음 등장했을 때만 하더라도 국내 업계에서는 '한국어 특화' 국산 모델이 경쟁력이 있을 것이라는 분위기였다. 하지만 네이버·카카오 등이 하반기로 미룬 국내 서비스 출시 이전에 빅테크의 월등한 한국어 실력 서비스가 속속 공개되면서 업계에서는 위기감이 높아지고 있다.

[황순민 기자 / 고민서 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?