챗GPT, 한국어도 잘한다…네카오 ‘한국어 특화 AI’ 어쩌나
아직은 네이버 하이퍼클로바·카카오 코GPT의 한국어 구사 능력 우위
초거대 AI 결합 특화서비스 중요…국내 업체들 자체 생태계 확장 주력
오픈AI의 인공지능(AI) 챗봇인 챗GPT의 한국어 구사 실력이 부쩍 높아지면서 네이버나 카카오 등 국내 대표적 기업이 만드는 언어모델 AI의 설 자리가 좁아지는 형국이다. 한국어라는 특수성이 가장 확실한 차별점이었으나 이마저 흔들릴 위험이 있어서다. 챗GPT의 코드를 다른 기업과 공유하는 방식까지 확장되는 가운데 네이버·카카오 등의 AI 생태계 구축 경쟁이 치열해질 것으로 전망된다.
11일 정보기술(IT) 업계에 따르면, 오픈AI가 거대언어모델(LLM) GPT-3.5를 기반으로 한 챗GPT를 GPT-4 기반으로 향상시키면서 한국어 이해 능력이 크게 개선됐다. 오픈AI가 공개한 GPT-4의 ‘테크니컬 리포트’를 보면, 인문학·사회과학·수학 등 다양한 분야의 문제를 각국 언어로 번역한 뒤 GPT-4 기반의 챗GPT에 풀게 한 결과, 영어에서는 85.5%, 한국어에서는 77%의 정확도를 보였다. 이전 모델인 GPT-3.5 기반에선 영어 버전의 테스트에서 70.1%의 정확도를 보였던 것과 비교하면 언어 이해 능력이 상당히 높아진 것이다.
그간 AI 업계에서 ‘한국어’는 국내 AI를 보호하는 일종의 ‘장벽’으로 여겨졌다. 영어에 비해 한국어 데이터는 많지 않다 보니 오픈AI·구글·마이크로소프트(MS) 등 해외 AI 업체들이 한국어를 기반으로 한 AI 서비스를 쉽게 내놓지 못했다. 네이버와 카카오도 하이퍼클로바와 코GPT 등을 선보이면서 외국 AI보다 한국어 데이터를 더 많이 학습한 ‘한국어 특화 AI’라고 강조했다.
특히 네이버는 자체 보유한 한국어와 일본어 데이터를 이용해 한국·일본의 AI 시장을 선점하고 이후 중동·동남아 등 제3국 시장까지 노리겠다는 전략을 세웠다.
하지만 GPT-4를 기반으로 한 챗GPT는 일본어 버전의 테스트에서도 79.9%로 정확도가 높다고 평가됐다. 우르두어·네팔어·타이어·펀자브어·텔루구어 등 동남아·인도·파키스탄 지역 언어로 된 테스트에서도 60~70%의 정확도를 보였다. 특히 지난 10일 일본을 방문한 오픈AI의 샘 울트먼 최고경영자(CEO)가 “일본어 서비스를 강화하겠다”고 했다. 일본어 능력이 향상되면 이와 유사한 언어체계를 가진 한국어 능력도 올라갈 가능성이 크다.
다만 아직은 네이버 하이퍼클로바, 카카오 코GPT 등의 한국어 구사 실력이 더 낫다는 게 업계 중론이다.
하정우 네이버 AI랩 소장은 “챗GPT가 일본어나 한국어를 강화하기란 쉽지 않을 것”이라고 말했다. AI는 언어를 ‘토큰’ 단위로 이해하는데 모든 언어에 대해 토큰을 배분한다. 챗GPT는 영어에 가장 많은 토큰을 배분하는데 일본어나 한국어를 강화하기 위해 일본어·한국어의 토큰을 늘리면 그만큼 영어 능력이 줄어들 수밖에 없다는 주장이다.
결국은 초거대 AI를 활용한 특화서비스에 관심이 쏠린다. 이미 오픈AI는 챗GPT 기능을 MS 오피스 등에 탑재했고, 최근에는 익스피디아(여행정보 사이트), 스픽(언어교육 사이트), 오픈테이블(식당 예약 사이트) 등 11개 업체와 함께 ‘플러그인’ 서비스를 출시했다. 한지윤 업스테이지 팀리더는 “챗GPT를 하나의 플랫폼으로 발전시키는 전략”이라고 말했다.
국내 업체들도 자체 AI 생태계를 확장하는 데 주력할 것으로 전망된다. 네이버는 오는 7월 공개되는 하이퍼클로바X에 플러그인 서비스를 다수 제공하기로 했다. 카카오 역시 상반기 출시되는 코GPT-3.5에 유사한 기능을 추가할 것으로 알려졌다. 국내 초거대 AI를 운영하는 업체 관계자는 “챗GPT가 언젠가는 한국어를 능숙하게 구사할 것으로 전망되기 때문에 국내 업체들도 AI 특화서비스를 어떻게 만들지 상당히 고심하고 있다”고 전했다.
이재덕 기자 duk@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- 빗속에 모인 시민들···‘윤석열 퇴진·김건희 특검’ 촉구 대규모 집회
- 트럼프에 올라탄 머스크의 ‘우주 질주’…인류에게 약일까 독일까
- [스경X이슈] 민경훈, 오늘 ‘아형’ PD와 결혼...강호동·이수근 총출동
- 사라진 돌잔치 대신인가?…‘젠더리빌’ 파티 유행
- “나도 있다”…‘이재명 대 한동훈’ 구도 흔드는 경쟁자들
- 제주 제2공항 수천 필지 들여다보니…짙게 드리워진 투기의 그림자
- 말로는 탈북자 위한다며…‘북 가족 송금’은 수사해놓고 왜 나 몰라라
- 경기 안산 6층 상가 건물서 화재…모텔 투숙객 등 52명 구조
- [산업이지] 한국에서 이런 게임이? 지스타에서 읽은 트렌드
- [주간경향이 만난 초선] (10)“이재명 방탄? 민주당은 항상 민생이 최우선이었다”