[사이언스프리즘] 인공지능 ‘한류’의 길을 찾아서

2024. 7. 24. 23:05
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

韓 AI 성공 열쇠 ‘데이터 우위’
기존 영어 기반으론 못 따라가
한류 따라 한국어 인기도 올라
문화의 힘 빌려 가능성 키워야

인공지능(AI)의 기세가 거세다. 구글, 마이크로소프트 등 거대 정보기술(IT) 기업들은 자신만의 AI를 만들어 능력을 뽐내고 있다. 인간처럼 대화하고 글을 쓰는 AI, 짧은 동영상을 만들어주는 AI 등 종류도 다양하다. AI 기술의 엄청난 파급력을 본 전 세계가 AI에 대한 투자를 늘리기 시작했다. 한국도 마찬가지이다. 이런 시기이니 AI 종사자라면 한 번쯤은 한국이 만든 AI가 전 세계를 휩쓰는, AI 한류를 꿈꿔볼 만하지 않은가? 문제는 어떻게 해야 AI 한류가 가능한가일 것이다.

한국 AI 성공의 열쇠는 데이터 우위를 찾는 것에서 출발해야 한다. 현재의 AI는 특정 분야의 대량 데이터 없이는 만들어질 수 없다. 그렇기에 후발주자는 선발주자가 찾기 힘든 분야의 학습 데이터를 찾아야 한다.
정인성 작가
AI 선발주자들이 잘하는 것의 대표적인 예가 바로 프로그래밍이다. 부가가치가 높고 대체 불가능한 일이라고 생각했는데, AI가 어느 정도 능력을 보여준 분야이기도 하다. 하지만 부가가치가 높다고 해서 한국이 프로그래밍에 특화된 AI를 만든다면 미국 AI들의 하위 호환 능력밖에 보여주지 못할 가능성이 높다. 미국이 프로그래머 사용자, 데이터, AI를 전부 갖추고 있기 때문이다. 고객 경험, 데이터, 완성된 AI 모두 없는 후발주자에게는 매우 힘든 싸움이다.

혹자는 이미 존재하는 인터넷상의 오픈 데이터셋을 활용하여 한국 AI에게 프로그래밍을 학습시키면 않느냐고 질문할 수 있지만, 그렇게 해서는 해외 AI 회사들 대비 우위를 가져가기 힘들다. 코먼 크롤(Common Crawl) 등 대부분의 오픈 데이터셋은 영어 기반이다. 영어로 된 데이터로 학습한 영어 기반 AI와 영어로 된 데이터를 한 번 한국어로 번역한 데이터로 학습된 한국어 기반 AI 중 무엇이 더 뛰어날지는 짐작할 수 있다. 이는 한국인들이 직접 영어권 웹사이트를 돌아다니며 프로그래밍 관련 데이터를 직접 수집해도 마찬가지이다. 미국인이 영어권 웹사이트를 돌아다니며 프로그래밍 관련 데이터를 수집하는 것보다 품질이 낮아지게 된다.

그렇다면 이제 어떻게 해야 상대 우위 분야를 찾을 수 있을지 고민해야 한다. 하지만 이는 AI 기술에만 투자해서는 해결되지 않는다. 해외의 수많은 사용자가 한국어로 적힌 정보에 귀를 기울이게 해야 가능하다. 예를 들어, 갑자기 해외 수많은 사람이 조선왕조실록과 승정원일기 등 한국 역사 기록물에 관심을 가지기 시작하면 어떻게 될까. 조선왕조실록 고품질 영역본이 인터넷에 존재할 리가 없다. 당연히 이미 조선왕조실록의 일부를 보고 학습한, 한국어 데이터로 학습한 AI가 더욱 대답을 잘할 것이다. 추가 학습을 위한 데이터 가공 역시 한국 역사 전문가가 가장 많은 한국이 유리하다.

결국 우리가 고민해야 하는 것은 한국어 인터넷 데이터의 가치를 높이는 방법이다. 흥미롭게도 우리는 이미 한국어의 가치를 높여본 기억이 있다. 바로 한류이다. 한국어 사용자는 전 세계의 1%도 되지 않지만, 한류가 유행하자 동유럽과 남미에도 한국어를 배우려는 사람들이 생겨났다. 한류 데이터는 한국어로 먼저 만들어진 뒤 타국어로 번역되기 때문에, 한국어 AI가 더욱 빠르고 정확하게 최신 정보를 얻을 수 있다. 이는 한류의 유행 자체가 한국어 AI에게 더 큰 가능성을 가져다줄 수 있다는 의미이다. 한국어 AI 시장의 수요를 키우고, 데이터의 우위를 제공하기 때문이다. 문화 한류와 AI 한류에는 예상치 못한 공통분모가 존재하는 것이다. 문화의 힘은 AI 분야의 힘도 강화해 줄 수 있다.

숲 속에 있으면 숲 전체의 모습이 보이지 않는다. 이는 기술도 마찬가지이다. AI 숲 속에서 직접 AI를 개선할 방법을 찾는 것도 좋지만, 가끔은 좀 더 높은 곳에서 AI 기술뿐만 아니라 데이터, 시장 수요, 규제 등 AI 산업을 둘러싼 환경 자체를 어떻게 개선할 수 있을지를 살펴보는 지혜도 필요하다.

정인성 작가

Copyright © 세계일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?