민관 손잡고 '초거대 AI' 띄운다

나현준 입력 2021. 9. 7. 17:57 수정 2021. 9. 7. 23:21
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

삼성·네이버·카카오·통신사
인공지능 최고위 전략대화

인간처럼 사고하고 판단하는 '초거대 인공지능(AI)' 생태계를 정부와 국내 주요 대기업들이 공동으로 조성하기로 했다. 민관 상시 협력 체계를 구축하는 것이다. 초거대 AI는 빅데이터와 수천억 개의 매개 변수를 조합한 것으로, 규모가 커질수록 판단의 정확도도 크게 높아진다. 2016년 바둑기사 이세돌을 이긴 알파고가 바둑 분야에 한해서만 AI를 적용한 사례라면, 초거대 AI는 자연어 처리 기반이어서 사람의 일상생활 언어 모두를 다룰 수 있다.

7일 과학기술정보통신부는 '제1회 인공지능 최고위 전략대화'를 서울 코엑스에서 개최했다. 이날 행사에 박정호 SK텔레콤 대표, 구현모 KT 대표, 황현식 LG유플러스 대표, 여민수 카카오 대표, 한성숙 네이버 대표, 다니엘 리 삼성전자 글로벌 AI센터장 등 국내 굵직한 대기업의 대표들이 한자리에 모였다.

임혜숙 과학기술정보통신부 장관은 "우리나라 인공지능의 글로벌 경쟁력을 높이기 위해 민관이 함께 인공지능 투자 전략을 공유하고, 최신 인공지능 기술인 초거대 인공지능 생태계 활성화를 위한 협력 방향을 논의했다"고 밝혔다.

대기업 초거대 AI모델, 中企·벤처에 개방

삼성·네이버·카카오·통신사
인공지능 최고위 전략대화

데이터·매개변수·컴퓨팅역량
美·中 따라잡을 시스템 마련

과기부, 기술·인재육성 지원
카카오, 클라우드 인프라 구축
네이버·LG·KT AI모델 오픈

과학기술정보통신부와 국내 대표 기업, 학계가 모인 첫 번째 `인공지능 최고위 전략대화`가 7일 서울 오크우드프리미어호텔에서 개최됐다. 송경희 과기정통부 국장, 황현식 LG유플러스 사장, 한성숙 네이버 대표, 윤성로 4차산업혁명위원회 위원장, 여민수 카카오 대표, 다니엘 리 삼성전자 글로벌 AI센터장(왼쪽부터)이 임혜숙 과기정통부 장관의 인사말을 듣고 있다. [이충우 기자]
'1조6000억개 vs 6000억개'.

전자는 미국과 중국이 현재 연구 단계에서 확보했다고 발표한 초거대 인공지능(AI) 매개변수다. 후자는 국내 대기업이 제시한 매개변수 최대 목표치다. 매개변수란 값을 입력하고 원하는 결과를 도출하기 위해 AI가 찾아내야 하는 변수를 말한다. 매개변수가 많을수록 더 정확도를 높일 수 있다.

매개변수에서만 뒤처진 것이 아니다. 인간처럼 사고하는 초거대 AI를 만들기 위해선 빅데이터(재료)와 매개변수(중간 판단능력), 그리고 이를 뒷받침할 수 있는 컴퓨터 능력(인프라스트럭처) 세 가지 요소가 필요한데 우리는 모두 뒤처져 있다. 미국과 중국 거대 포털에 잠식당하지 않고 국내 포털을 만들며 키워온 'K-IT 생태계'를 보존하고 발전시키기 위해선 미래 정보기술(IT) 핵심 분야인 초거대 AI 분야에 대응할 필요가 있다.

인간처럼 사고하고 판단하는 '초거대 AI' 생태계를 정부와 국내 주요 대기업들이 공동으로 조성하기로 했다. 과학기술정보통신부는 7일 국내 유수 대기업 대표들을 한자리에 모아 '제1차 인공지능 최고위 전략대화'를 개최했다. 앞으로 과기정통부는 반기에 1회씩 국내 대기업들을 모아 초거대 AI 발전 방안을 논의할 예정이다.

1차 전략대화의 핵심은 '한국어 기반 초거대 AI 모델 개방'이다. AI는 빅데이터와 매개변수(초거대 AI 모델), 그리고 슈퍼컴퓨터가 필요하다. 빅데이터는 이미 디지털 뉴딜의 일환인 데이터댐 프로젝트(내년 예산 1조807억원)를 통해 한국어 기반 데이터를 한곳에 모으고 있다. 슈퍼컴퓨터는 국내 기술로는 바로 확보할 여력이 안 되지만, 카카오가 클라우드 기반의 하이퍼스케일 데이터센터를 서버 12만대로 2023년까지 구축하면서 인프라 구축에 나선 상황이다.

재료(데이터댐)와 인프라(데이터센터)가 구축되고 있는 만큼 이를 활용하기 위한 한국어 기반 초거대 AI 모델도 필요하다. 지난 5월 네이버가 2040억개 매개변수 규모의 AI 언어 모델 하이퍼클로바를 상용화한 것이 대표적인 예다. LG 역시 하반기 6000억개 매개변수 규모의 텍스트·이미지 학습 AI 모델을 선보일 예정이다. KT는 내년 상반기까지 2000억개 이상 매개변수 규모의 초거대 AI를 AI 음성인식 단말기인 기가지니3에 적용한다.

이번 1차 전략회의에선 초거대 AI 생태계 조성을 위해 국내 대기업 초거대 AI 모델을 중소기업·스타트업에 개방하기로 했다. 마이크로소프트와 독점 계약하며 무료 또는 유료로 대중에게 개방되고 있는 미국 오픈AI사의 GPT-3(매개변수 1750억개)를 벤치마킹한 것이다. 홍사찬 과기정통부 인터넷진흥과장은 "내년부터 중소기업·스타트업이 국내 대기업의 초거대 AI를 활용할 수 있도록 컴퓨팅 자원을 지원해줄 예정"이라며 "초거대 AI가 활용된 새로운 서비스의 조기 실증 기회를 제공하기 위해 공공 분야도 적용하도록 할 것"이라고 밝혔다.

AI 기술 개발과 AI 인재 육성에도 나선다. 2026년까지 총 3018억원을 들여 '차세대 인공지능 핵심원천기술개발'을 진행하고 지난 7월 선정된 인공지능 혁신허브를 기점으로 산학연 연구를 수행할 예정이다.

[나현준 기자]

[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]

ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지

이 기사에 대해 어떻게 생각하시나요?