AI 연구분야 입체적 생태계 구축… ‘한국형 챗GPT’ 연내 공개[위기극복, R&D로 돌파구 찾는다]

장병철 기자 2023. 4. 20. 09:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

■ 위기극복, R&D로 돌파구 찾는다 - (15) 카카오
지난해 R&D 투자액 1조 돌파
제1데이터센터 등 시설 투자도
연구의 중심축 ‘카카오브레인’
AI 시인 ‘시아’등 속속 선보여
첫 시집 ‘시를 쓰는 이유’출간
최근 헬스케어 분야로 영역확대
카카오가 올해 말 준공을 목표로 경기 안산 한양대 캠퍼스혁신파크 내에 조성 중인 데이터센터 조감도. 카카오 제공

카카오가 미래 핵심 성장 동력으로 낙점한 인공지능(AI) 분야에서 기술 경쟁력을 확보하기 위해 연구·개발(R&D) 투자를 한층 강화하고 있다. 카카오는 과감한 R&D 투자를 토대로 올해 안에 대화형 AI 모델인 한국형 챗GPT를 발표할 계획이다.

◇연간 R&D 투자 규모 1조 원 돌파 = 20일 카카오에 따르면 지난 2021년 7645억 원 수준이었던 R&D 투자 금액은 지난해 1조213억 원으로 증가하며 1조 원대를 돌파했다. 카카오는 대규모 투자를 기반으로 미래 정보기술(IT) 데이터 수요 증가에 대응하는 한편, AI와 빅데이터 등 핵심 기술 확보에 주력하고 있다. 회사 관계자는 “시설에도 적극적인 투자를 하고 있다”며 “카카오 서비스 확대에 따른 서버 등 기계장치 투자뿐 아니라 2021년 말부터 진행된 제1데이터센터의 착공에 따라 건설 중인 자산의 투자 금액 역시 크게 증가하고 있다”고 설명했다.

◇공동체를 통한 AI 연구 생태계 구축 = 카카오는 특히 최근 여러 공동체를 통한 AI 연구에 박차를 가하고 있다. 대표적으로 지난 2017년 설립된 글로벌 AI 기술 R&D 기업인 카카오브레인은 ‘오픈 커뮤니티’를 지향하며 AI 선행 연구부터 프로덕트까지 모든 스토리를 공개해 공유하고 있다.

카카오브레인은 실제 타사 대비 적은 수의 인력으로 운영되는 회사임에도 불구하고 세계적인 학회가 인정하는 논문을 꾸준히 발표하고 있다. 자사가 개발한 모델을 비롯한 데이터 세트도 지속해서 공개하고 있다.

이 같은 공동체 연구를 바탕으로 카카오브레인은 △초거대 AI 스튜디오 △생성 모델 스튜디오 △헬스케어 AI 스튜디오 등 총 3개 사업에 주력하고 있다. 김일두 카카오브레인 대표는 “카카오브레인은 다양한 물음과 생각들이 모여 생각과 영역의 노하우를 충돌시켜가며, 새로운 가능성과 변증적 가치를 만들어가는 AI 전문회사”라며 “선도적인 AI 기술과 고부가 가치 서비스를 통해 누구나 다양한 혜택을 누리고, AI가 모두의 일상에 자연스럽게 스며들어 마치 공기처럼 당연해지는 세상을 만들고자 한다”고 말했다.

카카오브레인이 개발한 인공지능(AI) 기반의 이미지 생성 및 공유 플랫폼 ‘비 디스커버(B^ DISCOVER)’의 AI 프로필 기능을 활용해 그린 이미지. 카카오 제공

◇연내 한국형 챗GPT 공개 = 카카오브레인은 최근 60억 개의 파라미터(매개변수)를 가진 한국어 특화 AI 모델인 ‘KoGPT’를 다양한 서비스에 속속 접목하며 기술력을 빠르게 확보하고 있다. 예컨대 지난해에는 ‘KoGPT’를 기반으로 미디어아트 그룹 슬릿스코프와 협업해 AI 시인인 ‘시아’를 선보였다. ‘시아’는 인터넷 백과사전과 뉴스 등을 읽으며 한국어를 공부했으며, 1만3000여 편의 시를 읽고 작법을 학습해 스스로 시를 창작할 수 있다고 회사 측은 설명했다.

시아는 지난해 8월에는 첫 번째 시집인 ‘시를 쓰는 이유(총 53편)’를 출간했다. 카카오브레인은 더 나아가 상반기 내에 한층 발전된 버전의 ‘KoGPT’를 공개하며, 연내 대화형 AI 모델인 한국형 챗GPT를 발표할 계획이다.

지난해 6월에는 초거대 AI 이미지 생성 모델인 ‘칼로(Karlo)’도 선보였다. ‘칼로’는 텍스트와 이미지 데이터를 학습, 이해한 문맥을 바탕으로 다양한 화풍과 스타일로 이미지를 생성할 수 있는 것이 특징이다. 카카오브레인은 ‘칼로’ 공개에 이어 최근 약 7억4000만 개의 이미지·텍스트로 이루어진 데이터 세트 ‘코요(Coyo)’도 추가로 공개했다.

카카오브레인 관계자는 “‘코요’는 카카오브레인이 독자적으로 개발한 기술로 이미지·텍스트를 온라인에서 자동 수집함으로써 투입되는 비용과 시간을 효과적으로 줄이고, 동시에 양질의 데이터를 선별해 높은 성능을 구현했다”고 말했다.

◇헬스케어 분야로 영역 확대 = 카카오브레인은 현재 AI 문서(영상) 판독 서비스를 개발하고 있다. 여러 대학 병원과 의료영상 분야에서의 초거대 AI 모델 연구를 위한 공동 연구 계약을 체결했다. 카카오브레인은 고객 중심 R&D에 초점을 맞춰 나가며 올해 상반기 중 흉부 엑스레이(CXR) 의료영상의 초안 판독문을 생성하는 연구용 데모를 공개할 예정이다. 또한, AI 신약 개발과 관련해 AI 신약 개발사 ‘갤럭스’에 투자하고, ‘AI 기반의 항체 신약 설계 플랫폼’ 구축을 위한 공동 연구도 진행하고 있다.

/제작후원/
삼성전자, 현대자동차그룹, SK, 롯데, 포스코, 한화, 신세계, KT, CJ, 카카오, 네이버

장병철 기자 jjangbeng@munhwa.com

Copyright © 문화일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?