문장 입력하면 2초 만에 이미지 '쑥'...세계 최고 속도

김진두 2024. 2. 4. 04:28
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[앵커]

문장을 입력하면 2초 만에 그 문장에 적합한 이미지를 만들어내는 생성형 AI가 개발됐습니다.

세계에서 개발된 생성형 인공지능 가운데 속도가 가장 빠른 것입니다.

김진두 기자가 보도합니다.

[기자]

연구자가 입력창에 문장을 넣습니다.

"달 아래 화성에서 책을 읽고 있는 우주비행사의 사진"

이라는 문장이 입력되고 2초 뒤

국내 연구진이 개발한 '코알라 700M'이 가장 먼저 이미지를 만들어냅니다.

이어 카카오브레인에서 만든 '칼로'가 3.6초, 미국의 openAI에서 개발한 달리 2와 '달리 3'는 10초 넘게 걸렸습니다.

개발된 문장을 이미지로 바꾸는 생성형 AI 가운데 세계에서 가장 빠른 것입니다.

이렇게 빠른 속도를 구현할 수 있는 것은 작은 크기로도 대형모델처럼 움직일 수 있도록 한 '지식 증류' 기술을 개발했기 때문입니다.

[한영택 / ETRI 광통신부품연구실 : (기존 기술들은) 좋은 퀄리티의 이미지를 생성할 수 있지만 느리다는 문제를 갖고 있습니다. 그러나 코알라는 초거대 신경망 모델을 경량화함으로써 이미지를 더 빠르게 생성할 수 있는 기술을 개발하게 되었습니다.]

연구진은 또 대화형 인공지능에 시각지능 기술을 접목한 새로운 모델도 개발했습니다.

이미지나 비디오를 대상으로 인공지능과 인간이 서로 묻고 답할 수 있는 '코라바(Ko-LLaVA)'입니다.

[한원석 / ETRI 광통신부품연구실장 : 계속 연구를 진행해서 기존의 텍스트에서 이미지를 생성하는 기술 이외에 최근에 각광 받고 있는 비디오 생성 쪽에도 연구를 집중할 계획입니다.]

연구진인 이미지 생성에서 효용성을 입증한 '지식 증류' 기술을 다른 영역으로 확대해 세계를 선도하는 인공지능을 개발해 나갈 계획입니다.

YTN 김진두입니다.

영상편집 : 양영운

그래픽 : 지경윤

YTN 김진두 (jdkim@ytn.co.kr)

※ '당신의 제보가 뉴스가 됩니다'

[카카오톡] YTN 검색해 채널 추가

[전화] 02-398-8585

[메일] social@ytn.co.kr

[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]

Copyright © YTN. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?