"문장 입력하면 2초 만에 뚝딱"…ETRI, 이미지 생성 기술 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
국내 연구진이 문장을 입력하면 2초 만에 뚝딱 이미지를 만드는 기술을 개발했다.
이용주 ETRI 시각지능연구실장은 "향후 생성형 인공지능 기술의 다양한 시도를 통해 크기는 작지만 성능이 뛰어난 다양한 모델을 공개할 계획"이라며 "글로벌 연구를 통해 기존 거대모델에 대한 의존성을 탈피하고 국내 중소기업이 인공지능 기술을 효과적으로 활용할 기회를 제공할 예정"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(대전=뉴스1) 김태진 기자 = 국내 연구진이 문장을 입력하면 2초 만에 뚝딱 이미지를 만드는 기술을 개발했다.
이로써 초고속 생성형 시각지능 연구에 탄력이 붙을 전망이다.
한국전자통신연구원(ETRI)은 문장을 입력해 이미지를 만드는데 기존 대비 5배 빠른 ‘코알라(KOALA)' 3종 모델을 개발했다고 28일 밝혔다.
이와 함께 이미지나 영상을 불러와 질의응답을 할 수 있는 대화형 시각언어모델 ‘코라바(Ko-LLaVA)' 2종도 개발해 총 5종을 일반에 공개했다.
코알라 모델은 공개된 소프트웨어(SW) 모델의 2.56B(25억 개) 파라미터를 지식 증류 기법을 적용해 700M(7억 개)로 획기적으로 줄였다.
파라미터 수가 크면 연산량이 많아 시간이 오래 걸리고 서비스 운영 비용도 증가한다.
연구진은 모델 크기를 1/3로 축소했고, 고해상도 이미지를 기존 대비 2배, 달리(DALL-E) 3 대비 5배가량 빠르게 개선했다고 설명했다.
모델 생성 속도를 2초 내외로 만들고 모델의 크기도 대폭 줄여 최근 문장(텍스트)에서 이미지를 만드는 국내·외 경쟁 속에서 8GB의 저용량의 메모리를 갖는 저가의 그래픽처리장치(GPU)에서도 구동할 수 있다.
ETRI에서 자체 개발한 파라미터별 ‘코알라(KOALA)’ 3종 모델은 허깅페이스 환경에서 공개됐다.
허깅페이스는 머신러닝 기술, 특히 딥러닝 모델의 손쉬운 공유 및 배포, 사용, 훈련을 가능하게 하는 생태계다.
연구진은 챗GPT와 같은 대화형 인공지능에 시각지능 기술을 더해 이미지나 비디오를 불러와 한국어로 이미지나 비디오에 관하여 질의응답할 수 있는 대화형 시각언어모델인 ‘코라바(Ko-LLaVA)’ 모델도 함께 공개했다.
이용주 ETRI 시각지능연구실장은 “향후 생성형 인공지능 기술의 다양한 시도를 통해 크기는 작지만 성능이 뛰어난 다양한 모델을 공개할 계획"이라며 "글로벌 연구를 통해 기존 거대모델에 대한 의존성을 탈피하고 국내 중소기업이 인공지능 기술을 효과적으로 활용할 기회를 제공할 예정"이라고 말했다.
memory4444444@news1.kr
Copyright © 뉴스1. All rights reserved. 무단 전재 및 재배포, AI학습 이용 금지.
- "전처, 김병만 명의로 사망보험 20개 가입…수익자도 그녀와 양녀 딸" 충격
- 괌 원정출산 산모, 20시간 방치 홀로 사망…알선업체 "개인 질병, 우린 책임 없다"
- 격투기 선수 폰에 '미성년자 성착취 영상' 수십개…경찰, 알고도 수사 안했다
- 토니안 "상상초월 돈 번 뒤 우울증…베란다 밑 보며 멋있게 죽는 방법 생각"
- 절도·폭행에 세탁실 소변 테러…곳곳 누비며 공포감 '고시원 무법자'
- 김태희, ♥비·두 딸과 성당서 포착…"꿈꾸던 화목한 가정 이뤄"
- 14만 유튜버 "군인들 밥값 대신 결제" 말하자…사장님이 내린 결정 '흐뭇'
- 박나래 "만취해 상의탈의…이시언이 이단옆차기 날려 막아"
- 최현욱, SNS '전라 노출' 사진 게시 사고…'빛삭'에도 구설
- 12억 핑크 롤스로이스에 트럭 '쾅'…범퍼 나갔는데 "그냥 가세요" 왜?