문장 입력하면 2초 만에 이미지 뚝딱…ETRI 기술 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
문장을 입력하면 2초 안에 이미지를 생성하는 '코알라'(KOALA) 모델이 일반에 공개됐다.
한국전자통신연구원(ETRI)은 생성형 인공지능과 시각지능 기술을 결합해 문장 입력 시 2초 만에 이미지를 만드는 코알라 3종 모델을 공개했다고 26일 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
문장을 입력하면 2초 안에 이미지를 생성하는 '코알라'(KOALA) 모델이 일반에 공개됐다.
한국전자통신연구원(ETRI)은 생성형 인공지능과 시각지능 기술을 결합해 문장 입력 시 2초 만에 이미지를 만드는 코알라 3종 모델을 공개했다고 26일 밝혔다.
연구진은 공개SW 모델의 의 2.56B(25억 개) 파라미터를 700M(7억 개)로 줄이는 데 집중했다. 파라미터 수가 크면 연산량이 많아 시간이 오래 걸리고 서비스 운영 비용도 증가한다. 연구진은 이 같은 방법을 통해 모델 크기를 3분의 1로 축소하고, 고해상도 이미지를 기존 대비 2배로 개선했다.
실제 연구진이 '달 아래 화성에서 책을 읽고 있는 우주비행사의 사진'이라는 문장을 입력하자, 코알라 700M(7억 개)는 1.6초 만에 이미지를 뚝딱 만들어 냈다.
연구진은 챗GPT와 같은 대화형 인공지능에 시각지능 기술을 더해, 이미지나 비디오를 불러와 한국어로 질의응답할 수 있는 대화형 시각언어모델 '코라바'(Ko-LLaVA)'도 함께 공개했다. 연구진은 이 모델을 기반으로 한글을 더욱 잘 이해할 수 있고 기존에 없는 비디오 해석을 할 수 있도록 했다.
이용주 ETRI 시각지능연구실장은 "향후 생성형 인공지능 기술의 다양한 시도를 통해 크기는 작지만, 성능이 뛰어난 다양한 모델을 공개할 계획"이라며 "기존 거대모델에 대한 의존성을 탈피하고 국내 중소기업이 인공지능 기술을 효과적으로 활용할 기회를 제공하겠다"고 말했다.
Copyright © 대전일보. 무단전재 및 재배포 금지.
- 세종 싱싱장터 '4호 소담점' 내년 초 개장…집현동에 '수산물유통센터' 건립 검토 - 대전일보
- "전기차 화재 또"… 아산 모종동 아파트 지하주차장서 화재 - 대전일보
- 대전 아파트 공사장 근로자 1명 토사 매몰…사망한 채 발견 - 대전일보
- 이재명 "법정 향하는 아내, 죽을만큼 미안… 희생제물 됐다" - 대전일보
- 국·영·수 모두 쉬웠다… 과목별 한두 문항서 판가름날 듯 - 대전일보
- 이재명, 김혜경 1심 유죄에 항소 예고…與 "심판 못 피해" - 대전일보
- 오늘 '금융시장·은행' 1시간 늦게 개장…지연 이유는 - 대전일보
- 아산 음식점 화재 벌써 지난해 2배…"대형화재 우려 후드·덕트 각별 주의" - 대전일보
- 충북 영동 농로서 50대 남녀 숨진 채 발견… 여성 복부 자상 발견 - 대전일보
- 與, '김여사 특검법' 본회의 표결 불참 결정 - 대전일보