서울공대 도재영 교수팀, 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’ 개발
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
서울대 공대 전기정보공학부 도재영 교수 연구팀(AIDAS 연구실)은 글자, 사진, 영상, 소리를 하나의 모델이 동시에 이해하고 생성할 수 있는 차세대 인공지능(AI) 파운데이션 모델 'Dynin-Omni'를 개발했다고 밝혔다.
연구진은 AI 모델이 다양한 감각 정보를 동시에 처리할 수 있는 구조를 설계해, 정보를 순차적으로 생성하는 기존 방식의 문제점을 해결했다고 설명했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

연구진은 AI 모델이 다양한 감각 정보를 동시에 처리할 수 있는 구조를 설계해, 정보를 순차적으로 생성하는 기존 방식의 문제점을 해결했다고 설명했다. 글자부터 영상까지 다양한 정보를 단일 모델이 함께 처리하는 옴니모달(Omnimodal) AI를 구현했다는 설명이다.
최근 AI는 텍스트뿐 아니라 이미지, 음성, 영상 등 다양한 형태의 데이터를 처리하는 방향으로 발전하고 있다. 다만 실제 환경에서 사람과 자연스럽게 상호작용하기 위해서는 단순 정보 인식을 넘어 복합적인 처리 능력이 요구된다. 예를 들어 음성을 인식해 이미지를 생성하거나, 영상을 분석해 음성으로 설명하는 기능은 여러 감각 정보를 동시에 활용하는 통합적 처리 구조가 필요하다.
기존 AI 시스템은 정보 이해와 생성 기능을 분리하거나 여러 모델을 결합해 사용하는 방식이 일반적이었으며, 이로 인해 다양한 형태의 정보를 유기적으로 처리하는 데 한계가 있었다. 특히 하나의 모델이 다양한 감각 정보를 동시에 처리하고 결과를 생성하는 통합 구조는 구현 난도가 높은 과제로 꼽혀왔다.
연구팀은 이러한 한계를 보완하기 위해 하나의 모델이 정보를 통합적으로 처리하는 구조를 설계하고, 이를 기반으로 차세대 통합 AI 파운데이션 모델 ‘Dynin-Omni’를 개발했다고 밝혔다. 해당 모델은 텍스트, 이미지, 영상, 음성 데이터를 함께 처리하며, 정보 이해와 생성 과정을 하나의 모델 내에서 수행하는 구조를 갖는다.
Dynin-Omni의 특징으로는 먼저 다양한 형태의 정보를 하나의 기준으로 통합 처리하는 구조를 적용한 점이 꼽힌다. 기존 AI가 이미지나 음성 정보를 텍스트 중심으로 변환해 처리했다면, 해당 모델은 여러 유형의 데이터를 동일한 방식으로 처리하도록 설계됐다.
또한 결과물 전체를 한 번에 생성한 뒤 정교화하는 디퓨전(diffusion) 방식을 적용해 처리 효율을 높이고자 했다. 이는 기존처럼 단어를 순차적으로 생성하는 방식과 비교해 대용량 데이터 처리에 적합한 구조로 설명된다.
아울러 정보 이해와 생성 기능을 하나의 모델로 통합해, 여러 모델을 결합해 사용하는 기존 방식과는 다른 구조를 제시했다. 이를 통해 다양한 감각 정보를 연계해 처리하는 방식 구현을 시도했다는 설명이다.
연구팀에 따르면 Dynin-Omni는 총 19개 글로벌 AI 성능 평가(벤치마크)에서 정보 추론, 영상 이해, 이미지 생성 및 편집, 음성 처리 등 다양한 영역에서 기존 통합 모델 대비 개선된 결과를 보였다. 또한 기존 통합 AI 모델 대비 생성 속도 측면에서도 향상이 관찰됐다고 밝혔다.
최용석 기자 duck8@donga.com
Copyright © 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
- “헛소리” “어처구니없다” 반대에도…트럼프, 네타냐후에 넘어갔다
- 안규백 “GOP 병력, 2만2000명에서 6000명으로 감축”
- 내달 미중 정상회담 앞두고…中 왕이 외교부장 내일 방북
- 마크롱 사진사 ‘金여사 한복’에 꽂혔다…비하인드컷 6장중 4장 차지
- IQ 204 백강현 “옥스퍼드 낙방뒤 게임 개발 전념…새로운 꿈 도전”
- 北 나무심기 행사서 고위간부 ‘명품 패딩’…애국 메시지와 괴리
- “사진 찍겠다” 벚나무 올라갔다가…뿌리째 뽑아버린 여성
- 李, ‘대통령 사진 활용 자제 靑요청’ 보도 제보자 색출 지시
- 실종 미군 어떻게 찾았나…수십 km 밖 ‘심장 소리’ 듣는 CIA 극비기술
- ‘캐리어 시신’ 장모 살해 사위는 26세 조재복…경찰 신상공개