오픈AI “달리3가 미드저니보다 우수…이유는 95대 5의 법칙”
사람 작성 캡션 5% 반영했더니...
아무 문장 입력해도 정확하게 해석
그림 위치 파악 못하고·글자 인식 한계
경쟁사 유료 모델 겨냥…. 경쟁사도 대항 전망
인공지능이 명령어를 얼마나 더 잘 이해하는지 보여주는 지표인 프롬프트 따르기(prompt following)에서 달리는 153.3점으로 미드저니 5.2(-104.8점)나 스테이블디퓨전XL(-189.5점)을 크게 앞질렀다. 또 텍스트를 입력하면 원하는 그림을 그려내는 스타일(Style)에서도 달리는 74.0점으로 미드저니 5.2(30.9점) 스테이블디퓨전XL(-95.7점)을 크게 눌렀다. 명령어에 따라 일관된 그림을 그리는 일관성(coherence)에서도 달리3는 71.0점으로 미드저니5.2(48.9점)이나 스테이블디퓨전XL(-84.2점)을 앞섰다. 오픈AI 연구진은 “이번 평가는 사람이 직접 테스트한 결과를 사람이 평가한 것”이라면서 “달리3는 그만큼 사람이 원하는 프롬프트를 잘 이해해 그림을 그리는 도구”라고 강조했다.
특히 오픈AI 연구진은 대규모 합성 데이터셋을 활용했다.이는 기존의 이미지 설명보다 더 다양하고 구체적인 정보를 담은 캡션을 인공적으로 생성하는 방법이다. 텍스트-이미지 모델은 이미지(i)와 그 이미지를 설명하는 텍스트(t)간 대량의 쌍(t, i)으로 구성된 데이터셋에서 훈련된다. 대규모 데이터셋에서 텍스트(t)는 일반적으로 이미지의 주제에 대한 간단한 설명에 중점을 둔다. 이 단계에선 배경 세부 사항이나 이미지에서 표현된 상식적인 설명은 생략된다. 오픈AI는 텍스트(t)에서는 일반적으로 생략되는 중요한 세부 사항에는 다음과 같은 것들이 포함된다고 설명했다. 주방 싱크대나 인도의 정지 표지판과 같은 객체의 존재와 그 객체들에 대한 설명, 장면에서 객체의 위치와 그 객체의 수, 장면에서 객체의 색상과 크기와 같은 상식 세부 사항 등이 제외된다. 예를 들어 바나나 사진을 보고 바나나인지만 아는 단계다.
이후 과정은 정교화다. 이미지의 주요 주제만을 설명하는 캡션의 작은 데이터셋을 구축해 훈련 한 뒤 이미지의 주요 주제를 설명하는 데 편향된 모델을 만드는데 주력한다. 이른바 짧은 합성 캡션이다. 하지만 과적합(Overfitting) 현상을 해결할 순 없었다. 과적합이란 모델이 학습 데이터에 너무 잘 맞춰져 있어서, 새로운 데이터나 테스트 데이터에는 잘 작동하지 않는 현상을 가리킨다. 빨간색 바나나처럼 현실에 없는 프롬프트를 입력하면 표현을 못하는 것이다. 또 캡션내의 구두점 위치나 캡션 길이 등 사람마다 쓰는 프롬프트가 다르다는 점도 제대로 된 그림을 그리는데 장애물이다.
이러한 조합으로 완성된 달리3는 아주 간단한 프롬프트에서도 기민하게 반응한다. 예를 들어 ‘요정 전사’라고 만 입력해도 챗GPT는 매우 다양한 프롬프트를 생성해 낸다. 대표적인 것이 “나뭇잎과 나무껍질로 만든 갑옷을 입은 사나운 요정 전사가 나뭇잎과 나무껍질로 만든 작은 검과 방패를 휘두른다. 그는 꽃이 만발한 정원 한가운데 바위 위에 용감하게 서 있다. 화려한 꽃과 우뚝 솟은 식물들로 둘러싸여 있으며 결연한 표정으로 정원의 왕국을 지킬 준비가 돼 있다”는 프롬프트다.
이번 논문은 챗GPT 플러스에 장착된 달리3가 이미지를 문장으로 만들고, 문장을 이미지로 생성하는데 있어 기존 모델 보다 우수하다는 것을 강조한 것이 특징이다. 때문에 감안해서 해석해야한다. 다만 경쟁 진영에서도 조만간 반격이 있을 것으로 보인다. 특히 오픈AI는 달리3를 챗GPT 유료 사용자에 무료로 제공하고 있기 때문에 미드저니 비즈니스 모델에 치명타를 가하고 있다는 평가다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “정말 사랑해, 200만원만”…이 말 믿은 중년 남성들, 뜯긴 돈이 무려 - 매일경제
- 녹차 모델 ‘새 얼굴’ 발탁에 난리난 일본…알고보니 “바로 너였구나” - 매일경제
- ‘나의 아저씨’의 추락…이선균 이르면 다음 주 경찰 소환 - 매일경제
- ‘강남 빌딩’ 손해보고 판 전혜진...‘마약 파문’ 이선균 때문? - 매일경제
- “쪼민, 다음은 깔롱비키니?”…전여옥 “이 모든 것, 심각한 사법농단” 저격 - 매일경제
- 백종원도 송은이도 “나 아니다” 버럭…유명 연예인 분노한 이유 - 매일경제
- “그래픽카드값 3배올라 천만원?”…채굴대란도 아닌데 난리난 중국 - 매일경제
- 네타냐후 "죽이느냐 죽느냐 문제"… 가자 '전면침공' 임박 - 매일경제
- 개 58마리 성대 가위로 잘라 ‘떼죽음’...처벌은 고작? - 매일경제
- ‘코리안 가이’ 황희찬의 질주는 계속된다…박치기 맞고도 결승골 AS, 울버햄튼은 역전승 - MK스