이제 글은 통달했다…이미지 넘보는 챗GPT
오픈AI, 내달 ‘달리3’ 선봬
악용 방지 안전장치도 마련
“생성형 AI ‘허브’ 굳히기”
구글·카카오·LG도 ‘참전’
오픈AI의 챗GPT가 텍스트를 넘어 이미지도 생성할 수 있게 됐다. 구글도 이미지까지 만드는 ‘멀티모달’ 기능을 선보일 예정이어서 생성형 인공지능(AI)을 둘러싼 경쟁이 다양하고 복잡한 정보를 이해하는 단계로 발전하는 모습이다. 멀티모달은 텍스트·이미지·음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 기술이다.
오픈AI는 20일(현지시간) 프롬프트(명령어)로 이미지를 생성하는 ‘달리’의 세 번째 버전인 ‘달리3’를 다음달 공개한다고 밝혔다.
달리는 2021년 1월 처음 출시됐으며, 지난해 4월 달리2가 나왔다. 달리3는 사람처럼 묻고 답하는 챗GPT와 통합돼 달리2보다 이용자 요구를 더 잘 이해한다고 오픈AI는 설명했다. 지금까지 달리 이용자는 원하는 그림이 나올 때까지 장문으로 여러 번 묘사하며 계속 입력해야 했다. 이 과정에서 이용자가 입력한 프롬프트의 단어나 문구를 빠뜨리는 경우가 많았다. 하지만 앞으로는 챗GPT와 문답을 나누고 이를 토대로 챗GPT가 프롬프트를 작성해주면 달리3가 프롬프트에 따라 이미지를 생성한다. 이를 통해 사진 속 정보를 해석해 글을 쓰거나 매출 그래프를 보고 보고서를 만들 수 있게 될 것이라고 오픈AI는 소개했다.
달리3에는 선정적이거나 혐오스러운 이미지가 생성되는 것을 방지하기 위한 안전장치도 마련됐다. 이미지 생성형 AI가 고도화하면서 딥페이크를 이용한 가짜뉴스나 선거용 홍보물 등에 악용되고 있다는 비판에 대응하는 조치다.
오픈AI는 “외부 팀과 협력해 노골적이거나 폭력적인 메시지를 피하기 위해 언어모델에 특정 단어를 무시하도록 훈련시켰다”며 “프롬프트에 이름이 구체적으로 언급된 경우에도 공인의 이미지를 생성할 수 없도록 했다”고 밝혔다.
달리3는 다음달 유료 버전인 챗GPT 플러스와 기업용인 챗GPT 엔터프라이즈에 먼저 적용된다. 무료 버전 출시는 미정이다. 뉴욕타임스(NYT)는 “오픈AI가 챗GPT에 달리3를 결합함으로써 텍스트와 이미지를 아우르는 생성형 AI의 ‘허브’로서 자리를 굳히고 있다”고 평가했다.
달리3가 나오면서 비슷한 기능을 제공하는 ‘미드저니’ ‘스태빌리티 AI’와 같은 이미지 생성 AI 기업 간 경쟁도 치열해질 것으로 보인다. 구글도 차세대 거대언어모델(LLM)인 제미니를 통한 해당 서비스 출시를 위해 텍스트만으로 이용자가 원하는 이미지를 만들어내는 기술을 일부 기업을 상대로 테스트하고 있다. 국내에서는 카카오가 이미지를 생성하는 멀티모달 AI ‘칼로 2.0’을, LG가 이미지와 문장을 양방향으로 생성할 수 있는 ‘엑사원 아틀리에’를 내놓은 바 있다. 아틀리에는 디자이너 등 예술가들이 원하는 이미지를 검색·생성해주는 플랫폼 서비스다.
김은성 기자 kes@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- “나도 부정선거라 생각했었다”···현장 보고 신뢰 회복한 사람들
- 국힘 박상수 “나경원 뭐가 무서웠나···시위대 예의 있고 적대적이지도 않았다”
- 늙으면 왜, ‘참견쟁이’가 될까
- 공영방송 장악을 위한 이사장 해임 “모두 이유 없다”…권태선·남영진 해임무효 판결문 살펴
- 내란의 밤, 숨겨진 진실의 퍼즐 맞춰라
- ‘우리 동네 광장’을 지킨 딸들
- 대통령이 사과해야 되는 거 아니에요? 사과해요, 나한테
- 독일 크리스마스 마켓에 차량 돌진…70명 사상
- [설명할경향]검찰이 경찰을 압수수색?···국조본·특수단·공조본·특수본이 다 뭔데?
- 경찰, 경기 안산 점집서 ‘비상계엄 모의’ 혐의 노상원 수첩 확보