이제 글은 통달했다…이미지 넘보는 챗GPT
오픈AI, 내달 ‘달리3’ 선봬
악용 방지 안전장치도 마련
“생성형 AI ‘허브’ 굳히기”
구글·카카오·LG도 ‘참전’
오픈AI의 챗GPT가 텍스트를 넘어 이미지도 생성할 수 있게 됐다. 구글도 이미지까지 만드는 ‘멀티모달’ 기능을 선보일 예정이어서 생성형 인공지능(AI)을 둘러싼 경쟁이 다양하고 복잡한 정보를 이해하는 단계로 발전하는 모습이다. 멀티모달은 텍스트·이미지·음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 기술이다.
오픈AI는 20일(현지시간) 프롬프트(명령어)로 이미지를 생성하는 ‘달리’의 세 번째 버전인 ‘달리3’를 다음달 공개한다고 밝혔다.
달리는 2021년 1월 처음 출시됐으며, 지난해 4월 달리2가 나왔다. 달리3는 사람처럼 묻고 답하는 챗GPT와 통합돼 달리2보다 이용자 요구를 더 잘 이해한다고 오픈AI는 설명했다. 지금까지 달리 이용자는 원하는 그림이 나올 때까지 장문으로 여러 번 묘사하며 계속 입력해야 했다. 이 과정에서 이용자가 입력한 프롬프트의 단어나 문구를 빠뜨리는 경우가 많았다. 하지만 앞으로는 챗GPT와 문답을 나누고 이를 토대로 챗GPT가 프롬프트를 작성해주면 달리3가 프롬프트에 따라 이미지를 생성한다. 이를 통해 사진 속 정보를 해석해 글을 쓰거나 매출 그래프를 보고 보고서를 만들 수 있게 될 것이라고 오픈AI는 소개했다.
달리3에는 선정적이거나 혐오스러운 이미지가 생성되는 것을 방지하기 위한 안전장치도 마련됐다. 이미지 생성형 AI가 고도화하면서 딥페이크를 이용한 가짜뉴스나 선거용 홍보물 등에 악용되고 있다는 비판에 대응하는 조치다.
오픈AI는 “외부 팀과 협력해 노골적이거나 폭력적인 메시지를 피하기 위해 언어모델에 특정 단어를 무시하도록 훈련시켰다”며 “프롬프트에 이름이 구체적으로 언급된 경우에도 공인의 이미지를 생성할 수 없도록 했다”고 밝혔다.
달리3는 다음달 유료 버전인 챗GPT 플러스와 기업용인 챗GPT 엔터프라이즈에 먼저 적용된다. 무료 버전 출시는 미정이다. 뉴욕타임스(NYT)는 “오픈AI가 챗GPT에 달리3를 결합함으로써 텍스트와 이미지를 아우르는 생성형 AI의 ‘허브’로서 자리를 굳히고 있다”고 평가했다.
달리3가 나오면서 비슷한 기능을 제공하는 ‘미드저니’ ‘스태빌리티 AI’와 같은 이미지 생성 AI 기업 간 경쟁도 치열해질 것으로 보인다. 구글도 차세대 거대언어모델(LLM)인 제미니를 통한 해당 서비스 출시를 위해 텍스트만으로 이용자가 원하는 이미지를 만들어내는 기술을 일부 기업을 상대로 테스트하고 있다. 국내에서는 카카오가 이미지를 생성하는 멀티모달 AI ‘칼로 2.0’을, LG가 이미지와 문장을 양방향으로 생성할 수 있는 ‘엑사원 아틀리에’를 내놓은 바 있다. 아틀리에는 디자이너 등 예술가들이 원하는 이미지를 검색·생성해주는 플랫폼 서비스다.
김은성 기자 kes@kyunghyang.com
Copyright © 경향신문. 무단전재 및 재배포 금지.
- [속보]주유소 휘발유·경유 모두 2000원 넘는다···‘2차 석유 최고가격제’ 시행
- BTS 불러 놓고 “여기 북에서 온 사람 있어요?”…지미팰런쇼 사전 MC 인종차별 발언 논란
- [속보]‘여론조사 왜곡’ 유죄로 선거 못나가는 장예찬, 국힘 여의도연구원 부원장 사퇴
- ‘강등’ 정유미 검사장, 첫 변론서 정성호 장관 직격…“인사로 검사들 침묵시켜”
- [설명할경향]‘쓰봉’ 없이 쓰레기 못 버릴까?···‘종량제 사재기’ 안 해도 됩니다
- ‘어묵 1개 3000원?’ 진해군항제, 이런 바가지요금 한번만 걸려도 ‘즉시 퇴출’
- 법원 “신동호 EBS 사장 임명 처분 취소해야”···‘이진숙 2인 방통위’ 또 졌다
- 나프타 수출 못한다…정부, 정유사에 “나프타 생산” 명령도 가능
- 전북대에 80억 기부 완납한 ‘김정옥의 7년 약속’…“가진 것 사회에 돌려주라는 어머니의 뜻
- ‘서울 최대 성매매 집결지’ 미아리텍사스 70년 만에 완전 폐쇄···철거공정 90%, 연내 착공