"쓰고 듣고 말하고 그린다"…생성 AI '킬러앱' 주인공은
카카오의 '칼로 2.0', 3초 만에 이미지 생성
네이버도 추후엔 검색·챗봇 등에 멀티모달 지원 예정
[서울=뉴시스] 오동현 기자 = "인공지능이 예술적인 영역에서 인간의 독창성을 높일 것이다." (샨타누 나라옌 어도비 CEO)
챗GPT의 뒤를 이을 킬러 서비스로 어도비(Adobe)가 주목 받고 있다. 포토샵·일러스트레이터·프리미어 등 다양한 콘텐츠 편집 툴로 전 세계에서 독보적인 입지를 구축한 어도비가 지난 3월 '파이어플라이(Firefly : 반딧불이)'라는 이름의 이미지 생성 AI를 공개했다.
이처럼 생성형 인공지능(AI)의 혁신이 텍스트를 넘어 이미지, 영상, 음성 등 다양한 종류의 데이터를 동시에 처리할 수 있는 '멀티모달'로 확장하고 있다. AI가 사람과 텍스트로 대화를 주고 받는 것에서 더 나아가 이미지와 영상을 이해하고 음성으로 대화하는 수준까지 기술이 고도화되고 있는 것이다.
5일 정보기술(IT) 업계에 따르면 최근 어도비를 비롯해 구글, 오픈AI 등 글로벌 테크 기업들의 '멀티모달' 기술 경쟁이 격화되고 있다. 국내 기업 중에선 네이버와 카카오 등 대기업부터 트웰브랩스 등 스타트업까지 멀티모달 경쟁에 참전 중이다.
'파이어플라이' 7개월 만에 30억 개 이미지 생성
네이버·카카오도 '멀티모달' 고도화 중
파이어플라이는 지난 3월 공개 이후 7개월 만에 30억 개의 이미지가 생성된 것으로 전해졌다. 특히 지난 9월 한 달 동안 생성된 이미지가 10억 개에 달하는 것으로 전해질 정도로 빠른 성장세를 보이고 있다.
파이어플라이는 프롬프트를 통해 입력한 텍스트를 기반으로 이미지 생성, 개체 추가, 색 다시 칠하기, 텍스트 스타일 편집, 이미지 확대 및 축소 등 다양한 기능을 제공한다. 생성된 콘텐츠를 45개 언어로 현지화 작업도 지원한다.
저작권 논쟁에서도 자유롭다. 파이어플라이는 어도비 스탁(Adobe Stock) 플랫폼에 있는 수백 만 개의 자체 이미지 데이터를 학습에 활용하고 있기 때문이다. 특히 사진, 일러스트레이레이션을 제공한 기여자에겐 보상을 지급하고 있다.
또 파이어플라이를 활용해 만들어진 이미지에 콘텐츠 자격증명(Credentials)을 부여한다. 이미지 생성 시간, 제작자, 제작 프로그램 등의 정보 제공을 통해 이미지 생성 AI 산업에서의 저작권 이슈에 적극 대응하고 있다.
이런 서비스 경쟁력을 바탕으로 어도비는 이달부터 북미·유럽 등 주요 국가 일반 고객의 크리에이티브 클라우드(Creative Cloud) 가격을 10% 인상한다고 밝혔다. 이는 2012년 클라우드 구독 모델을 발표한 이후 가장 큰 폭의 가격 인상이다.
이미 어도비는 구글이나 마이크로소프트 등 글로벌 빅테크 보다 빠르게 이미지 생성 AI로 수익화를 실현해나가고 있어서 주목된다. 어도비는 이미지 생성에 활용되는 크레딧(유료) 기반의 수익화 전략을 공개했고, 향후 AI 모델의 API(응용프로그래밍인터페이스)를 통해서도 수익화를 꾀한다.
어도비가 지난 9월 발표한 '기업용 Gen(젠)스튜디오'는 생성형 AI를 활용해 콘텐츠 아이디어 구상, 제작, 생산 및 활성화 속도를 높일 수 있는 엔드투엔드 솔루션으로 기업 시장을 공략한다. 젠스튜디오는 파이어플라이를 기반으로 기업이 상업적으로 안전하게 사용할 수 있는 콘텐츠를 생성할 수 있다. 또한 다양한 플랫폼에서 파이어플라이 API를 활용해 워크플로우와 자동화를 강화할 수 있다.
오픈AI와 구글도 단순 대화형 AI 챗봇을 넘어, 멀티모달 기능을 고도화하고 있다. 오픈AI는 텍스트 뿐만 아니라 이미지와 음성까지 지원하는 멀티모달 서비스 'GPT-4V'를 발표했다. 구글도 다음 달 공개 예정인 차세대 거대언어모델(LLM) '제미니'에서 멀티모달 기능에 중점을 두고 있는 것으로 알려졌다.
국내 대표 IT 기업인 네이버와 카카오도 다양한 생성형 AI 라인업을 멀티모달로 확장한다.
네이버는 LLM '하이퍼클로바X' 기반의 대화형 AI 서비스 '클로바X'와 차세대 검색 서비스 '큐:'의 기능을 고도화하고 있다. 최수연 네이버 대표는 "8월 공개된 생성형 AI 라인업은 계획대로 테스트를 통해 서비스 고도화 및 업데이트가 순조롭게 진행 중"이라고 밝혔다.
'클로바X'는 정보 추천, 전문 분야 관련 질문, 요약, 번역 뿐만 아니라 연내엔 외부 문서 참조, 이미지 편집과 외부 서비스 연동 등 신규 기능을 추가할 방침이다. '큐:'는 이달부터 PC 통합검색에 부분 적용되고, 내년엔 모바일로 확장된다. 또 멀티모달 기술을 지원하는 등 단계적으로 서비스를 확장할 계획이다.
카카오의 AI 기술 기업 카카오브레인은 이미지 생성 AI 개발과 헬스케어 분야 AI 적용에 박차를 가하고 있다. 지난 7월에는 사실감 넘치는 이미지를 3초 안에 그려내는 이미지 생성 AI '칼로(Karlo) 2.0'을 공개했다. 헬스케어 영역에서는 AI CAD 문서(영상) 판독 서비스를 출시해 국내 대형병원과 협력하고 있다.
국내 스타트업 중에서도 멀티모달 기술 경쟁력을 갖춘 곳이 있다. 글로벌 시장조사 기업 CB 인사이트가 선정한 '세계 100대 AI 기업' 및 '세계 50대 생성 AI 스타트업'에 트웰브랩스가 주인공이다. 트웰브랩스는 2021년 설립된 생성형 AI 기업이다. 멀티모달 신경망 기술을 활용해 영상 검색, 분류, 텍스트 생성 등 영상을 전문적으로 다룬다.
트웰브랩스 관계자는 "글로벌 빅테크 기업들이 현재까지 이미지 처리에 집중하고 있는 반면 트웰브랩스는 영상 검색, 분류 등 영상 이해 솔루션에 집중하며 차별화하고 있다"고 말했다.
☞공감언론 뉴시스 odong85@newsis.com
Copyright © 뉴시스. 무단전재 및 재배포 금지.
- 김혜경 벌금형 선고에…이재명 "아쉽다" 민주 "검찰 비뚤어진 잣대"
- '마약 투약 의혹' 김나정 누구? 아나운서 출신 미스맥심 우승자
- "김병만 전처, 사망보험 20개 들어…수익자도 본인과 입양딸" 뒤늦게 확인
- "패도 돼?"…여대 학생회에 댓글 단 주짓수 선수 결국 사과
- [단독]'김건희 친분' 명예훼손 소송 배우 이영애, 법원 화해 권고 거부
- "월급 갖다주며 평생 모은 4억, 주식으로 날린 아내…이혼해야 할까요"
- 배우 송재림, 오늘 발인…'해품달'·'우결' 남기고 영면
- 이시언 "박나래 만취해 상의 탈의…배꼽까지 보여"
- '살해, 시신 훼손·유기' 軍장교, 38세 양광준…머그샷 공개
- '성폭행범' 고영욱, 이상민 저격 "내 명의로 대출받고 연장 안돼서…"