알리바바, AI 이미지 생성 모델 공개…"중요 이정표"

오동현 기자 2023. 7. 11. 15:36
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

알리바바그룹의 알리바바 클라우드가 '세계 인공지능 컨퍼런스 2023'에서 인공지능(AI) 이미지 생성 모델인 '통이 완샹(Tonyi Wanxiang)'을 공개했다고 11일 밝혔다.

징런 저우 알리바바 클라우드 인텔리전스 CTO(최고기술책임자)는 "알리바바 클라우드는 기업과 커뮤니티가 더 큰 창의성과 생산성을 발휘할 수 있게 돕는 패러다임 전환 기술을 모색하고 있다"며 "통이 완샹은 고급 생성형 AI 모델을 추구하는 알리바바 클라우드의 또 다른 중요 이정표"라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

현재 중국 내 기업 고객 대상으로 베타 테스트 진행
AI 작업 지원하는 '모델스코프GPT'도 공개
알리바바 클라우드의 인공지능 이미지 생성 모델에 명령어 '해질녘의 도시 풍경, 현대적 건축물과 애니메이션 미학이 어우러진 세계'를 입력해 생성한 이미지. (사진=알리바바 클라우드 제공) *재판매 및 DB 금지


[서울=뉴시스] 오동현 기자 = 알리바바그룹의 알리바바 클라우드가 '세계 인공지능 컨퍼런스 2023'에서 인공지능(AI) 이미지 생성 모델인 '통이 완샹(Tonyi Wanxiang)'을 공개했다고 11일 밝혔다.

'완샹'은 '수만 개의 이미지'라는 뜻을 지닌 중국어로, 통이 완샹은 현재 중국 내 기업 고객을 대상으로 베타 테스트가 진행 중이다.

징런 저우 알리바바 클라우드 인텔리전스 CTO(최고기술책임자)는 "알리바바 클라우드는 기업과 커뮤니티가 더 큰 창의성과 생산성을 발휘할 수 있게 돕는 패러다임 전환 기술을 모색하고 있다"며 "통이 완샹은 고급 생성형 AI 모델을 추구하는 알리바바 클라우드의 또 다른 중요 이정표"라고 밝혔다.

이어 "통이 완샹은 고품질 생성 AI 이미지에 대한 접근성을 높이고 전자상거래, 게임, 디자인, 광고 등 다양한 분야에서 혁신적 AI 아트와 창의적 표현의 개발을 가능하게 할 것"이라고 덧붙였다.

통이 완샹은 중국어나 영어 텍스트 프롬프트(명령)를 입력받아 수채화, 유화, 중국화, 애니메이션, 스케치, 평면 일러스트레이션, 3D 만화까지 다양한 스타일의 이미지를 생성할 수 있다. 또한 어떤 이미지든 유사한 스타일의 새로운 이미지로 변환하거나, 스타일 전송 기능을 통해 원본 이미지의 내용을 유지하면서 다른 그림의 시각적 스타일을 입힐 수 있다.

통이 완샹은 알리바바 클라우드가 보유한 지식 구조화, 시각 AI, 자연어 처리(NLP) 분야 기술을 기반으로 다국어 자료를 활용해 학습을 강화한다. 이 때문에 뛰어난 의미 이해력을 자랑하며, 정확하고 맥락에 맞는 이미지를 생성할 수 있다.

뿐만 아니라 신호 대 잡음 비(signal-to-noise ratio)를 기반으로 고해상도 확산 프로세스를 최적화해 구도의 정확도와 세부 선명도 간의 균형을 맞추는 동시에 깔끔한 배경을 지닌 고대비의 이미지를 생성할 수 있다.

통이 완샹은 이미지 합성 품질과 창의성은 유지하면서 공간 레이아웃과 팔레트 등 최종 이미지 출력을 더욱 효과적으로 제어할 수 있는 알리바바 클라우드의 독자적 대규모 모델인 ‘컴포저(Composer)’를 이용해 개발됐다.

또한 알리바바 클라우드는 '모델스코프(ModelScope)'의 다양한 AI 모델을 활용해 언어, 시각, 음성 영역에서 복잡하고 전문적인 AI 작업을 수행할 수 있도록 지원하는 다목적 프레임워크 ‘모델스코프GPT’도 발표했다. 알리바바 클라우드가 지난해 발표한 오픈소스 MaaS(서비스형 모델) 플랫폼인 모델스코프는 900개 이상의 AI 모델을 제공한다.

기업과 개발자는 모델스코프GPT를 무료로 활용해 다국어 동영상 제작과 같이 사용자의 요청에 따른 정교한 AI 작업을 수행하는 데 가장 적합한 모델을 사용할 수 있다.

한편 알리바바 클라우드는 지난 4월 '통이치엔원(Tongyi Qianwen)'이라는 이름의 대규모 언어 모델(LLM)을 출시했으며, 이를 알리바바의 다양한 비즈니스에 통합해 사용자 경험을 개선할 계획이다. 또한 알리바바의 고객과 개발자는 이 모델을 사용해 효율적인 비용으로 맞춤형 AI 기능을 개발할 수 있다.

알리바바 클라우드는 통이치엔원이 출시된 이후 핀테크, 전자, 운송, 패션, 유제품 등 다양한 분야의 기업으로부터 30만 건 이상의 베타 테스트 요청을 받았다고 밝혔다.

통이치엔원은 알리바바 클라우드의 지능형 어시스턴트인 팅우(Tingwu)에도 통합돼 어시스턴트가 높은 수준의 정확성과 효율성으로 멀티미디어 콘텐츠를 이해하고 분석할 수 있도록 돕는다. 이 AI 기반 어시스턴트 '통이 팅우'가 출시된 이후 현재까지 36만 명 이상의 사용자가 액세스했다.

☞공감언론 뉴시스 odong85@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?