누가 더 잘 그렸나요…카카오-알리바바 AI 비교했더니

오동현 기자 2023. 7. 12. 09:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

카카오브레인 '칼로 2.0', 알리바바 클라우드 '통이 완샹'
복잡한 명령어도 이해하며 맥락에 맞는 이미지 생성
저작권 이슈도…'콜라' 입력했더니 코카콜라가 생성?
카카오브레인의 인공지능 이미지 생성 모델 '칼로 2.0'을 활용 만든 '인공지능' 사진. *재판매 및 DB 금지


[서울=뉴시스] 오동현 기자 = 한국을 대표하는 정보기술(IT) 기업 카카오와 중국의 알리바바그룹이 인공지능(AI) 이미지 생성 서비스를 고도화하며 새로운 비즈니스 기회를 모색한다.

12일 IT 업계에 따르면 알리바바그룹의 알리바바 클라우드는 최근 '세계 인공지능 컨퍼런스 2023'에서 AI 이미지 생성 모델인 '통이 완샹'을 공개했다. 이보다 앞서 카카오의 카카오브레인은 AI 이미지 생성 모델 '칼로'를 공개했고, 지난 10일엔 성능을 더 높인 '칼로 2.0'을 대중에 개방했다.

양사의 서비스를 각각 사용해본 결과, AI가 생성한 이미지의 품질 자체는 비전문가 입장에서 단순 비교가 어려웠다. 다만 사용자가 활용할 수 있는 부가 기능 측면에선 차이점이 있었다.

카카오브레인의 칼로2.0은 사용자가 직접 AI의 세밀함과 자유도를 조정할 수 있다. 또 AI가 생성하는 이미지 수를 최대 8개까지, 이미지 크기는 최대 2048x2048까지 선택할 수 있다. 특히 약 3억 장 규모의 텍스트-이미지 데이터셋을 학습해 완성도 높은 그림을 만들어준다.

카카오브레인 측은 "칼로 2.0은 이미지 상의 공간감, 입체감, 동물의 털과 같은 텍스처를 디테일하게 표현하는 세밀함 등이 보강돼 실사에 가까운 고품질 이미지 생성이 가능하다. ‘모던 아티스트’ 등을 포함한 각종 화풍 구현 능력도 탁월하며, 이미지 생성 속도 역시 기존 모델 칼로 1.4 대비 단축돼 3초 만에 사용자가 원하는 이미지를 만들어낼 수 있다"고 설명했다.

알리바바 클라우드의 '통이 완샹'은 중국어나 영어 텍스트 프롬프트(명령어)를 입력받아 수채화, 유화, 중국화, 애니메이션, 스케치, 평면 일러스트레이션, 3D 만화까지 다양한 스타일의 이미지를 생성해주는 것이 장점이다. 또한 어떤 이미지든 유사한 스타일의 새로운 이미지로 변환하거나, 스타일 전송 기능을 통해 원본 이미지의 내용을 유지하면서 다른 그림의 시각적 스타일을 입힐 수 있다.

칼로 2.0 vs 통이 완샹 vs 아숙업, 누가 더 잘 그리나

두 서비스의 공통점은 우수한 자연어 처리(NLP) 기술을 기반으로 사용자가 복잡한 명령어를 입력해도 잘 이해하며 정확하고 맥락에 맞는 이미지를 생성해준다는 것이다

빅테크 기업 뿐만 아니라 국내 스타트업에서도 AI 이미지 생성 기술을 고도화하고 있다. 업스테이지는 AI 챗봇인 '아숙업(AskUp)'에 자사 기술로 파인튜닝된 이미지 생성 AI 모델 '업스케치'를 추가했다. 사용자가 원하는 이미지에 대해 설명한 이후 "그려줘"라고 입력하면 AI가 원하는 이미지를 생성해준다.

알리바바 클라우드가 공개한 이미지 생성 명령어와 동일하게 칼로 2.0과 아숙업에 입력해봤다.

먼저 '해질녘의 도시 풍경, 현대적 건축물과 애니메이션 미학이 어우러진 세계(Picture a cityscape at twilight, a world merging modern architecture with the evocative aesthetics of anime)'를 입력한 결과물이다.

왼쪽부터 '칼로 2.0', '통이 완샹', '아숙업'을 통해 생성된 이미지. *재판매 및 DB 금지


다음은 명령어에 '몰입적인, 매혹적인, 그레이 스케일, 고요한 만다라 숲 속의 호랑이, 선과 붓터치로 구성된 이미지(Immersive, captivating, grayscale coloring, featuring a tiger in the tranquil mandala forest. The image is composed of lines and brushstrokes)'를 입력해 만들어진 이미지다.

왼쪽부터 '칼로 2.0', '통이 완샹', '아숙업'을 통해 생성된 이미지. *재판매 및 DB 금지

AI가 생성한 '콜라' 사진…코카콜라 아냐?

다만 이런 AI 이미지 생성 서비스의 편리함 이면에는 저작권 문제가 자리잡고 있다.

실제로 칼로 2.0을 활용해 '콜라'의 이미지를 생성해보니, 특정 브랜드의 제품과 유사한 상표 및 디자인의 콜라 이미지가 만들어진다. AI가 이미지 데이터셋을 학습하는 과정에 유명 브랜드의 제품이 포함됐을 가능성이 크다. 만약 사용자가 이런 AI 생성 이미지를 잘못 활용할 경우 저작권 침해 문제가 불거질 가능성도 있다.

이에 문화체육관광부와 한국저작권위원회는 생성형 AI에 대응한 'AI-저작권법 제도개선 워킹그룹'을 발족하고 관련 사항을 논의하고 있다. 현행 저작권법 내에서 활용될 수 있는 ‘저작권 관점에서의 AI 산출물 활용 가이드(안)’(가칭)을 마련하는 등 AI 산업 발전과 함께 인간 창작자들의 권리를 공정하게 보장할 수 있는 다양한 합의점을 모색한다.

저작위는 "AI 학습을 위해 인간의 저작물을 포함한 대량의 정보를 수집하는 과정에서의 저작권 문제, AI가 만들어 낸 글, 그림과 같은 생성물의 저작권 인정 여부, AI 생성물의 활용에 따른 법적 이슈 등에 대한 본격적 논의가 필요한 시점"이라고 설명했다.

카카오브레인의 인공지능 이미지 생성 모델 '칼로 2.0'이 만든 '햄버거와 콜라' 사진. *재판매 및 DB 금지

☞공감언론 뉴시스 odong85@newsis.com

Copyright © 뉴시스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?