애플 LLM모델 ‘페럿’ 출격, 오픈소스 진영 합류…이미지 분석해 설명

이상덕 기자(asiris27@mk.co.kr) 2023. 12. 25. 14:03
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

애플이 컬럼비아대 연구진과 함께 오픈소스 기반 멀티모달 대규모언어모델(Large Language Model·LLM)인 페럿(Ferret)을 전격 선보였다.

벤처비트는 "후발주자인 애플이 메타처럼 오픈소스 모델을 통해 LLM 시장에 진입하는 것은 옳은 전략이다"면서 "현재 챗GPT와 같은 모델과 경쟁하면 대규모 AI 기업이 되거나 파트너십을 맺어야한다"고 말했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

A100 8개로 훈련해 주목
아직 대규모 서버 못갖춰
파트너십으로 기술 확보 전략
에플이 공개한 멀티모달 대규모언어모델 페럿. 이미지를 정확히 설명할 수 있는 것이 특징이다. <출처=애플, 컬럼비아대 연구진>
애플이 컬럼비아대 연구진과 함께 오픈소스 기반 멀티모달 대규모언어모델(Large Language Model·LLM)인 페럿(Ferret)을 전격 선보였다.

25일 논문 투고 사이트인 아카이브에 따르면, 페럿은 비상업적 라이선스를 지향한다. 따라서 현재 버전이 상용화로 이어지기보다는, 향후 애플 제품과 서비스에 통합될 가능성이 크다. 애플 AI·머신러닝 연구과학자인 제 간(Zhe Gan)은 트윗을 통해 “다양한 이미지 영역에서 사용할 수 있다”면서 “무엇이든 참고해 찾을 수 있다”고 말했다. 페럿은 이미지를 분석해 답변을 생성하는데 특화돼 있다. 예를 들어 이미지에 반려견과 화분이 함께 있다면 강아지에 동그라미 표시를 하고 이에 대해 질문을 할 수 있다. 해당 반려견 품종은 무엇인지 등 확인이 가능하다. 기능은 크게 세 가지다. △ 그림 속의 다양한 모양 찾기 △ 질문에 답하기 △ 사진 속 이야기 만들기 등이다.

애플은 앞서 한 대의 카메라인 단안 비디오를 활용해 3D 애니메이션 아바타를 생성하는 휴먼 가우시안 스플랫(HUGS·Human Gaussian Splats)과 메모리를 통한 효율적인 대규모 언어 모델 추론(Efficient Large Language Model Inference with Limited Memory)이라는 논문 2편을 공개한 바 있다.

애플은 통상 개발을 철저하게 비밀에 부치는 것으로 유명하다. 하지만 이번 행보는 다소 의외라는 평가다. 차세대 AI에 대해 오픈소스 진영에서 활동하기 때문이다. 페럿은 80GB 메모리가 장착된 A100 GPU칩 8개로 훈련된 것으로 알려졌다. 이를 놓고 AI 업계에선 애플이 현재 AI 서버 확보 경쟁에서 오픈AI나 마이크로소프트 수준이 되지 않는 것 아니냐는 평가를 내놓고 있다.

이를 놓고 비영리단체 운영자인 바트 드 위트는 X를 통해 “애플이 오픈소스 AI 커뮤니티에 합류했습다”면서 “페럿의 합류는 애플이 영향력 있는 AI 연구를 위해 노력하고 있다는 증거”라고 말했다.

벤처비트는 폐쇄적인 애플이 오픈소스 전략을 추구한데 대해 “당연하다”고 평가했다. 벤처비트는 “후발주자인 애플이 메타처럼 오픈소스 모델을 통해 LLM 시장에 진입하는 것은 옳은 전략이다”면서 “현재 챗GPT와 같은 모델과 경쟁하면 대규모 AI 기업이 되거나 파트너십을 맺어야한다”고 말했다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?