오픈AI, 소형AI ‘GPT-4o 미니’ 공개...“1500 페이지 입력당 15센트”

이상덕 기자(asiris27@mk.co.kr) 2024. 7. 19. 12:24
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

오픈AI는 GPT-4o 미니를 출시한다고 18일 발표했다.

오픈AI는 "GPT-4o 미니가 텍스트 및 비전 작업에서 업계 최고 수준의 소형 AI 모델을 능가한다"고 강조했다.

GPT-4o 미니는 오픈AI가 제공하는 가장 작은 모델이다.

오픈AI는 GPT-4o 미니의 정확한 크기를 공개하지 않았지만, 라마 3 8b, 클로드 하이쿠, 제미니 1.5 플래시와 같은 다른 소형 AI 모델과 비슷한 수준이라고 밝혔다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

고속 응답, 비용 효율성 강조
“다양한 작업에서 우수한 성능”
향후 비디오 및 오디오 기능 지원
샘 올트먼 오픈AI CEO
오픈AI는 GPT-4o 미니를 출시한다고 18일 발표했다. 해당 모델은 개발자뿐 아니라 챗GPT 웹 및 모바일 앱을 통해 소비자에게도 제공된다. 또 기업 사용자는 다음 주부터 이용이 가능하다.

오픈AI는 “GPT-4o 미니가 텍스트 및 비전 작업에서 업계 최고 수준의 소형 AI 모델을 능가한다”고 강조했다. 소형 AI 모델은 속도와 비용 효율성에 점점 더 인기를 끌고 있다. 이러한 모델은 반복적으로 수행되는 간단한 작업에 유용한 선택지로 자리 잡고 있다는 평가를 받고 있ㅆ다.

GPT-4o 미니는 오픈AI가 제공하는 가장 작은 모델이다. GPT-3.5 터보를 대체할 예정이다. 오픈AI는 새로운 AI 모델이 추론을 측정하는 MMLU 기준에서 82%를 기록했다고 밝혔다. 아티피셜 애널러시스(Artificial Analysis)에 따르면 제미나이(Gemini) 1.5 플래시(Flash)의 79%, 클로드(Claude) 3 하이쿠(Haiku)의 75%를 능가하는 수치다. 수학적 추론을 측정하는 MGSM에서도 GPT-4o 미니는 87%를 기록해 플래시의 78%, 하이쿠의 72%보다 우수한 성과를 보였다는 것이 회사측 설명이다.

오픈AI는 GPT-4o 미니가 이전 모델보다 운영 비용이 훨씬 저렴하며, GPT-3.5 터보보다 60% 이상 저렴하다고 설명했다. 오늘부터 GPT-4o 미니는 API를 통해 텍스트와 비전을 지원하며, 미래에는 비디오와 오디오 기능도 지원할 예정이다.

오픈AI의 API를 기반으로 개발하는 개발자들에게 GPT-4o 미니는 백만 입력 토큰당 15센트, 백만 출력 토큰당 60센트로 가격이 책정됐다. 1백만 토큰은 영문 기준 약 1500페이지에 해당한다. 모델은 책 한 권 정도의 길이에 해당하는 12만8000개의 토큰을 처리할 수 있으며, 지식의 기준 시점은 2023년 10월이다.

오픈AI는 GPT-4o 미니의 정확한 크기를 공개하지 않았지만, 라마 3 8b, 클로드 하이쿠, 제미니 1.5 플래시와 같은 다른 소형 AI 모델과 비슷한 수준이라고 밝혔다. 아티피셜 애널러시스A의 공동 설립자인 조지 카메론은 “비교 가능한 모델에 비해 GPT-4o 미니는 매우 빠르며, 중간 출력 속도는 초당 202 토큰”이라며 “이는 GPT-4o 및 GPT-3.5 터보보다 2배 이상 빠르며, 소비자 애플리케이션과 에이전트 접근 방식 등 속도 의존적인 사용 사례에 매력적인 제안”이라고 말했다.

한편 오픈AI는 기업 고객을 위한 새로운 도구를 발표했다. 오픈AI는 금융, 헬스케어, 법률 서비스 및 정부와 같은 고도로 규제된 산업의 기업들이 로깅 및 감사 요구 사항을 준수할 수 있도록 돕기 위해 기업 준수 API를 도입했다. 관리자가 챗GPT 엔터프라이즈 데이터를 감사하고 조치를 취할 수 있게 될 것이라는 설명이다 API는 타임스탬프가 포함된 상호 작용 기록, 대화, 업로드된 파일, 워크스페이스 사용자 등을 제공할 것으로 보인다.

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?