애플, 자체 AI 성능 보고서 공개… "구글·MS보다 낫다"
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
애플의 '온디바이스 및 서버 파운데이션 모델 성능 보고서'가 공개됐다.
한편으로는 애플이 보고서에서 평가한 대상이 단순 AI 파운데이션 모델이 아니라 AI 모델을 요약, 이모티콘 생성 등 사용처에 따라 모듈형으로 변형했을 때 성능이어서 구글, MS 등 다른 기업에 앞선다고 자체 평가할 수 있다는 해석도 나온다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
애플의 ‘온디바이스 및 서버 파운데이션 모델 성능 보고서’가 공개됐다.
13일 업계에 따르면 애플은 보고서에서 ‘인간 만족도(Human Satisfaction)’ 벤치마크 점수를 공개하면서 MS, 구글 등 생성형 AI 기술에서 앞선 것으로 평가받는 기업의 AI보다 자사가 사용처에 맞게 모듈화한 AI 기능이 높은 만족도를 보였다고 설명했다. 애플은 자사 모델이 파이-3, 구글 젬마, 오픈AI GPT-4 터보보다 인간 채점자들에게 선호됐다고 설명했다.
30억개의 매개변수를 가진 온디바이스 모델은 파이-3 미니, 미스트랄-7B, 젬마-7B 등 더 큰 모델보다 성능이 뛰어나며, 서버 모델은 데이터브릭스의 DBRX-인스트럭트, 미스트랄-8x22B, GPT 3.5 터보보다 유리하고 효율적이라고 설명했다. 애플은 평가 방식에 대해 ‘신중하게 샘플로 취해진 응답 세트 750개’를 사용했다고 밝혔다.
이에 대해 업계 등에서는 지식과 추론, 기초 수학 능력 등 AI 모델 성능을 평가할 때 일반적으로 사용되는 표준 벤치마크가 아닌 자체 벤치마크로 평가한 것이 적절하지 않다는 지적이 나온다. 애플이 자체 개발한 비공개 AI 모델과 이미 공개된 타 기업의 모델을 비교했기 때문에 외부에서는 실험 결과를 재현하거나 검증하려 해도 방법이 없는 ‘베일’에 쌓인 결과라는 이유에서다.
모델의 정확도 지표를 사람의 주관적인 평가로 결정했는데, 평가에 참여한 이들이 몇 명이고 어떤 특징의 분포를 갖는지 공개하지 않았을 뿐 아니라 평가의 구체적인 방법을 공개하지 않은 점도 지적됐다.
한편으로는 애플이 보고서에서 평가한 대상이 단순 AI 파운데이션 모델이 아니라 AI 모델을 요약, 이모티콘 생성 등 사용처에 따라 모듈형으로 변형했을 때 성능이어서 구글, MS 등 다른 기업에 앞선다고 자체 평가할 수 있다는 해석도 나온다. 보고서 역시 비판받을 가능성을 의식한 듯 “앞으로 알려지지 않은 피해를 파악하는 조사와 추가적인 개선을 안내하는 평가를 확대할 계획”이라고 덧붙였다.
- Copyright ⓒ 조선비즈 & Chosun.com -
Copyright © 조선비즈. 무단전재 및 재배포 금지.
- 무비자에 급 높인 주한대사, 정상회담까지… 한국에 공들이는 中, 속내는
- 역대급 모금에도 수백억 원 빚… 선거 후폭풍 직면한 해리스
- 금투세 폐지시킨 개미들... “이번엔 민주당 지지해야겠다”는 이유는
- ‘머스크 시대’ 올 것 알았나… 스페이스X에 4000억 베팅한 박현주 선구안
- 4만전자 코 앞인데... “지금이라도 트럼프 리스크 있는 종목 피하라”
- 국산 배터리 심은 벤츠 전기차, 아파트 주차장서 불에 타
- [단독] 신세계, 95年 역사 본점 손본다... 식당가 대대적 리뉴얼
- [그린벨트 해제後]② 베드타운 넘어 자족기능 갖출 수 있을까... 기업유치·교통 등 난제 수두룩
- 홍콩 부동산 침체 가속화?… 호화 주택 내던지는 부자들
- 계열사가 “불매 운동하자”… 성과급에 분열된 현대차그룹