더 작고 효율적으로…MS, SLM '파이-3.5' 시리즈 출시
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
MS(마이크로소프트)가 지난 4월 출시한 AI(인공지능) SLM(소형언어모델) '파이-3(Phi-3)' 시리즈를 업그레이드한 '파이-3.5' 시리즈를 최근 출시했다고 27일 밝혔다.
MS는 "파이-3 모델의 도입으로 MS 애저(MS의 클라우드) 고객들은 고품질 모델에 대한 선택의 폭이 넓어져, 생성형 AI 애플리케이션을 설계하고 구축할 때 더욱 실용적인 옵션을 갖게 됐다"며 "파이-3.5 모델은 나아가 오픈 소스 커뮤니티와 MS 애저 고객을 위해 경제적이면서도 고성능 옵션을 제공하며, 소형 언어 모델과 생성형 AI의 경계를 넓힐 것"이라고 말했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
MS(마이크로소프트)가 지난 4월 출시한 AI(인공지능) SLM(소형언어모델) '파이-3(Phi-3)' 시리즈를 업그레이드한 '파이-3.5' 시리즈를 최근 출시했다고 27일 밝혔다.
파이-3.5 시리즈는 △파이-3.5-미니 △파이-3.5-비전 △파이-3.5-MoE(Mixture of Experts) 3종으로 구성됐다.
파이-3.5-미니는 38억개 파라미터로 구성된 모델이다. 12만8000토큰 길이의 문서를 지원해 긴 문서나 회의록 처리에 유용하다. 지원되는 언어는 한국어를 포함해 23개다. 파이-3.5-미니는 같은 크기의 파라미터로 구성된 파이-3-미니보다 처리할 수 있는 문서 길이가 길어졌고, 아랍어·핀란드어 등 일부 언어 성능을 개선한 것이 특징이다.
파이-3.5-비전은 멀티 프레임 이미지 이해와 추론 능력을 강화한 모델이다. 지난 5월말 출시된 파이-3-비전 모델에서 다중 프레임 이미지 이해 등 성능을 강화한 모델이다. 스테이블 디퓨전이나 달리 등 모델처럼 이미지 생성을 하지 않는 대신 모델 크기를 줄이고 이미지 내용을 이해하고 분석하는 데 초점을 맞췄다. 해당 모델은 슬라이드 요약·비디오 요약·이미지 스토리텔링 등 작업에서 정확도와 효율성이 향상됐다.
파이-3.5-MoE는 전문가 혼합 모델로 총 420억개 파라미터 중 66억개 활성 파라미터를 사용한다. 이 모델은 특히 긴 문서와 20개 이상 다국어 지원에서 높은 성능을 발휘한다. 지원하는 문서 길이는 파이-3.5-미니와 동일하게 12만8000토큰이다.
MS는 "파이-3 모델의 도입으로 MS 애저(MS의 클라우드) 고객들은 고품질 모델에 대한 선택의 폭이 넓어져, 생성형 AI 애플리케이션을 설계하고 구축할 때 더욱 실용적인 옵션을 갖게 됐다"며 "파이-3.5 모델은 나아가 오픈 소스 커뮤니티와 MS 애저 고객을 위해 경제적이면서도 고성능 옵션을 제공하며, 소형 언어 모델과 생성형 AI의 경계를 넓힐 것"이라고 말했다.
배한님 기자 bhn25@mt.co.kr
Copyright © 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지
- 이지혜 딸, 하와이서 사고로 피 철철…"2시간 지혈했는데 안멈춰" - 머니투데이
- 고영욱 "법 처벌 다 치렀는데…" 유튜브 폐쇄 구글에 이의신청 - 머니투데이
- 팬 만나 임신한 BJ "남편, 성폭력 신고당해…합의금 대신 내줬다" - 머니투데이
- '학폭·암투병' 아들, 우울감에 극단적 생각…엄마는 "알아서 해" - 머니투데이
- 김윤아 "남편이 강남역 이름 11억에 낙찰? 그 돈 있으면 좋겠다" - 머니투데이
- '이혼 소송 중 열애' 괜찮아?…변호사 "황정음 따라하면 큰일나" - 머니투데이
- "18살 첫 출산→아이 셋 아빠 다 달라"…11살 딸, 막내 육아 '충격' - 머니투데이
- 한동훈이 외친 '특별감찰관 추천', 표결 없이 합의?…친윤계 반발 변수 - 머니투데이
- 김호중은 실형 받았는데…박상민, 3번째 음주운전에도 '집행유예' - 머니투데이
- "이젠 머스크가 백악관 실세"…광고주들 X로 복귀 준비 - 머니투데이