"작지만 강하다"…MS표 소형언어모델 '파이-3.5'
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
마이크로소프트(MS)의 최신 소형 언어 모델(SLM) 파이-3.5 시리즈가 대형 모델 대비 높은 비용 효율성과 우수한 성능으로 주목받고 있다.
MS는 "파이-3는 언어, 추론, 코딩, 수학 등 다양한 벤치마크에서 유사하거나 더 큰 모델보다 우수한 성능과 비용 효율을 제공한다"며 "이번에 새롭게 공개된 파이-3.5 모델은 오픈 소스 커뮤니티와 애저(Azure) 고객을 위해 경제적이면서도 고성능 옵션을 제공하며, 소형 언어 모델과 생성형 AI의 경계를 넓히고 있다"고 설명했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
[아이뉴스24 윤소진 기자] 마이크로소프트(MS)의 최신 소형 언어 모델(SLM) 파이-3.5 시리즈가 대형 모델 대비 높은 비용 효율성과 우수한 성능으로 주목받고 있다.
27일 MS에 따르면 파이-3.5 시리즈는 △미니 △비전 △전문가 혼합(MoE) 등 세가지 모델로 구성됐다.
파이-3.5-미니는 38억 개의 파라미터로 구성된 모델이다. 긴 문서 요약, 멀티턴 대화 및 정보 검색 작업에 탁월한 성능을 발휘한다. 특히, 12만8000개의 컨텍스트 길이를 지원하며, 긴 문서나 회의록 처리에서 강력한 성능을 보여준다. 영어 및 다양한 언어에서 고성능을 유지하며, 특히 아랍어, 네덜란드어, 핀란드어 등의 언어에서 성능이 크게 개선된 것이 특징이다.
파이-3.5-비전은 멀티 프레임 이미지 이해와 추론 능력을 강화한 모델이다. 이 모델은 이미지 및 비디오 데이터 처리에서 뛰어난 성능을 보인다. 단일 이미지 벤치마크에서 성능이 크게 개선됐다. 예를 들어, MMMU 성능이 40.4에서 43.0으로, MMBench 성능이 80.5에서 81.9로 개선됐다. 또한, 문서 이해 벤치마크인 TextVQA에서도 성능이 70.9에서 72.0으로 크게 향상됐다.
파이-3.5-MoE는 총 420억 개의 파라미터 중 66억 개의 활성 파라미터를 사용한다. 이 모델은 특히 다국어 지원과 긴 컨텍스트 처리에서 탁월한 성능을 발휘하며, 비슷한 크기의 모델들보다 효율적이다. 20개 이상의 언어를 지원하며 강력한 안전 조치와 합성 명령어를 결합해 사용자가 안전하고 신뢰할 수 있는 AI를 구축할 수 있도록 돕는다
MS는 "파이-3는 언어, 추론, 코딩, 수학 등 다양한 벤치마크에서 유사하거나 더 큰 모델보다 우수한 성능과 비용 효율을 제공한다"며 "이번에 새롭게 공개된 파이-3.5 모델은 오픈 소스 커뮤니티와 애저(Azure) 고객을 위해 경제적이면서도 고성능 옵션을 제공하며, 소형 언어 모델과 생성형 AI의 경계를 넓히고 있다"고 설명했다.
/윤소진 기자(sojin@inews24.com)Copyright © 아이뉴스24. 무단전재 및 재배포 금지.
- '딥페이크 논란'에 결국…'피해학교 온라인 지도' 제작됐다
- 월 1200만원 벌며 '생활의 달인' 출연했던 배달원, 교통사고로 사망
- "갑자기 여성 혐오가 왜 나와"…분식집 욕설 피해 주장한 유튜버에 비판 폭주
- "고영욱, 평생 유튜브 못할 것"…유튜브가 밝힌 고영욱 채널 폐쇄 이유
- "복귀 전공의는 부역자"…'온라인 신상유포' 사직 전공의 검찰 송치
- 홍석천 "커밍아웃 이유? 당시 남자친구 때문에"
- 인기 팝가수의 비극…"엄마와 언니 같은 날 숨져"
- 민주 "친일 논란 만든 사람은 윤 대통령"
- 내년 예산안 677조…尹 "허리띠 바짝 졸라매 24조 구조조정"
- "가해자 75%는 10대"…'딥페이크 성범죄'에 외신도 '경악'