알리바바 클라우드, 대규모 언어 모델(LLM) 오픈소스로 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
알리바바 클라우드가 70억개 파라미터를 갖춘 대규모 언어 모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다.
알리바바 클라우드는 LLM 모델을 무료 개방한다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
알리바바 클라우드가 70억개 파라미터를 갖춘 대규모 언어 모델(LLM) 'Qwen-7B'와 'Qwen-7B-Chat'을 오픈소스로 공개했다.
'Qwen-7B'는 2조개 이상 토큰을 사전 학습했다. 중국어·영어·기타 다국어 자료, 코드, 수학 등 전문 지식도 포괄한다. 사전 학습된 'Qwen-7B' 모델은 대규모 다중작업 언어이해(MMLU) 벤치마크에서 좋은 성과를 거두었다. 주요 사전학습 오픈소스 모델 성능을 능가했다. 인문학, 사회과학, STEM(과학, 기술, 공학, 수학), 기타 분야를 포함한 총 52개 주제를 다루고 있다.
'Qwen-7B'와 'Qwen-7B-챗 모델'은 클라우드와 온프레미스 모두에서 배포된다. 사용자는 효과적으로 고품질 생성형 모델을 구축할 수 있다.
알리바바 클라우드는 LLM 모델을 무료 개방한다. 월간 활성 이용자(MAU) 수가 1억명 이하 기업은 이 모델을 상업적 용도로 무상 사용할 수 있다. 1억명 이상 사용자를 보유한 프로그램은 알리바바 클라우드에 라이선스를 요청해야 한다.
징런 저우 알리바바 클라우드 최고기술책임자(CTO)는 “알리바바 클라우드는 독자적인 LLM을 오픈소스로 공개하여, 많은 개발자와 중소기업이 생성형 AI 이점을 누릴 수 있도록 지원한다”며 “개방적인 접근 방식으로 집단지성을 발휘해 오픈소스 커뮤니티 활성화에 기여할 수 있기를 희망한다”고 말했다.
박두호 기자 walnut_park@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 기아 신형 'K3' 오늘 멕시코서 첫 공개…북미 특화모델로 육성
- 음원 시장 '생성형 AI' 10년 뒤 11배 볼륨 키운다
- 美, 대중국 추가규제 초읽기…반도체·AI·양자컴 투자 봉쇄
- 이통 3사 '분기 영업익 신기록'…5G 가입자 증가에 신사업 본궤도
- 러 스파이, 우크라 PX 판매원으로?…”젤렌스키 암살 계획에 정보 제공”
- CBDC 논의 속도...한은, 시중은행과 하반기 사용성 테스트
- 우리카드, 독자 카드 이어 빅데이터 기반 초개인화 서비스 '꾹' 배수진
- '중견기업 핵심 연구인력 지원사업' 성과 톡톡…수혜기업 재지원 의향 100%
- [선배에게 듣는 진학상담]<24>강원대 디지털밀리터리학과, “국방·첨단 IT분야 커리큘럼…안보
- [에듀플러스 초·중 이공계 교육]<8>이공계 최상위 진학 경로, “의대 1위, 반도체·AI학과 추격…