`MS 365 코파일럿` 한국어 지원… "개발자 지원 강화"

팽동현 2024. 4. 30. 17:26
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

MS(마이크로소프트)가 생성형AI(인공지능) 기반 클라우드 오피스 SW(소프트웨어)의 한국어 지원을 시작했다.

시연을 도운 조승민 한국MS 클라우드 솔루션 아키텍트는 "GPT-4로 'MS AI투어 서울 행사에 오신 여러분을 환영합니다'라는 문장을 영어로 생성하면 토큰 7개, 한국어로는 30개가 든다. GPT-3로 75개였던 것에 비하면 모델 업데이트와 함께 계속 개선되고 있다"며 "오픈AI 모델이 음절 빈도나 유니코드 구현 복잡성에 따라 토큰 밀도가 영향 받는 BPE(바이트페어인코딩) 기반 토크나이저 '틱토큰'을 쓴다는 점에서 그 구성방식 관련 연구로 성능·효율 향상을 꾀하고 있다. 텍스트 스플리팅 전략과 시맨틱 커널 등을 통해서도 노력을 지속 중"이라고 설명했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

양재서 'MS AI투어 인 서울'
오픈 AI모델 토큰 효율 공유
스콧 한셀만 MS 개발자 커뮤니티 부사장이 30일 서울 양재 aT센터에서 열린 'MS AI 투어 인 서울'에서 기조연설을 하고 있다. MS 제공
조원우 한국MS 대표가 30일 서울 양재 aT센터에서 열린 'MS AI 투어 인 서울'에서 환영사를 하고 있다. MS 제공

MS(마이크로소프트)가 생성형AI(인공지능) 기반 클라우드 오피스 SW(소프트웨어)의 한국어 지원을 시작했다. 다양한 클라우드 기반 생성형AI 도구로 국내 기업들의 혁신을 지원하는 한편, AI모델의 한국어 토큰 효율도 높여간다는 계획이다.

30일 서울 양재 aT센터에서 열린 'MS AI 투어 인 서울' 행사에서 조원우 한국MS 대표는 "'M365 코파일럿' 한국어 버전을 오늘부터 모든 사용자가 쓸 수 있다"고 밝혔다. 지난해 11월 정식 출시 이후 영어·프랑스어·독일어·스페인어·포르투갈어·이탈리아어·중국어·일본어 등을 지원했으며 이번에 한국어도 지원 대상에 포함됐다.

이날부터 국내 사용자들도 워드·엑셀·파워포인트·아웃룩 등 M365 앱을 통해 한국어 명령으로 콘텐츠를 생성하고 데이터 분석 등을 할 수 있게 됐다. 조 대표는 "한국인의 국민적 자산인 끈기, 성실, 속도, 그리고 창의성은 AI라는 변화의 물결 속에서도 한국을 선도적인 위치에 서게 할 원동력이 되고 있다"며 "MS는 대한민국 개발자들과 AI의 미래를 함께 만들어가겠다"고 덧붙였다.

이날 스콧 한셀만 MS 개발자커뮤니티 부사장이 연단에 올라 '개발자를 위한 차세대 AI'를 주제로 기조발표를 했다. 그는 "AI가 할 수 있는 일은 무궁무진하다. 전 세계 개발자들이 MS의 생성형AI와 로우코드 도구로 기술적 한계를 극복하고 있다"로 말했다. '깃허브 코파일럿'과 'MS 코파일럿 스튜디오' 등의 활용방법을 시연과 함께 소개했다. MS에 따르면 개발 만족도는 74%, 생산성은 88%, 속도는 96% 개선을 기대할 수 있다.

특히 한셀만 부사장은 "AI는 여러분 모두가 활용할 수 있는 도구가 돼야 한다"며 AI모델의 한국어 지원과 효율성을 강조했다. NIA(한국지능정보사회진흥원)와 업스테이지가 운영하는 '오픈 코LLM 리더보드'의 한국어 오픈모델 중 일부를 MS 애저 클라우드 '애저 AI스튜디오'에서 이용 가능하고, 'LM 스튜디오'를 통해 한국어 오픈모델을 검색·활용할 수 있다. 이런 SLM(경량언어모델)은 랩톱(노트북)에 다운받아 오프라인 상태로도 작업할 수 있다.

아울러 MS는 자사 및 오픈AI 모델의 한국어 토큰 효율 개선 관련 내용도 공유했다. 토큰 수는 모델의 텍스트 입·출력 등 성능에 영향을 주고, 이용 비용 산정의 기반으로 쓰인다. MS에 따르면 현재 회사가 공급하는 모델들은 한국어 텍스트에 대해 동일한 의미의 영어 텍스트보다 평균 2.36배의 토큰을 쓴다.

시연을 도운 조승민 한국MS 클라우드 솔루션 아키텍트는 "GPT-4로 'MS AI투어 서울 행사에 오신 여러분을 환영합니다'라는 문장을 영어로 생성하면 토큰 7개, 한국어로는 30개가 든다. GPT-3로 75개였던 것에 비하면 모델 업데이트와 함께 계속 개선되고 있다"며 "오픈AI 모델이 음절 빈도나 유니코드 구현 복잡성에 따라 토큰 밀도가 영향 받는 BPE(바이트페어인코딩) 기반 토크나이저 '틱토큰'을 쓴다는 점에서 그 구성방식 관련 연구로 성능·효율 향상을 꾀하고 있다. 텍스트 스플리팅 전략과 시맨틱 커널 등을 통해서도 노력을 지속 중"이라고 설명했다.

한편 'MS AI 투어 인 서울'은 MS가 AI를 주제로 세계 14개 도시를 순회하는 글로벌 행사다. 이번 서울 행사 기조연설에서는 LG전자와 SK이노베이션의 '애저 오픈AI 서비스' 활용 사례 발표도 진행됐다.

팽동현기자 dhp@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?