KT 초거대 언어모델 '믿음' 공개..."데이터 주권 지키겠다"

정옥재 기자 2023. 10. 31. 16:41
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

31일 온라인 기자설명회 열어 출시 발표
경량에서 초대형까지 총 4종
기업 규모, 목적 맞춰 맞춤형 응용 가능
조단위 학습, '궁극의' 풀 파인튜닝

KT는 그동안 심혈을 기울여온 이 회사 초거대 언어모델 ‘믿음’을 출시했다. 구글, 오픈 AI 등 글로벌 기업들로부터 데이터 주권을 지키고 국내외 기업들에게 궁극의 응용 가능성을 제공한다는 게 목표다. 국내에는 KT 외에도 네이버, LG, SK텔레콤 등이 초거대 언어모델을 출시하거나 응용하는 소프트웨어를 발표한 바 있다. 제대로 된 초거대 언어모델을 운용하려면 데이터센터 확보는 물론 기술력도 상당 부분 쌓고 있어야 한다.

KT AI/BigData사업본부 최준기 본부장이 31일 기자설명회에서 KT 초거대AI 믿음에 대해 설명하고 있다. 왼쪽 두 번째부터 최 본부장, KT AI2XL 연구소 배순민 소장, ‘매스프레소’ 이용재 대표, ‘업스테이지’ 김성훈 대표, KT SW개발본부 조성은 본부장. KT 제공


KT 초거대언어모델 믿음 웹페이지


KT는 31일 서울 서초구 KT 연구개발센터에서 기자설명회를 열어 초거대 AI ‘믿음(Mi:dm)’의 출시를 발표했다. 출시하는 모델은 총 4종으로, 경량 모델부터 초대형 모델에 이르기까지 기업의 규모와 사용 목적에 맞게 완전 맞춤형으로 사용할 수 있도록 했다.

▮ “우리는 통으로 제공”

또한 AI 풀스택(관련 산업 인프라를 처음부터 끝까지 갖췄다는 뜻)을 통해 KT클라우드와 함께 믿음의 기업전용 AI 클라우드팜(Mi:dm CloudFarm)을 패키지로 제공한다. 별도 개발 및 학습 인프라가 없더라도 누구나 합리적인 비용으로 초거대 AI를 활용한 서비스를 개발할 수 있다.

KT는 초거대 AI를 활용하고 학습하려는 모든 기업에게 믿음의 파운데이션 모델을 개방한다. 이를 위해 ‘KT 믿음 스튜디오(KT Mi:dm Studio)’라는 전용 포털을 오픈해 고객에게 편리한 개발 환경을 제공할 예정이다. 여기선 KT 믿음의 파운데이션 모델을 직접 선택, 학습, 서빙할 수 있는 맞춤형 환경이 구성된다.

파운데이션 모델이란, 방대한 데이터셋으로 학습한 초거대 AI 핵심 기반 모델을 말한다. 오픈 AI사의 자연어 처리 모델 GPT가 대표적이다. 보다 복잡한 기술의 구현이나 시스템의 구축을 위해 기업에서 원하는 형태로 미세조정을 거쳐 다양한 AI 응용서비스를 만들 수 있다.

초거대 AI를 사용하고 싶지만 수십억에서 수천억에 달하는 파라미터 모델을 만들 여력이 없는 대다수 기업들의 경우, 기존에 공개된 파운데이션 모델을 응용해야 한다. 그러나 이는 데이터 자주권 차원에서 빅 테크에 데이터가 종속될 수 있다는 보안 우려가 있다. 무엇보다 기존 상업용 파운데이션 모델은 풀 파인 튜닝(완전하게 응용해서 사용함)을 제공하지 못한다는 한계가 있었다는 게 KT 설명이다.

KT는 이러한 기업고객들의 갈증을 해결하기 위해 국내 업계 최초로 조 단위 데이터의 사전 학습을 완료한 자체 파운데이션 모델 ‘믿음’을 개방했다. 이를 통해 LLM(거대언어모델)의 B2B 사업화를 가속하고 궁극적으로 기업들이 원하는 AI 사업 모델과 응용 서비스의 폭발적 확산을 이끌어낸다는 계획이다.

KT는 믿음 출시와 함께 수요 기업들이 사용 신청을 할 수 있도록 초거대 AI 믿음 공식 웹사이트(Midm.kt.com)를 오픈했다.

▮ KT “믿어달라…할루네이션 극복”

KT 믿음은 생성 답변에서 구체적이고 믿을 수 있는 해법을 제시한다고 KT는 강조했다. 생성형 AI의 가장 큰 문제점은 바로 ‘AI의 환각 답변(Hallucination: 할루시네이션)’이었다. KT는 이를 해결하기 위해 검색과 추론, 답변 모든 단계에서 신뢰성을 높일 세 가지 기술을 개발해 적용했다.

다큐먼트 AI(Document AI)는 도식화된 복잡한 문서도 모델이 정확히 이해할 수 있도록 변환하는 기술이다. 서치 AI(Search AI)는 목표 도메인과 문서에 최적화된 최신 정보를 찾아내는 딥러닝 기술이다. 팩트가드 AI(FactGuard AI)는 원문에 근거한 응답만 생성하도록 강화학습을 적용했다. KT는 이로 인해 생성형 AI의 가장 큰 문제점인 할루시네이션 현상을 일반 생성형 AI 서비스 대비 최대 70% 가까이 줄일 수 있다고 설명했다.

KT는 이번 믿음 출시를 계기로 기업전용 LLM 사업화, 새로운 AI 혁신 사업 발굴 등 우선 B2B 시장에 집중한다. 이후 글로벌, 제조, 금융, 공공, 교육의 5대 영역으로 초거대 AI 사업 영역을 확장할 계획이다.

▮ 업스테이지 콴다 에누마 등과 협업

KT는 기업전용 LLM 사업화에 ‘업스테이지’, Math-GPT를 비롯한 교육 영역에선 ‘콴다’와 ‘에누마’, 기업용 업무 개인비서 영역에는 ‘비아이매트릭스’ 등 다양한 AI 스타트업들과 ‘믿음’을 활용한 AI 사업모델을 공동으로 개발하고 국내 및 글로벌 시장을 공략한다. KT AI/DX융합사업부문장 송재호 부사장은 “초거대 AI 시장은 세계적 빅테크 기업부터 스타트업까지 참여하며 급격한 디지털 혁신이 진행되고 있다”며 “KT는 차별화된 초거대 AI 모델을 개방하고 대한민국이 디지털 전환을 주도할 수 있도록 모든 역량을 집중하겠다”고 말했다.

Copyright © 국제신문. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?