"초거대AI, 전원만 꽂으면 사용···새 생성AI 시대 열어"

방은주 기자 2023. 9. 7. 17:51
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

솔트룩스, '2023년 SAC' 개최...거대AI 4종과 다양한 AI 서비스 선보여

(지디넷코리아=방은주 기자)인공지능(AI) 전문기업으로 상장사인 솔트룩스(대표 이경일)가 '루시아GPT'라 불리는 자체 개발한 거대언어AI 4종을 7일 새로 선보였다. 

'루시아GPT'와 함께 이를 기반으로 한 다수의 기업 및 소비자용 AI서비스도 소개했다. 또 '루시아 GPT'를 구현해 사용할 수 있는 하드웨어 장비인 어플라이언스도 개발해 함께 선보여 시선을 모았다.

이날 솔트룩스가 선보인 파운데이션 모델인 '루시아GPT'는 AI 성능을 좌우하는 핵심 요소인 파라미터(매개변수)가 각각 70억개(7B), 130억개(13B), 200억개(20B), 500억개(50B)에 달한다. 연내 '100B(1천억개 파라미터) 루시아'도 나온다. 

파라미터 갯수를 이렇게 4종류로 내놓은 건 법률, 특허, 금융, 교육 등 각 전문 분야마다 요구하는 파라미터 수가 다르기 때문이다. 솔트룩스는 우선 법률, 특허, 금융, 교육 등 네 분야에 최적화한 맞춤형 AI를 제공하고 점차 도메인 분야를 넓혀갈 계획이다.

AI 성능을 좌우하는 건 크게 세 가지다. 데이터, 알고리즘 성능, 컴퓨팅파워(인프라)다. 국내 AI기업이 챗GPT와 바드같은 글로벌AI에 대항하는 최대 무기는 데이터, 정확히는 로컬 데이터다. '루시아'도 데이터를 사전 학습한 측면에서 강점이 있다. 1테라바이트(TB) 데이터를 사전학습했다. 책 420만권 분량이다. 하루에 책을 매일 한권 읽는다면 1만2천년 읽어야 할 분량이라고 이경일 대표는 소개했다. 

AI용어인 토큰(Token, 말뭉치)으로 하면 "5천억개가 넘는다"고 회사는 밝혔다. 데이터를 학습한 나라별 언어는 한국어와 영어가 대부분이고 이외 일본어와 중국어 등도 학습했다. 사용인구가 많은 스페인어도 앞으로 주력해 학습할 예정이다. 솔트룩스는 이런 AI를 우선 국내 개인, 기업, 공공기관에 공급하고, 일본과 미국 등 해외 시장에도 진출한다.

이날 기조 강연을 한 이경일 대표는 "새로운 혁신을 만들어 낼 것"이라면서 "내가 매일 1만2천년간 읽어야 할 책 분량을 학습한 AI가 기업, 정부에 들어가 추가 학습(파인튜팅)을 해 그 도메인의 경쟁력을 높여줄 것"이라고 강조했다. 이어 "루시아 GPT의 더욱 강력한 힘은, 솔트룩스가 사전 학습한 것을 각 기업이나 여러분, 공공이 가져다가 추가로 학습할 수 있다는 것"이라며 "이런 AI는 루시아가 유일하다"고 덧붙였다. 특히 그는 '루시아'가 챗GPT에 비해 환각 현상이 43% 더 적다면서 "아시아 최대 규모의 지식 베이스와 지식 그래프를 실시간으로 참조했다"고 역설했다.

이경일 솔트룩스 대표가 올해 17회를 맞은 자체 AI 컨퍼런스인 'SAC 2023'에서 기조 강연을 하고 있다.

특히 이번달말부터 어플라이언스를 공급한다면서 "모든 것들이 하나의 하드웨어 시스템에 들어가 있는 어플라이언스를 사다가 전원만 꽂으면 여러분만의 루시아가, 여러분만의 초거대 AI가 만들어진다"면서 "지난 20년간 솔트룩스는 대한민국 최대로 많은 학습용 데이터를 생성하고, 가공하고, 최적화하는 일을 해왔다"고 덧붙였다.

솔트룩스는 이날 이 같은 내용을 담은  'SAC 2023' 행사를 ‘LUXIA Is All You Need–생성 AI 시대, 모든 것이 달라집니다'를 주제로 서울 코엑스 오디토리움에서 7일 개최했다. 올해가 17회째로 코로나19가 발생한 첫해를 제외하고 매년 열어왔다. 행사는 온오프라인 하이브리드 열렸다. 사전 참가 신청자가 약 2700명에 달했다고 회사는 밝혔다.

이 대표는 "회사를 처음 설립할때 세상 모든 사람이 자유롭게 지식 소통하는 세상을 만들겠다는 미션을 가지고 있었다"면서 "이제 오직 사람을 위한 인공지능, 사람만을 위한 루시아GPT를 만들어 이를 통해 또 다른 성장을 시작하고자 한다"고 말했다. .

다양한 환경에 맞춤형으로 도입 가능한 '루시아(LUXIA)'

'루시아'는 AI 데이터 구축 관련 정부사업 뿐 아니라 특허청, 행정안전부 등 다양한 분야의 사업을 수행하며 솔트룩스가 축적해 온 한글 데이터를 약 1TB 이상 학습했다. 이에 데이터 저작권 이슈를 최소화했다. 법률, 특허, 금융, 교육 등 각 전문 분야에 최적화한 맞춤형 언어모델을 빠르고 안전하게 구축할 수 있다고 회사는 설명했다.

챗GPT 등 생성AI의 고질 문제로 지적된 환각 현상도 최소화했다. 이를 위해 ‘지식그래프(Knowledge Graph)를 활용한 사실/지식 그라운딩(Factual Grounding)’과 ‘검색 증강 생성(RAG·Retrieval-Augmented Generation)’이라는 두 가지 접근법을 연계, 이를 구현했다.

김재은 솔트룩스 AI랩장은 자사 지식그래프와 연계해 자체 연구·개발한 인스트럭트 지식 학습(IKL·Instruct Knowledge Learning)을 통해 오픈AI의 ‘GPT-3.5’ 와 메타의 ‘라마(Llama)2’와 대비했을 때, 한국어 할루시네이션 자체 평가에서 대략 40% 더 우수한 성능을 확인할 수 있었다고 밝혔다. AI에서 말하는 '그래프'는 일반인이 아는 도형 형식의 그래프가 아니다. 속성이 같은 것들이 모인 공집합 데이터들이다.

김재은 솔트룩스 AI랩장이 발표를 하고 있다.

특히 솔트룩스는 7B, 13B, 20B, 50B 등 다양한 파운데이션 모델과 미세 조정 학습데이터셋을 노코드 기반 언어모델 구축 솔루션인 ‘랭기지 스튜디오(Language Studio)’와 함께 제공한다. 이에 복잡한 코딩이나 개발자 없이도 고객들은 보안에 강한 온프레미스(On-premise) 등 다양한 환경과 니즈에 적합한 언어모델을 사용 목적과 예산에 맞춰 합리적인 비용으로 도입할 수 있다고 회사는 설명했다.

또 AWS와 협력해 다음달부터 사전 학습된 파운데이션 모델을 제공하는 머신러닝 허브 ‘Amazon SageMaker JumpStart’를 통해 '루시아'를 순차적으로 공개, 클라우드 환경에서 루시아를 활용하려는 고객에게 편의를 제공한다. '루시아'는 AWS Inferentia2 액셀러레이터 추론에 최적화 및 테스트를 모두 마친 상태로, 루시아 130억 파라미터 크기의 모델을 AWS Inferentia2 액셀러레이터를 통해 사용할 경우 월 운영 비용을 기존 대비 최대 65%까지 절감할 수 있다고 김재은 랩장은 밝혔다.

솔트룩스는 이날 '루시아GPT' 외에 △언어모델 구축 솔루션 ‘랭기지 스튜디오’ △인지검색 솔루션 ‘서치 스튜디오(Search Studio)’ △인공지능 기반 지식그래프 솔루션 ’날리지 스튜디오(Knowledge Studio)’ 등 다양한 제품이 포함된 ‘루시아 엔터프라이즈’도 함께 공개했다.

엔터프라이즈 사업을 맡고 있는 김형백 솔트룩스 전무는 “루시아 엔터프라이즈와 같은 통합 솔루션을 온프레미스 형태로 제공할 수 있는 기업은 현재 국내에선 솔트룩스가 유일하며 세계적으로도 손에 꼽을 정도”라며 “국내는 물론 해외 법인을 통해 미국 등 글로벌 시장도 빠르게 선점할 계획”이라고 말했다.

1억 명 이상의 일상에 녹아들 다양한 생성 AI 서비스

이날 오후에는 솔트룩스 미국법인 및 국내 자회사 플루닛의 임직원들이 연사로 나서 생성AI 기반 서비스 출시 계획 및 고도화 계획을 소개했다.

관심을 모은 '구버(Goover)'는 사용자가 관심 있는 특정 주제와 키워드, 문서 등을 학습한 인공지능 뇌(커넥톰)가 전세계 웹에서 맞춤형 심층 정보를 실시간 수집 및 정리할 뿐 아니라, 요약된 정보와 주요 인사이트를 채팅 형식으로 제공한다. 개인의 지식 어드바이저 역할을 수행하는 것이다. 여기에 루시아GPT를 적용해 해당 주제에 대한 심층 보고서를 생성해준다. 뿐만 아니라 대화형 프롬프트를 통해 대화식으로도 보고서를 작성할 수 있게 개발 중이다. '구버'는 올해 말 오픈베타를 시작해 내년 4월 공식 출시된다.

‘플루닛 워크센터(Ploonet Workcenter)’도 소개했다. AI직원을 기업 특성에 맞게 커스텀 생성할 수 있는 옴니채널 AI 직원 서비스다. AI 직원은 문자와 채팅, 전화 등으로 인입되는 대규모 상담에 24시간 365일 실시간 응대할 수 있을 뿐 아니라 아웃바운드 마케팅 활동까지 가능하다. 기업용 리셉셔니스트부터 텔레마케터에 이르는 다양한 역할을 수행할 수 있다. '플루닛 워크센터'는 현재 공식 홈페이지를 통해 오픈베타를 운영 중인데 다음달 공식 출시된다.

모바일 애플리케이션 ‘손비서’도 이번 행사에서 처음 공개됐다. 이는 개인용 AI비서 서비스로 다음달 베타 오픈을 앞뒀다. 음성 명령을 통해 부재중 메시지 확인, 메시지 답장, 아이폰 통화 녹음 등을 할 수 있다. 또 내가 필요한 구간만 다시 듣거나 검색하는 것도 가능해 회의나 전화가 많은 전문직, 영업직 및 개인사업자에게 유용할 전망이다. 여기에 루시아GPT를 적용하면 공연 추천, 여행지 추천, 뉴스, 심리 및 건강 정보 등을 제공받을 수 있을 뿐 아니라 일상 대화까지 가능하다.

솔트룩스는 이들 제품과 서비스 외에 '나의 AI 아바타'를 실시간으로 생성하고 그 아바타를 통해 새로운 대화방식을 만들 수 있는 '미미(MIME)' 서비스 출시 로드맵과 생성형 AI 기반 영상 생성·방송 플랫폼 ‘플루닛 스튜디오(Ploonet Studio)’의 고도화 계획도 밝혔다.

한편 이번 'SAC 2023' 행사 영상은 추후 솔트룩스 공식 유튜브에서 다시 시청할 수 있다.

방은주 기자(ejbang@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?