'기업용 AI·데이터 플랫폼' 결합한 차세대 엔터프라이즈 플랫폼 'IBM 왓슨x'
책임감 있고 투명한 데이터 활용으로 신뢰 중심의 AI 환경 조성
AI의 기술이 빠르게 발전하며 다양한 분야의 혁신을 일으키고 있다. 이런 와중에 많은 기업들이 비즈니스의 성공을 위해 AI의 도입을 서두르고 있는 상황이다.
IBM이 2022년 발표한 '글로벌 AI 도입 지수' 보고서에 따르면 국내 기업 중 22%는 이미 AI를 도입하고 있으며, 46%는 AI 도입을 고려 중이라고 답변했다. 이 수치는 올해 더욱 크게 증가했을 것으로 예상된다. 더불어, AI는 2030년까지 약 16조 달러의 가치를 창출할 것으로 예상되는 등 기업이 성공적으로 비즈니스를 운영할 수 있는 핵심 요소로 거듭날 것으로 예상되고 있다.
기업들은 AI를 도입할 때, 다양한 AI 모델에 데이터를 학습시키고 유지 관리하는 데 상당한 어려움을 겪어왔다. 이 때 등장한 것이 FM(Foundation Model)이다. FM은 레이블이 지정되지 않은 방대한 양의 데이터를 사전에 학습한 AI 모델이다. 조직에서 AI를 활용할 때 FM을 사용하면 AI를 학습시키기 위한 데이터 준비와 학습에 들어가는 시간과 비용을 크게 절감할 수 있다. 또한, 레이블이 지정된 데이터를 이전 방식보다 10~100배 적게 사용할 수 있어, 쉽게 적용할 수 있다. 따라서, 조직에서 결과를 창출하는 시간이 단축되고, 내부 팀의 생산성을 향상할 수 있다.
FM은 생성AI를 가능하게 하는 기본 바탕이다. 그러나, FM과 생성AI에 있어서 소비자용과 비즈니스용 AI 애플리케이션이 다르다는 점을 기억해야 한다. 오늘날 기업은 신뢰할 수 있는 데이터, 속도, 거버넌스를 통해 조직 전체에 AI를 활용하기 위한 전 과정을 아우르는 모든 기술과 서비스가 필요하다. 그리고, 모든 클라우드 환경(온프레미스와 퍼블릭, 프라이빗 클라우드)에 걸쳐 실행할 수 있어야 한다.
왓슨x.ai, 왓슨x.데이터, 왓슨x.거버넌스 등 3가지로 구성
이런 비즈니스의 요구조건을 반영해 IBM에서 발표한 AI 플랫폼이 왓슨x다. 왓슨x는 기존 머신러닝이나 최신 파운데이션 모델을 구축, 개선할 수 있는 기업용 AI와 데이터 플랫폼이다. 비즈니스 전용이므로 데이터가 어디에 있든 책임감 있고 투명하게 데이터를 활용한다.
왓슨x의 핵심은 신뢰다. 기업은 고객과 상호 작용할 때 AI가 거짓 정보를 사실처럼 꾸며내거나(hallucination), 부적절한 언어를 사용하지 않을 것이라는 확신을 가질 수 있어야 한다. 고객의 정보 유출을 미연에 방지하기 위해 온프레미스에 설치해 사용할 수 있는 버전을 제공하는 것도 특징이다(2024년 1분기 출시 예정).
이런 목적에 따라 IBM은 왓슨x를 왓슨x.ai, 왓슨x.데이터, 왓슨x.거버넌스 등 3가지로 구성하고 있다.
IBM 왓슨x.ai는 차세대 기업용 AI 스튜디오다. AI 개발자들이 머신러닝을 기반으로 AI를 구축, 실행, 배포할 수 있도록 지원하는 IBM 왓슨 스튜디오 기술과 FM의 성능을 활용하는 최신 생성AI 기술을 결합했다.
이 AI 스튜디오는 고객이 자체적으로 구축하거나, IBM이 선별하고 학습시킨 독점적인 다양한 FM, 오픈소스 FM을 쉽게 활용할 수 있도록 하는 파운데이션 모델 라이브러리를 제공한다. IBM 파운데이션 모델은 언어뿐 아니라 코드, 시계열 데이터, 표 형식 데이터, 지리공간 데이터, IT 이벤트 데이터 등 다양한 영역, 다양한 형식의 데이터에 대해 학습하고 있다.
또한, 엄격한 필터링과 정제 프로세스, 법적 또는 안전 문제 검토나 감사(Audit)가 가능한 전체 데이터 계보 등 데이터 수집, 출처, 품질에 엄격한 기준을 두고 구축된, 엄선된 기업용 대규모 데이터 세트를 사용하고 있다.
또한, IBM은 허깅 페이스와의 협력으로 수천 가지의 허깅 페이스 오픈소스 FM과 데이터 세트를 제공할 예정이다. 이는 고객들 각각의 비즈니스에 가장 적합한 모델과 아키텍처를 활용할 수 있도록 개방형 생태계 접근 방식을 고객에게 제공하려는 IBM의 노력의 일환이다.
IBM 왓슨x.데이터(data)는 데이터 웨어하우스의 고성능 처리 기술과 데이터 레이크의 유연성을 함께 제공하는 새로운 데이터 레이크하우스 솔루션이다. 정형 데이터와 비정형 데이터를 자유롭게 저장, 활용할 수 있으며, 저렴한 개방형 스토리지를 지원하면서도 높은 성능을 제공한다.
무엇보다 왓슨x.데이터는 기업들이 AI 작업을 확대 적용하는 것을 지원하도록 클라우드뿐 아니라 온프레미스 버전 제공, 중앙집중식 거버넌스와 보안, 자동화 기술을 내장, 멀티 쿼리 엔진과 스토리지 계층 기술을 채택하고 있다.
AI를 통해 비즈니스 가치를 극대화하기 위해서는 데이터 분석가, 데이터 과학자뿐 아니라 기업 사용자 누구든 신뢰할 수 있는 고품질의 검증된 데이터를 셀프 서비스로 활용할 수 있게 하는 것이 중요하다. 이를 위해 왓슨x.데이터는 다른 왓슨x 플랫폼 솔루션과 마찬가지로 FM과 생성AI를 활용하고 있다.
사용자가 자연어 문장과 질문을 사용하여 필요한 데이터를 활용할 수 있도록 돕는 시맨틱 오토메이션(Semantic Automation) 기능이 그 대표적인 예이다. 이 기술을 통해 사용자는 코딩이나 데이터 엔지니어링 전문 지식 없이도 셀프 서비스 대화 기능을 사용해 데이터를 쉽게 검색, 보강, 정제할 수 있다. 시맨틱 오토메이션 기술은 2024년 초에 정식 공개될 예정이다.
IBM 왓슨x.거버넌스(governance)는 정책 생성, 의사 결정 권한 할당, 위험과 투자 결정에 대한 조직의 책임 보장을 위한 자동화된 데이터와 모델 수명 주기 솔루션으로 AI 도구와 AI 사용에 필요한 보조 장치를 구축할 수 있도록 지원한다.
신뢰와 투명성, 프라이버시 원칙에 기반한 AI 솔루션
글로벌 ERP 솔루션 기업인 SAP는 IBM의 왓슨 AI 기술을 자사 솔루션에 탑재했다. SAP는 AI 기반의 새로운 인사이트와 자동화 기능을 바탕으로 솔루션 포트폴리오 전반에서 혁신을 가속화하고 보다 효율적, 효과적인 사용자 경험을 제공할 수 있게 됐다.
특히 SAP는 IBM의 왓슨 기능을 활용해 SAP 스타트(SAP Start)의 디지털 어시스턴트 기능을 강화했다. SAP 스타트에 탑재된 새로운 AI 기능은 사용자가 IBM의 신뢰와 투명성, 데이터 프라이버시 원칙에 기반한 왓슨 AI 솔루션을 활용해 자연어 기능과 예측 인사이트로 생산성을 높일 수 있도록 지원하고 있다.
IBM은 이외에도 마스터스 골프 대회, 윔블던 챔피언십, US 오픈 테니스 대회의 앱과 웹의 디지털 팬 경험을 향상시키기 위해 생성형 AI 기술을 활용한 모든 하이라이트 영상의 AI 해설 기능, AI 대진운 분석 기능, 홀별 선수 예측 기능 등을 제공하기도 했다.
[알림] GTT KOREA와 전자신문인터넷은 오는 9월 20일 수요일 오전 9시부터 오후 5시 30분까지 인터컨티넨탈 서울 코엑스 하모니볼룸에서 “Next AI & BigData Summit(NABS) 2023”을 개최한다. 이 행사에서는 총 15개 세션과 전시 부스를 통해 AI와 Big Data 최신 기술 트렌드를 조망하고, 현재 기업과 조직이 처한 과제 및 해결 방안을 공유하며, 산업별·조직별 맞춤형 AI & Big Data 활용 전략이 제시된다.
전자신문인터넷 유은정 기자 judy6956@etnews.com
Copyright © 전자신문. 무단전재 및 재배포 금지.
- 구리선 걷어낸 LG유플러스…인터넷 속도 4배 빨라진다
- 北-러정상회담...우주·로켓분야 협력 강화
- 'FO-PLP' 꺼낸 삼성, TSMC 추격 고삐
- [기자의 일상] 골 때리는 기자들
- “서비스센터 안 가요” … 소니코리아 '셀프 수리 키트'로 직접 제품 고치는 MZ
- [酒절주절]전통주 복원의 미학
- 네슬레 코리아, '위프라우들리서브 스타벅스' 확대…“B2B 사업 강화”
- “중국男 3000만명, 짝 없어 결혼 못한다”
- 프랑스, 전자파 많이 나온다며 아이폰12 '판매 중단' 명령
- 美 연구팀, 고령층 하루 앉아있는 시간 10시간 넘으면 치매 위험 ↑