바둑만 두던 알파고, '멀티플레이어' 된다
━
‘오픈AI’(OpenAI)는 머스크가 유명 스타트업 육성기관 와이콤비네이터 대표였던 샘 알트만과 함께 안전하고 개방적인 AI 연구개발을 위해 2015년 설립한 비영리기관이다. 경제적으로 가치 있는 작업에서 사람을 능가하는 자율적인 시스템으로 ‘범용 인공지능’(AGI) 구현을 목표한다. 여기서 만든 딥러닝 모델이 인기 온라인게임 ‘도타2’ 프로게이머팀을 상대로 연승을 거둬 화제가 되기도 했다.
GPT는 이곳에서 만든 AI 언어 생성 모델이다. 입력된 자료를 바탕으로 머신러닝 알고리즘 기반 분석을 통해 구문론·문법·정보적 일관성을 갖춘 텍스트를 생성하는 자연어처리(NLP) 모델이다. 즉 말하고 글 쓰는 AI다. 지난해 5월 선보인 3세대 GPT는 ‘초거대AI’ 트렌드를 연 것으로 평가된다.
파라미터 수가 많을수록 AI는 더 많은 문제를 풀 수 있다. 오픈AI의 GPT 3세대 ‘GPT-3’는 1750억개의 파라미터로 파란을 일으켰다. 전 세대인 GPT-2는 15억개였고 이전에 가장 많았던 마이크로소프트(MS)의 인공지능 ‘튜링-NLG’의 170억개보다도 10배 많다. ▲CPU 28만5000개 ▲GPU 1만개 ▲400기가비트(Gb) 네트워크 시스템을 기반으로 4990억개 데이터셋을 학습했다.
바둑에서 최고 실력을 보인 알파고지만 다른 일을 할 줄은 모른다. 기존의 AI모델 대부분은 이런 식으로 하나의 기능에만 특화돼있다. 반면 대규모 데이터셋을 바탕으로 구축된 범용 AI 모델인 GPT-3는 언어와 관련해 다재다능한 모습을 보인다. 특히 소량의 데이터 입력으로도 결괏값을 추론해내는 ‘퓨샷러닝’(Few-shot Learning)에서 뛰어난 성능을 보였다.
창작은 문장에서 끝나지 않는다. 지난해 9월 영국 일간지 가디언은 ‘로봇이 이 기사를 모두 썼다. 인간, 아직도 무섭나?’라는 GPT-3의 기고문이 게재됐다. GPT-3가 쓴 시나리오가 단편영화로 제작되기도 했다. ‘방문 판매원’(Solicitors)이라는 제목의 약 3분30초 분량의 이 영화는 미국 채프먼대 영화학과생이 자신이 써뒀던 시나리오 일부를 GPT-3에 입력해 나머지 대부분을 작성하게 했다. 등장인물의 대화나 전개에서 개연성이 떨어진다는 평가를 받았지만 나름 내용에 반전도 꾀하는 등 가능성을 보였다.
이러다 보니 지난해 데이빗 차머스 뉴욕대 철학과 교수가 GPT-3에 의식이 있을 가능성을 제기하고 GPT-3가 이를 반박하는 일도 벌어졌다. 다만 GPT-3가 적용된 프랑스의 한 헬스케어 챗봇이 자살 충동을 고백한 환자에게 이를 긍정하는 발언을 하는 등 GPT-3도 아직 갈 길이 멀다. 샘 알트만 오픈AI 대표조차 “GPT-3는 과대평가됐다”며 부담감을 피력했다.
이에 앞서 오픈AI는 GPT-3의 접근방식을 이미지에도 적용해 텍스트를 입력하면 그림을 그려주는 화가 AI인 ‘달리’(DALL·E)를 올해 초 내놨다. GPT-3를 가져간 MS는 최대 1조개 파라미터를 수용하는 모델을 더 적은 GPU로 학습시킬 수 있는 기술인 ‘딥스피드’(DeepSpeed) 새 버전을 최근 선보였다. 중국도 예외가 아니다. 화웨이는 GPT-3보다 250억개가량 많은 2000억개의 파라미터를 지니고 중국어에 특화시킨 AI 언어 모델 ‘판구-알파’(PanGu-α)를 지난 5월 초 발표했다.
조성배 연세대 AI대학원 원장(컴퓨터과학과 교수)은 “대규모 데이터와 컴퓨팅파워를 동원해 사전에 학습시키는 방식이 언어 AI 분야 위주로 떠오르고 있다. 전산 자원도 많이 들고 조건도 붙지만 이게 가능하다면 성능은 어느 정도 보장된다는 점에서 점차 영상 등 다른 분야에도 적용이 시도되고 있다”며 “인지과학이나 신경과학 등 다양한 접근방식을 통해 더 적은 자원으로 효율적으로 문제를 해결하기 위한 연구도 병행되고 있다”고 설명했다.
◆GPT-3를 넘어라, ‘한국판 초거대AI’ 추진
장병탁 서울대 AI대학원장(컴퓨터공학부 교수)은 “초거대AI 구축에는 슈퍼컴퓨터 등 막대한 컴퓨팅파워가 요구되므로 개인이나 학교에서 할 수 있는 수준을 넘어선다”면서 “한국어에 대해서만큼은 주도권을 확보하고 향후 외국 기업에 종속되지 않으려면 우리 기업의 선제적인 대규모 투자가 필요한 시점”이라고 밝혔다.
그는 “구글이 전 세계에서 웹 데이터를 가져가 독보적인 데이터량으로 서비스를 개발해 내놓듯이 초거대AI 분야도 종국에는 후발주자가 쫓아오지 못할 만큼 몇몇 플랫폼으로 쏠릴 가능성이 크다”면서 “이 분야에서 언어장벽이 점점 낮아지고 있으므로 반대로 경쟁력이 충분하다면 글로벌 수출 가능성도 열려 있다”고 덧붙였다.
━
#. 최근 서울 동대문의 한 호텔을 방문한 B씨는 제공 물품에 칫솔이 포함되지 않은 사실을 확인했다. 외부로 사러 나가기엔 너무 늦은 새벽 2시. 객실 내 인공지능 가상비서를 통해 칫솔을 주문했다. 이윽고 방을 찾아온 건 사람이 아닌 로봇이었다. 로봇은 칫솔을 배송하고는 복도를 지나 엘리베이터를 타고 유유히 떠났다.
◆“고양이와 개, 이젠 구별합니다” 딥러닝이 이끈 AI 가상비서 시장 ‘사상 최대’
AI 가상비서의 역할이 확장됨에 따라 관련 기기 시장의 규모 역시 매해 커지고 있다. 글로벌 시장조사업체 스트래티지애널리틱스(SA)에 따르면 2021년 1분기 AI 기반 스마트 스피커와 디스플레이의 전 세계 출하량은 사상 최대치인 4000만대를 기록했다. 전 세계적으로 사용되는 관련 기기 수도 올해 말까지 50억대를 훌쩍 넘어설 것으로 전망된다.
전문가들은 딥러닝 기술의 발전이 가상비서 시장 성장을 뒷받침했다고 입을 모은다. 민옥기 한국전자통신연구원(ETRI) 본부장은 “사람의 언어로 소통한다는 특성상 음성인식 기술은 매우 중요하다”며 “딥러닝 기술 적용으로 음성인식의 정확도가 크게 향상된 게 가장 큰 변화였다”고 설명했다.
장병탁 서울대 AI연구원 원장은 “이전까진 매 상황 어떻게 대답하고 행동해야 한다고 일일이 코딩을 해줘야 해 다양한 상황을 다루기 쉽지 않았다”며 “지금은 입력된 데이터를 기반으로 AI가 스스로 학습해 자신을 발전시킨다”고 설명했다.
딥러닝의 적용으로 대화의 상황과 맥락에 기반해 사용자 의도를 파악하는 자연어처리(NLP) 기술도 크게 성장했다. 이전 대화 내용을 기억해 사용자 선호도를 학습하며 보다 정확한 개인 맞춤형 서비스를 제공한다. SK텔레콤의 인공지능 가상비서 ‘누구’(NUGU)가 탑재된 지도서비스 ‘티맵’에서 “오늘 마트 영업해?”와 같이 영업정보를 물어볼 때 단순히 ‘예’ ‘아니오’로 답하는 게 아니라 현재 영업하고 있는 가장 가까운 마트를 알려주는 것이 대표적인 예다.
오늘날 AI 가상비서는 챗봇과 스피커를 포함해 다양한 형태로 존재한다. 최근엔 기기를 넘어 지도와 번역기 등 소프트웨어 서비스에도 탑재된다. 휴대폰에 빗댄다면 AI 가상비서는 iOS나 안드로이드 등 하나의 운영체제인 셈이다.
국내 IT기업도 여러 파트너사와 협력해 가상비서 서비스 기반 제품을 개발하고 있다. 이에 따라 가상비서가 각종 IoT 기기와 자동차 등을 연결하는 스마트 허브 역할을 할 것이라는 게 업계 관계자들의 전언이다. 집에서 말 한마디로 TV나 에어컨 등 내부 기기와 외부 차량의 시동을 걸고 끄는 제어가 가능해진다는 뜻이다.
민옥기 본부장은 “카카오톡도 처음에는 사람들이 대화를 나누는 도구에 불과했지만 이젠 물건도 사고 은행업무도 보는 등 다양한 기능들이 추가됐다”며 “AI 가상비서가 플랫폼으로 확장될 수 있는 인프라를 갖추게 된다고 봐야 한다”고 말했다.
◆균형 맞추기 노력 필요… 데이터 격차 해소 순기능도
정보통신기획평가원(IITP) 관계자는 “사용자 동의 없이 수집된 개인정보가 유출되면 큰 사회적 문제가 될 수 있다”며 “유럽의 GDPR(일반개인정보보호법)처럼 음성 부분에 있어 비식별 조치나 데이터 보관에 대한 보호 조치 등 정부 차원의 가이드라인이 필요하다”고 강조했다.
AI 가상비서의 객관성이 훼손되지 않도록 균형 있는 데이터 수집이 필요하다는 목소리도 나온다. 이를테면 특정 정당이나 세력의 입장을 대변하는 데이터만 입력될 경우 정치적 성향을 가지게 될 수밖에 없다는 설명이다.
민옥기 본부장은 “통상 확보된 데이터는 기업 차원에서 미리 스캔해 개인정보 등 문제 소지를 정제한다”면서도 “정제된 이후에도 수집한 데이터가 한쪽으로 치우칠 경우 혐오·차별 등 편향된 발언을 할 수 있다”고 설명했다. 그는 “데이터를 균형있게 수집하기 위해선 많은 노력이 필요하다”고 조언했다.
문정욱 정보통신정책연구원(KISDI) 지능정보사회정책센터장은 “(시중의 AI 가상비서는) 대부분 음성 기반이라 디지털 취약계층의 접근 및 활용 가능성이 매우 높다”며 “독거 노인에게 말벗이 되어줄뿐더러 위급 상황을 파악하고 신고해주는 유용한 역할을 할 것으로 보인다”고 말했다. 실제 SK텔레콤의 스마트 스피커 ‘누구 오팔’(NUGU opal)은 “구해줘” 또는 “살려줘”라고 외치면 사용자와 24시간 돌봄 서비스를 연결해준다.
입력방식이 음성을 넘어 다양해지면 이 같은 디지털 격차는 더욱 줄어들 것으로 전망된다. 민옥기 본부장은 “음성만으로 상황을 파악하기 어려운 경우도 있다”며 “미래의 가상비서는 다중감각(multimodal)을 활용해 주변 상황을 다양한 방법으로 파악하고 인지하는 방향으로 진화할 것으로 보인다”고 말했다.
☞ "기럭지 장난 아냐"… 고은아, 12kg 뺐어요
☞ "아직도 10대 같아"… 안소희, 최강 동안 인증
☞ '방랑식객' 임지호 갑자기 별세… 원인은?
☞ '학폭 논란' 이다영, 그리스 이적?… 협회 반응은
☞ '♥오창석' 이채은 결혼해?… 웨딩드레스 뒤태가 '헉'
☞ 신이 근황, 치킨집 운영… "유명세 소용없더라"
☞ 최지우 남편 불륜?… 우리가 알 필요 있나
☞ '수영♥' 정경호, BTS에 급사과한 사연
☞ 김수미, 윤여정에게 'OOO' 했다가 오해받아
☞ "나쁜 생각까지"… 김범룡, 빚만 40억이었다?
팽동현·강소현 기자 kang4201@mt.co.kr
<저작권자 ⓒ '성공을 꿈꾸는 사람들의 경제 뉴스' 머니S, 무단전재 및 재배포 금지>
Copyright © 머니S & moneys.co.kr, 무단 전재 및 재배포 금지
- '12kg 감량' 고은아, 늘씬 몸매… "살 많이 뺐네" - 머니S
- 안소희, 깜찍한 원피스룩… "커피 마시는 인형" - 머니S
- '방랑식객' 임지호, 12일 별세… 원인은 심장마비 - 머니S
- '학폭 논란' 이다영, 그리스 이적?… 협회 "동의한 적 없다" - 머니S
- '♥오창석' 이채은 결혼해?… 웨딩드레스 뒤태가 '헉' - 머니S
- 신이 근황, 대구 치킨집 운영중… "유명세 소용없더라" - 머니S
- 도넘은 '가세연' 폭로, 최지우 남편 불륜설까지? - 머니S
- '슬기로운 캠핑생활' '수영♥' 정경호, BTS에 급사과한 사연 - 머니S
- 김수미, 윤여정에게 'OOO' 했다가 오해받은 사연 - 머니S
- "나쁜 생각까지"… 김범룡, 빚만 40억이었다? - 머니S