글로벌 쇼크 몰고온 뒤 반면교사로 전락한 AI 선구자들 [박건형의 홀리테크]

박건형 테크부장 2022. 10. 10. 08:00

번역beta Translated by kaka i

닫기

글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

매우 작은 폰트
작은 폰트
보통 폰트
큰 폰트
매우 큰 폰트

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

닫기

개발비 다 날리고 매각된 IBM 왓슨, 현실 세계에 뛰어들지 못하는 구글 알파고가 알려준 것들

박건형의 홀리테크 뉴스레터 구독하기 ☞ https://page.stibee.com/subscriptions/80905

①1997년 5월 11일 미국 뉴욕 맨해튼의 에퀴터블 센터.

②2011년 2월14일과 2월15일, 소니 픽쳐스의 미국 최장수 퀴즈 프로그램 ‘제퍼디’ 방송센터

③2016년 3월9~15일, 서울 포시즌스 호텔.

위에 언급된 세 가지 날짜는 모두 특정한 분야에서 전세계적인 쇼크를 일으킨 날입니다. 눈치를 채신 분이 많겠지만 바로 컴퓨터를 기반으로 만들어진 인공지능(AI)과 인간의 대결에서 인간이 패한 사건들입니다. 지난 수백만 년간 인간은 스스로를 가장 똑똑한 존재로 자부해왔습니다. 하지만 진공관과 반도체, 소프트웨어 알고리즘의 발달이 이뤄지면서 과학자들은 거대한 꿈을 꾸기 시작했죠. 바로 ‘인간을 뛰어넘는 AI’를 만들겠다는 것이었습니다. 최근에야 각광받기 시작했지만 AI의 개념을 제시하고 구현하려고 했던 과학자들의 도전은 이미 반세기를 훌쩍 뛰어넘었습니다. 대표적으로 영화 ‘이미테이션 게임’의 주인공 앨런 튜링은 ‘기계가 지능을 가졌다는 것을 어떻게 판단할 것인가’의 기준이 되는 튜링 테스트를 제안했고, 1959년 마빈 민스키는 미국 MIT에서 ‘인공지능 프로젝트’를 시작하면서 AI(Artificial Intelligence)라는 용어를 처음 만들었습니다. 이 프로젝트는 디지털 정보의 자유로운 공유를 목표로 했는데, 프로젝트의 결과물인 아르파넷(ARPANET)은 현재의 인터넷으로 발전했습니다. 민스키는 ‘상상력 발전소’로 불리는 MIT 미디어랩을 설립해 학생들을 키워냈는데, ‘2045년이면 AI가 모든 인간의 지능을 합친 것보다 강력해지는 시대가 온다’고 주장한 ‘특이점이 온다’를 쓴 레이먼즈 커즈와일이 바로 민스키의 제자입니다.

앨버타대 연구팀이 개발한 인공지능 포커 프로그램 ‘케페우스’가 온라인으로 포커 경기를 펼치고 있다(사진 위). 1997년 체스 세계챔피언 개리 카스파로프(오른쪽 아래 화면)와 IBM의 수퍼컴퓨터 ‘딥 블루’가 체스 경기를 하는 장면을 사람들이 지켜보고 있다.

우리는 이미 AI와 함께 살아가고 있습니다. 집에 있는 스피커부터 각종 서비스, 모두가 하나씩 들고 다니는 스마트폰이나 최신형 TV에도 어김없이 AI가 탑재돼 있죠. 확실히 편해지기는 했습니다. 단순히 음성 명령으로 TV와 에어컨을 켜고 꺼는 것부터 시작해 회의를 알아서 받아친 뒤 회의록을 만들어주고, 다소 어설프기는 하지만 번역도 해줍니다. 그런데 AI 개발자들이 제시한 미래는 아직 오지 않은게 분명해 보입니다. 환자의 검사기록만 보면 절대로 틀리지 않는 진단을 내리는 AI의사, 사람보다 더 안전하게 운전하면서 사고를 내지 않는 AI자율주행차가 곧 등장할 것이라는 기대는 여전하지만 그 시기는 계속 늦춰지고 있죠. 따지고 보면 AI서비스를 적극적으로 이용하는 사람과 그렇지 않은 사람의 삶의 질에 큰 차이가 없는 것 같기도 합니다. 몇 년 내에 우리 삶을 바꿔놓고 말 것 같았던 AI의 진보는 왜 더딘 걸까요. 심지어 AI의 선구자로 불리던 서비스가 처참한 실패로 돌아간 경우도 있습니다. 지난달 발표된 두 건의 조사 결과는 AI에 대한 두 얼굴을 여실히 보여주고 있습니다.IBM의 글로벌AI 채택 지수에 따르면 전세계 기업의 3분의 1 이상이 AI를 사용하고, 42%는 AI 도입을 추진하고 있습니다. 하지만 컨설팅업체 액센추어의 다른 조사 결과에서는 기업 3분의2는 아직 AI를 실험적인 수준으로 보고 있습니다.

1996년 당시 세계 체스 챔피언이었던 가리 카스파로프가 IBM의 체스 인공지능 컴퓨터 '딥 블루'와 첫 체스 대결을 벌이고 있다.

◇IBM의 야심찬 도전

다시 맨 위의 역사적 사건들로 돌아가 보겠습니다. 1996년 IBM은 자사의 수퍼컴퓨터 ‘딥 블루(Deep Blue)’로 세계 체스 챔피언인 러시아의 가리 카스파로프에게 도전했습니다. 필라델피아에서 열린 경기에서 카스파로프는 4대2로 넉넉한 승리를 거뒀습니다. 하지만 이듬해인 1997년 뉴욕 대결에서는 3.5대2.5로 딥 블루가 카스파로프를 제쳤습니다. 세계 체스 챔피언이 토너먼트 공식 규정으로 컴퓨터에 진 첫 사례였습니다. 딥 블루의 승리는 놀라웠지만, 딥 블루의 발전 가능성을 높게 보는 전문가는 많지 않았다고 합니다. 체스라는 특정한 조건에서 딥 블루는 수를 읽어내는 방법을 오롯이 ‘컴퓨팅 능력’에 의존했기 때문입니다. 쉽게 말해 최대한 많은 경우의 수를 단순히 계산하고 확률이 높은 쪽으로 결정하는 ‘크고 빠른 컴퓨터’에 불과했다는 겁니다. 단순히 체스만 둘 수 있는 수퍼컴퓨터가 실생활에 응용될 가능성도 별로 없었죠.

하지만 IBM 과학자들은 더 큰 비전을 갖고 있었습니다. IBM 수석과학자 데이비드 페루치가 주도한 새 프로젝트는 ‘DeepQA’로 불렸는데 ‘자연어’로 제시된 질문에 대답할 수 있는 문답 시스템이었습니다. 컴퓨터의 언어가 아니라, 사람의 말을 듣거나 입력하면 답을 찾아서 알려주는 컴퓨터라는 겁니다. 얼핏 쉬워 보이지만 당시만 해도 획기적인 발상이었습니다. 네이버와 구글 같은 포털 사이트에서 검색어를 문장 형태로 집어 넣으면 ‘답’을 알려주는게 아니라 ‘답일 가능성이 높은’ 결과물과 여러가지 사이트를 주욱 늘어 놓습니다. 어떤 질문에 대해 사람이 ‘이것이 답’이라고 명확하게 매칭을 해놓지 않는다면 컴퓨터는 어느 것이 답이라도 확신할 수 있는 능력이 없었기 때문이죠. 그렇게 만들어진 AI가 바로 ‘왓슨(Watson)’입니다. 1914년 IBM을 세운 창업자이자 초대 최고경영자(CEO)였던 토머스 왓슨의 이름에서 따왔습니다. IBM이 이 프로젝트에 얼마나 큰 기대를 걸었는지 알 수 있습니다.

◇”생각하는 기계가 지식 산업 노동자를 해고할 것”

미국 헤지펀드 운용사 브릿지워터 어소시에이츠(Bridgewater Associates)는 슈퍼컴퓨터 왓슨을개발한 IBM 데이비드 페루치 박사를 영입, 인공 지능(AI)을 활용한 투자 시스템을 개발 중이다. 왓슨은 2011년 미국 ABC 텔레비전 퀴즈쇼 '제퍼디!(Jepardy!)'에서 인간과 대결해 압도적 점수차로 우승한 바 있다. 사진은 퀴즈쇼에 출연한 왓슨(가운데).

IBM은 왓슨을 대중에 공개하기 위해 치밀한 계획을 짰습니다. 미국인들에게 가장 인기 있는 퀴즈쇼 ‘제퍼디’에 왓슨을 출연시켜 인간 챔피언들과 경쟁하게 하고, 이를 전세계에 방영하겠다는 것이었습니다. 74연승을 기록했던 켄 제닝스, 역대 최다 상금 획득자인 브래드 루터가 파트너로 선택됐습니다. 2011년 2월 이틀에 걸쳐 방영된 제퍼디 결과는 충격적이었습니다. 왓슨은 7만7147달러의 상금을 획득해 2만4000달러의 제닝스와 2만1600달러의 루터를 압도하며 우승했습니다. 당시 왓슨의 성능은 1초에 80조번을 계산할 수 있고, 책 100만권을 읽은 뒤 토씨 하나까지 모두 완벽하게 인식하고 있었다고 합니다. 사회자가 질문을 던지면 왓슨은 인식한 단어를 동사, 목적어, 핵심 단어로 분류한 뒤 데이터베이스에서 검색합니다. 실제 사례를 하나 들어보겠습니다. “펨브로크 칼리지와 에마뉘엘 칼리지의 성전을 설계한 건축가는?”이라는 질문이 나오면 왓슨은 ‘펨브로크 칼리지’ ‘에마뉘엘 칼리지’ ‘건축가’를 검색합니다. 왓슨은 검색 결과에서 가장 많이 등장하는 건축가 5명을 추린 뒤, 이 건축가들을 다시 각각 검색합니다. 정답인 ‘크리스토퍼 렌’은 다른 건축가보다 ‘펨브로크 칼리지’, ‘에마뉘엘 칼리지’와 함께 검색될 확률이 높으니 정답 신뢰도가 높다고 판단하는 식입니다. 한번의 검색에 3초 정도가 걸렸다고 합니다. 물론 IBM 연구팀은 퀴즈쇼라는 상황에서 경쟁에 이길 수 있도록 왓슨에 여러 전략을 적용했습니다. 찾아낸 답이 신뢰도의 기준에 떨어진다고 판단하면 왓슨은 버저를 누르지 않았습니다. 이기고 있을 때는 신뢰도가 아주 높을 때만 답변했고, 지고 있을 때는 신뢰도가 좀 떨어져도 과감히 버저를 눌렀습니다. 제퍼디가 방영된 이후 IBM은 전세계 언론에 보도자료를 배포했습니다. “의료 진단, 비즈니스 분석과 기술 지원 같은 분야를 왓슨이 대체하는 미래가 IBM의 비전”이라고 했습니다. 콜센터 상담원, 학교 선생님도 왓슨이 대체할 수 있는 직업으로 언급됐습니다.

대결에서 패배한 제닝스는 기술전문 매체 슬레이트 기고글에서 “20세기에 새로운 조립 로봇에 의해 공장의 일자리가 사라진 것처럼 루터와 나는 ‘생각하는 기계’에 의해 직장에서 해고된 최초의 지식 산업 노동자’”라며 “퀴즈쇼 참가자는 왓슨이 해고한 첫 직원일지 모르지만, 마지막은 아닐 것으로 확신한다”고 했습니다. 물론 우리가 알고 있는 것처럼 세상은 IBM의 생각대로 흘러가지 않았습니다.

◇투자비 수십분의 1만 건지고 실패한 왓슨

메모리얼 슬론 케터링 암센터에서 의사가 IBM 인공지능 ‘왓슨’을 활용해 환자 상태를 진단하고 있는 모습.

왓슨이 등장한 지 10년이 지난 2021년 7월 미국 뉴욕타임스는 “왓슨의 원대한 비전은 사라졌고, 왓슨은 AI에 대한 과장과 오만함을 일깨우는 사례가 됐다”고 보도했습니다. IBM은 왓슨의 핵심 사업으로 의료(헬스케어)를 선택하고 ‘암 정복’을 선언했습니다. IBM은 인간은 상상할 수 없는 엄청난 데이터베이스를 보유하고 데이터를 실시간으로 분석해내는 왓슨이 인간 의사를 쉽게 뛰어넘을 수 있다고 자신했습니다. 의료기록과 논문 같은 데이터를 잔뜩 집어넣다보면 세상 어느 누구보다 더 많은 경험과 지식을 가진 수퍼의사가 될 수 있다는 것이죠. 왓슨은 뉴욕 메모리얼 슬로언 케터링 병원 암센터, 휴스턴 MD앤더슨 같은 세계 최고의 병원에 속속 도입됐고, 2017년에는 한국 가천대가 왓슨을 기반으로 한 인공지능암센터를 설립하기도 했습니다. 왓슨은 위암·폐암·유방암·대장암·난소암·자궁경부암·방광암·전립선암 등 8개 암 진단과 진료법 추천에서 성과를 보였고 국제학술지에 논문도 속속 출간됐습니다. 하지만 IBM의 진군은 딱 거기까지 였습니다. 뉴욕타임스는 “암 데이터는 IBM의 생각보다 훨씬 복잡했고, 잘못된 진단은 왓슨의 정확도를 높이는데에는 장애물이었다”고 평가했습니다. 정제된 논문이나 발표자료와 달리, 실제 현장 의료 데이터 상당수는 의사의 메모 형태로 이뤄지는데 이를 왓슨이 인식하고 축적하게 할 방법도 마땅치 않았습니다. 현장에서 왓슨을 사용해본 의사들과 환자들의 불만도 쏟아졌다고 합니다. 의사들은 왓슨이 제시한 진단과 진료법을 환자에게 공식적으로 추천하기를 꺼렸습니다. 환자에게 ‘AI가 내놓은 판단’이라거나 ‘내 생각과는 다르다’는 식으로 설명하기는 쉽지 않겠죠. 어차피 책임은 의사가 져야 하는데 말이죠. 결국 대형병원들은 엄청난 손실만 입은 채 속속 왓슨 프로젝트를 접었고, 암 정복이라는 IBM의 꿈도 산산조각이 났습니다. 올 1월 IBM은 사모펀드인 프란시스코파트너스에 의료AI 사업부 ‘왓슨 헬스’를 매각했습니다. IBM이 매각으로 건진 돈은 10억달러(약 1조4250억원) 정도로 추산되는데 IBM이 투자한 돈의 수십분의 1 수준인 것으로 알려져 있습니다.

◇알파고 쇼크의 시작

이세돌(오른쪽)과 아자황(알파고 대리 착점자)이 마주 앉은 챌린지 매치 현장. 세계적 관심 속에 치러졌던 이 대결 후 5년 동안 AI의 바둑에 대한 영향력은 갈수록 높아져 왔다. /한국기원

현재 전세계적으로 가장 폭넓게 활용되면서 연구가 활발한 AI 방식인 딥러닝(심층학습)은 왓슨과 다른 접근 방식을 택하고 있습니다. 딥러닝이 대중과 테크 산업에 알려진 결정적인 계기가 바로 2016년 프로 바둑기사 이세돌 9단과의 대결을 통해 등장한 구글 딥마인드의 AI ‘알파고(AlphaGo)’입니다. 알파고는 얼핏 ‘체스’와 ‘바둑’, ‘퀴즈쇼’ 같은 게임을 주제로 했다는 점에서 왓슨이나 딥블루와 비슷하게 느껴질 수 있습니다. 64개의 칸을 가진 체스에서 6종류의 말을 움직이는 경우의 수는 10의 120제곱입니다. 딥블루는 매초 2억개의 수를 분석하고, 20수 앞에 나올 수 있는 경우의 수를 모두 계산하는 방식으로 인간 챔피언을 꺾었습니다. 왓슨 역시 기본적으로 방대한 데이터베이스에서 가장 신뢰도가 높은 답을 빠르게 찾아내는 방식으로 작동했습니다. 반면 바둑은 돌을 놓는 착점(着點)이 361개인데, 첫 수를 주고받는 경우의 수만 12만9960가지가 됩니다. 361개점을 모두 채우려면 10의 170제곱 가지 경우의 수가 생기는데, 이를 다 계산하려면 수퍼컴퓨터로 수십억년이 걸립니다. 또 이기고 있는지 지고 있는지를 가르는 명확한 기준도 없고, 죽은 돌을 다시 활용할 수 있는 것처럼 규칙도 복잡합니다. 그래서 구글은 알파고에 ‘경험’을 훈련시켰습니다. 기존에 있는 기보 3000만개로 규칙을 가르친 뒤 하루에 3만번씩 스스로 대국을 진행하도록 했고, 그래픽 처리장치로 형세를 인식하는 방법도 배우게 했습니다. 그 결과 알파고는 인간 프로 기사들도 알 수 없는 새로운 길을 찾아내는가 하면, 경우의 수를 대폭 줄이는 방법도 스스로 찾아내게 됐습니다. 그 결과는 모두 아시다시피 인간을 뛰어넘는 AI의 탄생으로 이어졌습니다. 이듬해 구글은 중국 최강 커제 9단과의 대결에서는 아예 기존 기보를 학습하지 않고 스스로 바둑을 배우는 방법도 찾아냈습니다. 이제 바둑에서 사람과 AI의 대결은 별 의미가 없고, AI와 AI의 바둑 대결 정도만 관심으로 남아 있습니다.

◇여전히 AI에겐 벅찬 현실세계

(위) 의사가 AI로 암 환자의 영상을 판독하고 있다. 아래는 딥마인드 알파폴드가 분석한 단백질 구조. /애피디아·딥마인드

IBM이 왓슨의 상업화 목표로 의료시장을 개척하려고 했던 것처럼 구글 알파고도 알파고의 진출 분야를 사전에 정해 놓았습니다. 구글 딥마인드 창업자인 데미스 허사비스는 2017년 커제 9단을 이긴 직후 “더 이상 알파고가 바둑을 두는 일은 없을 것”이라고 선언했습니다. 대신 단백질 구조를 밝히거나 에너지 사용량을 획기적으로 절감하는 신소재 개발 같이 인류가 당면한 모든 문제를 해결하는게 활용할 것”이라고 했습니다. 실제로 알파고를 구글 데이터센터에 적용하자 전력 소모량이 40%나 줄었고, 알파고의 새로운 버전인 ‘알파폴드(AlphaFold)는 단백질의 3차원 구조를 빠르고 정확하게 예측하면서 주목받고 있습니다. 알파폴드는 지난 7월 지구상에서 발견된 2억여 개 단백질의 입체 구조 전체를 예측한 데이터를 공개했는데, 알파고 이전에 인간이 밝혀낸 단백질 접힘 구조는 20만개를 밑돌았습니다. 하지만 알파고가 과연 과학계와 사람들이 꿈꾸던 미래의 AI가 되기에는 아직 한계가 분명하다는 평가가 지배적입니다. 딥마인드는 ‘딥마인드 에너지’라는 팀을 만들어 영국 국영 내셔널그리드와 함께 영국 국가 전력 사용량을 10% 이상 줄이겠다고 했지만 얼마 지나지 않아 프로젝트팀이 해체됐습니다. 딥마인드가 개발했던 안과질환, 유방암 등을 진단하는 AI도 상업성 부족과 개인 정보 논란 등에 휩싸이면서 상용화되지 못하고 있습니다. 가장 큰 문제는 ‘노는 물이 다르다’라는 점입니다. 바둑판의 알파고와 구글 데이터센터의 알파고는 노는 물이 같습니다. 딥마인드가 예측 가능한 통제된 상황이라는 것이죠. 그 안에서는 완벽한 계산과 예측을 통해 AI가 원하는 뜻을 이룰 수 있습니다. 반면 영국 국가 전력망과 실제 환자 진단은 노는 물이 다릅니다. 알파고가 쌓은 데이터로는 예측조차 불가능한 현실 세계의 복잡성이 작용한다는 겁니다. 아무리 많은 번역 데이터를 갖고 있어도 배운적 없는 사투리나 목소리를 인식하기 힘든 사람을 만나면 무용지물이 되는 것과 마찬가지입니다.

◇AI에 목숨을 맡길 수는 없다

자율주행 자동차(무인차)에서 한 여성이 주행 중에 책을 읽고 있다. 테슬라와 구글 등이 추진하는 무인차 시대가 성큼 다가왔지만, 최종 상용화를 위해서는 윤리 문제 등 해결해야 할 과제도 적지 않다.

AI가 현실세계에 뛰어들기 힘들다는 것을 보여주는 사례는 또 있습니다. 글로벌 빅테크와 완성차 회사들은 이르면 2018년, 늦어도 2021년이면 완벽한 자율주행차가 도로를 달릴 것이라고 자신했습니다. 하지만 2022년이 다 지난 현재까지도 아직 제한된 극히 일부 지역에서만 자율주행차가 다니고 있을 뿐, 전면적인 자율주행차 시대는 시작될 기미조차 보이지 않고 있습니다. 장담하던 업체들은 이미 2025년 이후로 대부분 상용화 계획을 미뤄놓은 상황입니다. 얼마전 만난 자율주행업계 관계자는 “하드웨어보다는 AI 소프트웨어의 안전성을 담보하기 힘들다는 인식이 많다”고 했습니다. 사람처럼 판단하고 운전하면서 돌발상황에 대비할 수 있다면 하드웨어는 현재의 완성차를 그대로 쓰면 됩니다. 하지만 AI의 판단과 운전 기술에 목숨을 맡기기는 아직 무리라는 겁니다. 수많은 자동차를 만들고, 사람들의 운전습관을 연구했던 자동차 업체들도 여전히 현실 세계의 복잡성에 도전하기에는 자신이 없다는 얘기입니다. 전기차 대중화와 민간 우주 개발이라는 분야를 개척한 일론 머스크의 테슬라 역시 자율주행에 어려움을 겪기는 마찬가지입니다. 머스크가 테슬라 차량에 탑재한 AI자율주행 시스템은 수십건의 교통사고의 원인으로 지목돼 정부 조사를 받고 있습니다. 머스크는 트위터에 몇년째 “완전한 자율주행이 곧 된다”고만 쓰고 있죠.

◇반면교사가 될 선구자들

다만 간과해서는 안되는 부분이 있습니다. 시점은 계속 미뤄져도 AI가 발달하고 있는 것은 분명하다는 겁니다. AI 연구자들은 딥러닝에 대해 ‘현존하는 가장 강력한 AI 개발 방법이자 여전히 미래의 AI 기술’이라고 합니다. 대량의 데이터를 AI에 딥러닝 방식으로 학습시키면, 사진을 척척 구분해내고 음성도 분리해 냅니다. 부족한 데이터를 스스로 만들어내거나, 사람이 읽어내지 못했던 데이터의 숨은 뜻을 찾아내기도 합니다. 최근에는 기존 데이터에 없는 그림을 만들어내거나 글을 창작하고 음악도 작곡합니다. 이런 기술들은 모두 상용화돼 있고, 점차 고도화되고 있습니다. 필요한 데이터의 양을 획기적으로 줄이는 기술도 활발하게 연구되고 있습니다. 알파고의 구글은 물론 아마존, 페이스북, 삼성전자, LG전자 같은 글로벌 빅테크들이 딥러닝을 앞세워 AI제국 건설에 뛰어들었습니다. 수많은 AI스타트업이 이미 사라졌지만, 더 많은 AI스타트업이 지금 이 시간에도 탄생하고 있습니다. 인류의 역사를 되돌아보면 과학기술이 이뤄내는 혁신과 변화는 순식간에 획기적으로 일어나는 경우가 많습니다. 제임스 와트의 증기기관이 그랬고, 에디슨의 전구, 라이트형제의 비행기가 그랬습니다. AI가 현재 인류를 미래로 데려갈 가능성이 가장 높은 분야라는 점은 분명해 보입니다. 왓슨이 왜 실패했는지, 알파고와 자율주행차는 어떤 어려움에 부딪혀 있는지 선구자들을 반면교사로 삼는다면 그 가능성을 더 높일 수 있겠죠.

박건형의 홀리테크 뉴스레터 구독하기 ☞ https://page.stibee.com/subscriptions/80905

이 기사에 대해 어떻게 생각하시나요?

조선일보에서 직접 확인하세요. 해당 언론사로 이동합니다.