모르는 것조차 모르는 세계로 갈 수 있다면
이철희 박사는 고등과학원 수학난제연구센터에 근무한다. 여기서 ‘수학 난제’란 문자 그대로 ‘수학의 어려운 문제’를 뜻한다. 인터넷으로 검색해보면 ‘8차원에서 공을 가장 밀도 있게 쌓는 방법’이라든가 ‘모든 짝수가 소수 두 개의 합으로 표현될 수 있는지 증명하라’ 같은 난제들이 뜬다. 문제 자체를 이해하기 힘들다. 이철희 연구원을 만나자마자 “수학 난제를 연구해야 하는 이유는 무엇인가”라고 질문하면서 인터뷰가 시작되었다.
“미국의 전 국방장관인 럼스펠드의 말을 빌리면 ‘지식’이란 ‘안다는 것을 아는 상태’ ‘모른다는 것을 아는 상태’ ‘모른다는 것조차 모르는 상태’로 분류할 수 있다. 이라크 침공을 정당화하는 맥락에서 사용한 말이지만 지식에 대해서는 절묘한 비유라고 할 수 있다. 학교에서 가르치는 지식은 대체로 ‘안다는 것을 아는’ 종류의 것이다. 그런데 세상엔 ‘모른다는 것조차 모르는’ 것이 너무나 많다. ‘지식의 공간’을 가정하고, 여기 원이 하나 있다고 치자. 원의 내부가 ‘안다는 것을 아는 지식’이라면 원의 외부는 ‘모른다는 것조차 모르는’ 것으로 충만한 공간이다. 인간은 원의 바깥으로 나아가고 싶어 한다. 그 방법은 질문을 하면서 원과 바깥 세계의 경계로 끊임없이 접근하는 것밖에 없다. ‘난제 연구’란, 우리가 모른다는 것조차 모르는 어떤 세계에 도달하기 위한 노력의 일환이라고 볼 수 있다.”
‘8차원에서 공 쌓기’ 같은 질문들을 보면 좀 황당한 느낌이 든다.
‘3차원에서 공 쌓기’부터 생각해보자. 사실 잘 쌓는 방법은 이미 알려져 있다(밑의 공 3개로 위의 공 한 개를 받치면 된다). 과일 가게를 하는 분들은 경험을 통해 너무나 잘 알고 있다. 그러나 그 방법이 가장 효율적이라는 사실을 수학적으로 증명하는 데엔 17세기 초(요하네스 케플러가 제기)부터 20세기 말(미국 수학자 토머스 헤일스)까지 400년 가까이 걸렸다. 그 이후 자연스럽게 4차원, 5차원에서의 공 쌓기라는 문제가 나오게 된다. 그런데 4차원, 5차원보다 8차원에서의 공 쌓기가 2016년에 먼저 해결되었다. 사실 8차원에서 공 쌓는 방법을 안다고 우리 삶에 당장 도움이 되는 것은 아니다. 그러나 이런 종류의 질문은 넓게 보면 인공지능 기술과도 관계가 있다. 인공지능(머신러닝)은 결국, 특정한 꼴을 갖는 수많은 함수 중에서 데이터를 가장 잘 설명해주는 함수를 찾는 최적화 문제다. 공 쌓기 역시 공을 쌓는 무한히 많은 방법 가운데 가장 좋은 것을 찾는다는 측면에서 일종의 최적화 문제다.
이쯤에서 잠시 머신러닝이 “수많은 함수 중에서 데이터를 가장 잘 설명해주는 함수를 찾는 최적화 문제”라는 그의 말을 짚고 넘어갈 필요가 있다. 키와 몸무게 사이의 관계(함수)를 알아내기 위해 남성 5명의 데이터를 수집했다고 치자. 그들의 키와 몸무게는 각각 ‘160㎝, 63㎏’ ‘165㎝, 73㎏’ ‘170㎝, 72㎏’ ‘175㎝, 80㎏’ ‘180㎝, 90㎏’이다. 〈그림 1〉에 검은 점으로 표시됐다.
초록·파란색의 직선도 있다. 이 선들은 특정 키에 어떤 몸무게가 대응하는지 나름대로 설명한 ‘예측선’인데, 방정식(각각의 기울기와 절편을 가진)으로도 표현된다. 초록·파란색 선 이외에도 수많은 선을 그릴 수 있다. 위 데이터들의 관계를 설명하는 “수많은 함수”가 존재한다는 의미다. 그런데 어떤 선이 “데이터를 가장 잘 설명해주는” ‘최적’의 함수일까?
일단 초록색 선을 보자. 키가 160㎝일 때 실제 몸무게는 63㎏이지만 68㎏으로 ‘예측’한다. 180㎝ 키의 예측 몸무게는 실제(90㎏)보다 15㎏이나 적은 75㎏이다. 예측이 터무니없이 틀렸다.
이런 예측 값과 실제 값의 차이를 ‘오차(초록색 선 주변의 빨간 선)’라고 부른다. 오차를 줄이는 방향으로 초록색 선을 수정해(기울기와 절편을 바꿔) 나가야 한다. 수정 작업을 반복하다 보면 어느 순간 오차를 더 이상 줄일 수 없는 선을 그리게 된다. 이 선이 바로 오차를 최소화한 ‘최적의 함수'다.
〈그림 2〉는 〈그림 1〉에 나타나는 직선의 기울기와 오차 사이의 관계를 표현한 것이다. 오차가 가장 작을 때의 기울기를 반영해서 만든 함수가 바로 〈그림 1〉의 파란색 선이다. 이 과정에서 미분이 사용된다.
‘최적의 함수’인 파란색 선 역시 아주 정확하게 맞히지는 못한다. 키가 160㎝인 남성의 몸무게를 63.4㎏으로 ‘예측’하는데 실제로는 63㎏이다. 그러나 〈그림 1〉에 그릴 수 있는 “수많은 선 가운데서는 데이터를 가장 잘 설명해주는 함수”라고 할 수 있다.
머신러닝은 이런 방식으로 연산을 반복하며 ‘최적의 선’을 찾아나가는데, 이런 작업을 ‘선형회귀’라고 부른다. 이철희 박사는 첨단산업인 인공지능에 사용되는 이 최적화 기법에 대해 “17세기의 과학자 뉴턴이 개발한 미·적분학(함수의 최대·최소값을 구하는 학문)을 크게 웃도는 수준이 아니다”라고 말했다.
미·적분학 역시 뉴턴 당시엔 ‘수학 난제’였겠다.
뉴턴이 인공지능을 염두에 두지는 않았을 터이다. 당대의 ‘난제’를 해결하려다 보니 미·적분학을 개발하게 되지 않았을까? 인간의 삶은 결국 수학을 자연스럽게 필요로 하게 된다는 게 나의 기본적 생각이다. 인간의 보편적 문제 중 하나는, ‘우리가 알 수 있는 것’과 ‘알고 싶은 것’ 사이에 있는 괴리다. 몸이 아플 때 우리는 감각을 통해 ‘내가 아프다’는 것을 안다. 그러나 ‘왜 아픈지’를 알지는 못한다. ‘감각으로 알 수 있는 것’과 ‘궁극적으로 알고 싶은 것’ 사이의 괴리다. 이런 종류의 문제들을 해결하기 위한 인류의 노력 중 크게 성공한 방식이 있다. ‘쉽게 직접 측정할 수 있는 것’을 먼저 알아낸 다음, 그것과 ‘알고 싶은 것’과의 관계를 이용해 계산하는 방식이다. 예컨대 과학의 개념들은 많은 경우, 수로 표현된다. 나아가 개념들 사이의 관계가 수식으로 나타난다.
그러나 수식은 무섭다(웃음).
수식이란 것을 곰곰이 생각해보면 재미있는 사실을 발견할 수 있다. 수식이란 보통 등호(=)를 중심으로 왼쪽과 오른쪽에 다른 개념들이 배치되어 있다. 핵에너지의 원리를 설명하는 아인슈타인의 그 유명한 공식(E=mc²)을 예로 들면 등호의 왼쪽엔 에너지(E), 오른쪽엔 질량(m)이라는 개념이 들어가 있다. 이제 등호의 한쪽에 있는 것을 알면 다른 쪽의 개념에도 접근할 수 있게 된다. 즉, 우리의 지각(감각)으로 알 수 있는 한쪽을 직접 측정할 수 있다면 그 결과를 수학적으로 ‘계산’해서 다른 쪽(우리가 감각으로 접근하지 못하는)을 알아내게 되는 것이다. 굉장히 흥미로운 현상 아닌가? 에라토스테네스도 그 옛날에 이런 방식으로 지구의 둘레를 알아냈던 것이다. 등호는 서로 다른 세계들을 이어주는 다리다. 수학은 인간의 감각을 확장하는 학문이다.
인공지능에 사용되는 최적화 기법이 17세기에 개발된 미·적분학에서 비롯되었다고 말했다. 첨단산업에 활용되는 수학이라면 엄청나게 어려운 ‘고등수학’일 것 같다고 느껴진다.
언제나 그렇지는 않다. 요즘 자동차 운전자들은 GPS를 활용한 내비게이션으로 자신의 위치를 알 수 있다. 그런데 GPS 위성의 수는 수십 대에 불과하다. 얼마 안 되는 GPS 위성들이 지구에 굴러다니는 자동차 수십억 대에 일일이 ‘너는 어떤 위치에서 운전하고 있다’고 알려줄 수는 없다는 이야기다. GPS 위성이 지상으로 보내는 것은 ‘내(위성)가 어떤 위치에 있다’라는 정보다. 이 정보를 지상의 자동차들이 받아 계산하면 ‘내 자동차가 어디에 있다’라는 결과가 나온다. 복잡할 것 같지만, 이 문제를 풀기 위해 필요한 도구는 고등수학이 아니라 연립방정식이다.
연립방정식은 중·고교에서 배우는데?
인공지능, 암호화폐, 양자 컴퓨터 같은 최근 부상하는 첨단기술도 마찬가지다. 인공지능의 경우 미·적분이나 선형대수(행렬, 벡터)를 어느 정도 공부하면 기술적 원리를 이해할 수 있다. 암호화폐의 경우, 초보적인 수준의 암호학이 필요하다. 초등학교에서 배우는 약수와 배수, 소수 같은 기초적인 정수론으로 시작할 수 있다. 양자역학이나 양자 정보 이론은 선형대수나 기초적인 미분방정식으로 입문할 수 있다. 수학을 어느 정도 알면 마냥 복잡하고 까다로워 보이는 첨단기술들을 완전히 이해하지 못할 염려는 없다. 인공지능 역시 꽤 어렵고 복잡해 보이지만, 어떻게 보면 ‘평면에 여러 개 점들이 찍혀 있는데, 이 점들 사이를 제일 그럴듯하게 지나는 직선을 하나 찾으라’는 문제에서 아주 떨어져 있지는 않다.
아주 예전부터 ‘통계학 개론’ 교과서에 등장하는 선형회귀다.
인공지능 기술을 이해하기 위해 초기에 공부해야 하는 주제가 바로 선형회귀다. 이 개념을 이해해야 인공지능이라는 첨단기술의 본질에 접근할 수 있다. 고리타분한 선형회귀가 머신러닝이란 옷을 입고 세상에 다시 등장한 것이다. 중·고등학교 수학 시간에 우리는 두 점을 지나는 직선의 기울기를 구하는 경험을 한다. ‘세상에 이런 게 무슨 필요?’라고 묻는 사람도 있지만, 여기서부터 인공지능을 공부할 수도 있는 것이다.
앞으로 인공지능 기술이 지배하는 세계가 온다고 해도, 누구나 인공지능 기술을 쉽게 사용할 수 있는 도구들이 나올 것이기 때문에 어렵게 수학까지 공부하면서 그 원리를 이해하려고 노력하지 않아도 된다는 의견도 있다.
맞기도 하고 틀리기도 한 주장이다. 자동차 운전면허를 따기 위해 ‘내연기관 공학’을 공부한 다음 ‘열역학’으로 넘어갔다가 ‘통계물리학’까지 공부할 필요는 없다. 이런 방식으론 면허를 따지 못한다. 그러나 세상에는 자동차를 사용하는 사람만 있는 게 아니다. 모두 운전면허를 따는 정도에 만족한다면, 누가 자동차의 본질과 원리를 알고 이를 개선하거나 새로운 발명을 할 것인가. 앞의 주장은 수학에 대한 두려움 때문에 인공지능이 무엇인지 알려는 의지조차 갖기 힘든 사람들을 응원할 때는 좋은 말이다. 그러나 이런 생각이 너무 보편화되면, ‘행렬이나 미·적분처럼 쓸모없는 것 말고 인공지능이나 가르치자’라는 그릇된 주장이 나오게 된다. 지금의 첨단기술이 옛날 수학자들이 이해하고 있던 수학에서 크게 벗어난다고 할 수는 없기 때문이다.
이종태 선임기자 peeker@sisain.co.kr
▶좋은 뉴스는 독자가 만듭니다 [시사IN 후원]
©시사IN, 무단전재 및 재배포 금지
Copyright © 시사IN. 무단전재 및 재배포 금지.