통계학, 기계를 진화시키다 [생활 속, 수학의 정석]

인류는 돌도끼를 발명한 이래 한 순간도 쉬지 않고 기술적 진보를 이루어 왔다. 이제 산업혁명에 이어 인공지능에 의한 또 한 번의 기술 혁명의 시대를 맞이하고 있다. 인류가 축적해 온 많은 기술적 진보 중에서, 인공지능(AI) 시대를 앞당긴 가장 중요한 혁명적 발상은 무엇이었을까.
보통의 인공지능 교육과정에서는 1957년 프랭크 로젠블랫(Frank Rosenblatt)이 고안한 최초의 신경망인 '퍼셉트론'(perceptron)을 그 시원으로 거론한다. 그러나 보다 큰 눈으로 기술 발전의 역사를 살펴보면, AI기술 발전에 있어서 가장 중요한 사건은, 1859년 다윈이 진화론을 주창한 사건이다.
심층 신경망을 비롯한 AI에서의 중요한 기술적 요소들은 모두 회귀분석에 그 뿌리를 두고 있다. 회귀분석 혹은 회귀분석과 관련된 최소제곱법을 적용한 연구 사례는 뉴튼이나 가우스에까지 거슬러 올라간다. 그러나 본격적으로 회귀분석 방법에 대하여 연구하고, 이를 활용한 것은 1886년 경 프랜시스 갤튼(Francis Galton)에서부터다. 갤튼은 부모의 키를 이용하여 자식의 키를 예측하기 위한 통계적 방법을 고안하였다. 또 그 방법을 회귀분석(regression)이라 명명하였다. 진화론에서 생물의 각 종은 그 모습이 지속적으로 변화되고, 생존하거나 사멸하기도 한다. 갤튼이 부모와 자식 사이의 키의 관계를 연구한 것은 진화론의 당연한 전개였다. 특히나 갤튼은 다윈의 외사촌 동생이었고, 생애의 학문적 여정에서 다윈의 진화론에 크게 영향을 받았다.
이후 회귀분석은 갤튼의 제자들을 주축으로 한 통계학자들에 의하여 다양한 형태로 발전하였다. 초기 회귀분석에서 예측대상이 되는 변수는 자식의 키와 같이 양적 특성을 가진 변수였다. 1970년대에 들어 통계학자들은 회귀분석 방법을 확장하여 예측대상이 되는 변수를 남녀 성별, 혹은 생물의 종류와 같이 질적 특성을 가진 변수에도 적용할 수 있는 방법을 고안하였다.
지금 보면 매우 단순한 방법이다. 예측 값을 산출하는 마지막 단계에서 로지스틱함수나 다차원 로지스틱함수를 적용하여 최종 예측값을 산출하는 방법이다. 신경망에서는 이를 시그모이드, 혹은 소프트맥스함수라고 부르고, 이런 유형의 함수를 일반화하여 활성함수라고 통칭한다. 로지스틱함수 대신 하이퍼탄젠트함수를 사용해도 마찬가지다. 회귀분석에 활성함수를 적용하는 방법으로, 회귀와 분류가 통합되었고, 심층신경망의 뼈대가 완성된 것이다.
다윈의 진화론에 영향을 받아 생물의 진화를 연구하기 위하여 통계학이 시작되었고, 통계학이 발전하여 기계인 컴퓨터를 진화시키고, 인공지능의 시대를 열고 있다.

이윤동 서강대 경영학부 교수(통계학)
Copyright © 한국일보. 무단전재 및 재배포 금지.
- 대통령 기자회견서 '다리 꼰' 참모들...역대 정권과 비교해 보니 | 한국일보
- "이혼 후 양육권 빼앗겨"... 슈주 신동, 15년 전 결혼 발표 진실 고백 | 한국일보
- 자유와 민폐 사이… '상탈족' '런라니' 어쩌면 좋을까요 | 한국일보
- 윤석열·김건희 잡고 VIP 격노 규명… 3대 특검 성과·과제 몰아보기 | 한국일보
- “술은 마셨지만 운전은 가능했다” 10대 소년 치어 숨지게 한 음주운전자 중형 | 한국일보
- 세계로 뻗는 한국어, 정작 강사 월급은 절반 200만 원 이하 | 한국일보
- "날 깨우지 말아 줘"…연휴에 밀린 잠 실컷 자도 괜찮을까 | 한국일보
- '건국전쟁2' 본 장동혁에… 오영훈 제주지사 "제주도민 모욕 책임져야" | 한국일보
- "화학적 거세 안 했다"... 임형주, 루머 정면 반박 | 한국일보
- 섬마을 작은 결혼식, 인구 소멸 위기 '지심도'에 희망을 심다 | 한국일보