통계학, 기계를 진화시키다 [생활 속, 수학의 정석]

2025. 10. 10. 04:32
음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

ⓒ게티이미지뱅크

인류는 돌도끼를 발명한 이래 한 순간도 쉬지 않고 기술적 진보를 이루어 왔다. 이제 산업혁명에 이어 인공지능에 의한 또 한 번의 기술 혁명의 시대를 맞이하고 있다. 인류가 축적해 온 많은 기술적 진보 중에서, 인공지능(AI) 시대를 앞당긴 가장 중요한 혁명적 발상은 무엇이었을까.

보통의 인공지능 교육과정에서는 1957년 프랭크 로젠블랫(Frank Rosenblatt)이 고안한 최초의 신경망인 '퍼셉트론'(perceptron)을 그 시원으로 거론한다. 그러나 보다 큰 눈으로 기술 발전의 역사를 살펴보면, AI기술 발전에 있어서 가장 중요한 사건은, 1859년 다윈이 진화론을 주창한 사건이다.

심층 신경망을 비롯한 AI에서의 중요한 기술적 요소들은 모두 회귀분석에 그 뿌리를 두고 있다. 회귀분석 혹은 회귀분석과 관련된 최소제곱법을 적용한 연구 사례는 뉴튼이나 가우스에까지 거슬러 올라간다. 그러나 본격적으로 회귀분석 방법에 대하여 연구하고, 이를 활용한 것은 1886년 경 프랜시스 갤튼(Francis Galton)에서부터다. 갤튼은 부모의 키를 이용하여 자식의 키를 예측하기 위한 통계적 방법을 고안하였다. 또 그 방법을 회귀분석(regression)이라 명명하였다. 진화론에서 생물의 각 종은 그 모습이 지속적으로 변화되고, 생존하거나 사멸하기도 한다. 갤튼이 부모와 자식 사이의 키의 관계를 연구한 것은 진화론의 당연한 전개였다. 특히나 갤튼은 다윈의 외사촌 동생이었고, 생애의 학문적 여정에서 다윈의 진화론에 크게 영향을 받았다.

이후 회귀분석은 갤튼의 제자들을 주축으로 한 통계학자들에 의하여 다양한 형태로 발전하였다. 초기 회귀분석에서 예측대상이 되는 변수는 자식의 키와 같이 양적 특성을 가진 변수였다. 1970년대에 들어 통계학자들은 회귀분석 방법을 확장하여 예측대상이 되는 변수를 남녀 성별, 혹은 생물의 종류와 같이 질적 특성을 가진 변수에도 적용할 수 있는 방법을 고안하였다.

지금 보면 매우 단순한 방법이다. 예측 값을 산출하는 마지막 단계에서 로지스틱함수나 다차원 로지스틱함수를 적용하여 최종 예측값을 산출하는 방법이다. 신경망에서는 이를 시그모이드, 혹은 소프트맥스함수라고 부르고, 이런 유형의 함수를 일반화하여 활성함수라고 통칭한다. 로지스틱함수 대신 하이퍼탄젠트함수를 사용해도 마찬가지다. 회귀분석에 활성함수를 적용하는 방법으로, 회귀와 분류가 통합되었고, 심층신경망의 뼈대가 완성된 것이다.

다윈의 진화론에 영향을 받아 생물의 진화를 연구하기 위하여 통계학이 시작되었고, 통계학이 발전하여 기계인 컴퓨터를 진화시키고, 인공지능의 시대를 열고 있다.

이윤동 서강대 경영학부 교수(통계학)

Copyright © 한국일보. 무단전재 및 재배포 금지.