스스로 얘기하지 않는 데이터[내가 만난 名문장/김용대]

김용대 서울대 통계학과 교수·데이터 과학자 2022. 11. 14. 03:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

"숫자들은 스스로 얘기하지 않는다. 대신해서 우리가 얘기해준다. 우리가 숫자들에게 의미를 부여한다."―네이트 실버의 '신호와 소음' 중에서 데이터 과학은 데이터로부터 새로운 가치를 찾아내는 학문이다.

데이터 과학자 네이트 실버가 숫자들에 우리가 의미를 부여한다고 했듯이, 데이터의 가치는 인간이 결정한다.

음악이 소리에 의미를 부여하듯이, 데이터 과학은 데이터에 의미를 부여한다.

MZ세대, 인구절벽 등 우리 사회의 자화상들은 데이터 과학의 작품과도 같다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

김용대 서울대 통계학과 교수·데이터 과학자
“숫자들은 스스로 얘기하지 않는다. 대신해서 우리가 얘기해준다. 우리가 숫자들에게 의미를 부여한다.”

―네이트 실버의 ‘신호와 소음’ 중에서


데이터 과학은 데이터로부터 새로운 가치를 찾아내는 학문이다. 데이터 과학자 네이트 실버가 숫자들에 우리가 의미를 부여한다고 했듯이, 데이터의 가치는 인간이 결정한다. 이러한 면에서 데이터 과학은 예술이다. 음악이 소리에 의미를 부여하듯이, 데이터 과학은 데이터에 의미를 부여한다. MZ세대, 인구절벽 등 우리 사회의 자화상들은 데이터 과학의 작품과도 같다. 더 나아가 데이터 과학은 종합예술이다. 문제에 대한 깊은 이해와 데이터 분석에 대한 전문 이론 등이 잘 어우러지면 훌륭한 작품이 나오기 때문이다. 예컨대 루돌프 줄리아니 전 뉴욕시장은 1994년 취임 직후 범죄 관련 데이터 분석 시스템을 도입해 범죄예방 정책에 적용한 결과 사임 당시 뉴욕시의 범죄율이 7.6%나 하락했다.

데이터 과학은 또한 예술인 동시에 과학이다. 예술 작품은 관련 전문가나 대중에 의해서 평가받지만, 데이터 과학의 작품은 정확성으로 평가받는다. 데이터 기반 미래 예측은 시간이 지나가면서 언젠가는 그 예측의 진위를 알 수 있기 때문이다. 그 예측은 인구가 지수적으로 폭발해서 인류가 망한다는 18세기 맬서스의 인구론처럼 자주 빗나가기도 한다.

이태원 참사를 보면서 데이터 과학자로서 많은 생각을 하게 된다. 너무 많은 사람이 좁은 공간에 모여 있다는 것을 폐쇄회로(CC)TV나 지하철 승객 현황 등의 데이터는 알고 있었을 것이다. 허나 우리가 의미를 부여하지 않아서 참사를 막지 못했다. 데이터에 애정이 없었거나 결과를 왜곡했거나, 아니면 우리가 너무 게을러서가 아닐까, 그 이유를 생각해본다. 젊은 영혼에 진 빚을 어떻게 갚아야 할지 고민이 되는 가을이다.

김용대 서울대 통계학과 교수·데이터 과학자

Copyright © 동아일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?