스스로 얘기하지 않는 데이터[내가 만난 名문장/김용대]
김용대 서울대 통계학과 교수·데이터 과학자 2022. 11. 14. 03:02
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
"숫자들은 스스로 얘기하지 않는다. 대신해서 우리가 얘기해준다. 우리가 숫자들에게 의미를 부여한다."―네이트 실버의 '신호와 소음' 중에서 데이터 과학은 데이터로부터 새로운 가치를 찾아내는 학문이다.
데이터 과학자 네이트 실버가 숫자들에 우리가 의미를 부여한다고 했듯이, 데이터의 가치는 인간이 결정한다.
음악이 소리에 의미를 부여하듯이, 데이터 과학은 데이터에 의미를 부여한다.
MZ세대, 인구절벽 등 우리 사회의 자화상들은 데이터 과학의 작품과도 같다.
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
“숫자들은 스스로 얘기하지 않는다. 대신해서 우리가 얘기해준다. 우리가 숫자들에게 의미를 부여한다.”
―네이트 실버의 ‘신호와 소음’ 중에서
데이터 과학은 데이터로부터 새로운 가치를 찾아내는 학문이다. 데이터 과학자 네이트 실버가 숫자들에 우리가 의미를 부여한다고 했듯이, 데이터의 가치는 인간이 결정한다. 이러한 면에서 데이터 과학은 예술이다. 음악이 소리에 의미를 부여하듯이, 데이터 과학은 데이터에 의미를 부여한다. MZ세대, 인구절벽 등 우리 사회의 자화상들은 데이터 과학의 작품과도 같다. 더 나아가 데이터 과학은 종합예술이다. 문제에 대한 깊은 이해와 데이터 분석에 대한 전문 이론 등이 잘 어우러지면 훌륭한 작품이 나오기 때문이다. 예컨대 루돌프 줄리아니 전 뉴욕시장은 1994년 취임 직후 범죄 관련 데이터 분석 시스템을 도입해 범죄예방 정책에 적용한 결과 사임 당시 뉴욕시의 범죄율이 7.6%나 하락했다.
데이터 과학은 또한 예술인 동시에 과학이다. 예술 작품은 관련 전문가나 대중에 의해서 평가받지만, 데이터 과학의 작품은 정확성으로 평가받는다. 데이터 기반 미래 예측은 시간이 지나가면서 언젠가는 그 예측의 진위를 알 수 있기 때문이다. 그 예측은 인구가 지수적으로 폭발해서 인류가 망한다는 18세기 맬서스의 인구론처럼 자주 빗나가기도 한다.
이태원 참사를 보면서 데이터 과학자로서 많은 생각을 하게 된다. 너무 많은 사람이 좁은 공간에 모여 있다는 것을 폐쇄회로(CC)TV나 지하철 승객 현황 등의 데이터는 알고 있었을 것이다. 허나 우리가 의미를 부여하지 않아서 참사를 막지 못했다. 데이터에 애정이 없었거나 결과를 왜곡했거나, 아니면 우리가 너무 게을러서가 아닐까, 그 이유를 생각해본다. 젊은 영혼에 진 빚을 어떻게 갚아야 할지 고민이 되는 가을이다.
―네이트 실버의 ‘신호와 소음’ 중에서
데이터 과학은 데이터로부터 새로운 가치를 찾아내는 학문이다. 데이터 과학자 네이트 실버가 숫자들에 우리가 의미를 부여한다고 했듯이, 데이터의 가치는 인간이 결정한다. 이러한 면에서 데이터 과학은 예술이다. 음악이 소리에 의미를 부여하듯이, 데이터 과학은 데이터에 의미를 부여한다. MZ세대, 인구절벽 등 우리 사회의 자화상들은 데이터 과학의 작품과도 같다. 더 나아가 데이터 과학은 종합예술이다. 문제에 대한 깊은 이해와 데이터 분석에 대한 전문 이론 등이 잘 어우러지면 훌륭한 작품이 나오기 때문이다. 예컨대 루돌프 줄리아니 전 뉴욕시장은 1994년 취임 직후 범죄 관련 데이터 분석 시스템을 도입해 범죄예방 정책에 적용한 결과 사임 당시 뉴욕시의 범죄율이 7.6%나 하락했다.
데이터 과학은 또한 예술인 동시에 과학이다. 예술 작품은 관련 전문가나 대중에 의해서 평가받지만, 데이터 과학의 작품은 정확성으로 평가받는다. 데이터 기반 미래 예측은 시간이 지나가면서 언젠가는 그 예측의 진위를 알 수 있기 때문이다. 그 예측은 인구가 지수적으로 폭발해서 인류가 망한다는 18세기 맬서스의 인구론처럼 자주 빗나가기도 한다.
이태원 참사를 보면서 데이터 과학자로서 많은 생각을 하게 된다. 너무 많은 사람이 좁은 공간에 모여 있다는 것을 폐쇄회로(CC)TV나 지하철 승객 현황 등의 데이터는 알고 있었을 것이다. 허나 우리가 의미를 부여하지 않아서 참사를 막지 못했다. 데이터에 애정이 없었거나 결과를 왜곡했거나, 아니면 우리가 너무 게을러서가 아닐까, 그 이유를 생각해본다. 젊은 영혼에 진 빚을 어떻게 갚아야 할지 고민이 되는 가을이다.
김용대 서울대 통계학과 교수·데이터 과학자
Copyright © 동아일보. 무단전재 및 재배포 금지.
이 기사에 대해 어떻게 생각하시나요?
동아일보에서 직접 확인하세요. 해당 언론사로 이동합니다.
- 美 “北도발 계속땐 동북아 미군 강화”
- 尹-기시다 “징용 조속 해결” 공감… “소통 지속” 관계개선 속도
- [박제균 칼럼]참사를 수단으로 삼지 않는 예의
- [단독]남욱 “유동규, ‘진상이 형 통해 이재명 시장에 의사 전달’ 말해”
- 바이든 “韓기업, 美경제 기여… IRA이행방안 마련때 고려”
- 리커창 “中, 한반도 비핵화 위해 건설적 역할”
- 서울 침수 신고 상위10곳 중 ‘위험’ 지정은 4곳뿐
- [단독]국세청, ‘법인세 누락’ MBC에 520억 추징금
- 빅3 거래소 FTX 파산 ‘코인판 리먼사태’ 경보
- 野 “참사 국조 거부땐 광장서 투쟁” 與 “이재명 방탄 길거리 정치”