[인터뷰] 수학의 눈으로 사회를 이해하는 데이터 과학자

김미래 기자 2021. 9. 11. 06:00
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

차미영 KAIST 교수 겸 IBS 수리 및 계산과학 연구단 데이터 사이언스 그룹 CI
KAIST 제공

아시아 최초의 페이스북 데이터 사이언스팀 초빙교수’, ‘최초의 IBS 여성 CI’, ‘최초의 젊은정보과학자상 여성 수상자'.  데이터 과학으로 사회 문제를 해결하는 차미영 KAIST 전산학부 교수(IBS 수리 및 계산과학 연구단 데이터 사이언스 그룹 CI)에게 따라다니는 타이틀입니다. ‘가짜뉴스 탐지’와 같은 우리 삶과 밀접한 사회 현상을 인공지능(AI)을 이용해 분석하는 차 교수는 “마음을 강하게 이끄는 흥미로운 연구 주제를 선택해 최선을 다하다 보니 새로운 길을 최초로 걸어올 수 있던 것 같다”라고 말합니다.  차 교수를 대전 유성 KAIST에서 만났습니다. 

Q 처음 수학에 관심이 생겼을 때가 언제인가요. 

어릴 때 춘천에서 친구들과 뛰놀며 지냈어요. 과학고에 들어가서야 제대로 된 수학을 접하게 됐습니다. 저와 달리 과학고에 입학한 친구들은 수학 진도가 빨랐습니다. 그래서인지 처음 수업엔 무슨 말을 하는지 알아들을 수 없었습니다. 그러다가 1주, 2주가 지나고 어느새 고개가 끄덕여졌던 것 같습니다. 이때 수학도 언어와 같다는 생각이 들었고 수학이란 학문에 흥미를 느끼기 시작했습니다. 주변에 똑똑한 친구들이 많아서 첫 수학 시험에서 꼴찌를 하기도 했지만, 열심히 공부하니 점차 실력이 늘었습니다. 수학 공부를 다른 친구보다 늦게 시작해서인지 배우는 모든 것이 재미있고 신기해서 수학 공부를 열심히 했습니다.

Q 전산학을 전공으로 선택한 이유는 무엇인가요.

어릴 때부터 핵물리학을 전공하신 아버지에게서 초신성폭발, 중성자별, 펄스에 관한 얘기를 자주 들었어요. 너무 흥미로운 분야로 여겨져 천체물리학을 공부하고 싶다는 꿈을 갖게 됐습니다.  그러던 중 과학고에서 2학년 때 조기 졸업을 하고 KAIST에 진학하게 됐습니다. 2학년때 학과를 정하려 보니 그제서야 KAIST에 천문학과가 없다는 사실을 알게 됐습니다. 전공 선택을 놓고 고민하던 제게 아버지께서 전산학을 공부하면 나중에 다양한 분야로 나갈 수 있다고 말씀해주시며 전산학과를 권하셨어요. 지금 와서 보니 차선책이라 생각했던 전산학이 지금 제가 연구하는 데이터 과학으로 이어져 딱 맞는 선택이었다고 생각합니다.

Q 데이터 과학이란 어떤 학문입니까. 

컴퓨터 과학과 수학의 융합 분야로, 데이터를 살피는 과정의 추상적이고 근본적인 원리를 연구하는 학문입니다. 지금은 사람의 눈으로 이해할 수 있는 수준을 넘어선 어마어마한 양의 데이터를 깊이 있게 분석할 수 있도록 해주는 모든 기술을 일컫습니다. 최근 가장 큰 관심을 받는 응용 학문이자 현대 사회의 핵심 학문 중 하나라고 볼 수 있습니다. 세계적인 기업인 구글, 페이스북 등의 플랫폼은 물론이고 로봇에서 사용될 정도로 데이터 과학이 쓰이지 않는 곳이 없습니다.

Q 가장 기억에 남는 연구가 있다면 무엇인가요?

박사과정 시절 당시 곽해운 싱가포르경영대 컴퓨터정보시스템학부 교수, 안용열 미국 인디애나대 교수와 함께 진행한 유튜브 동영상의 멱법칙 분포 분석을 다룬 연구가 기억에 남습니다. 일반적인 멱법칙 분포도에서는 ‘꼬리’ 부분이 긴 형태로 유지돼야 하지만, 유튜브 동영상을 특정 부분이 가파르게 꺾여 있었습니다. 이 원인을 분석했더니 접근성이 떨어지는 페이지로 인해 나타나는 것으로 보였습니다. 사용자의 취향에 맞춰 영상을 추천하는 개인화 알고리즘을 다듬어 접근성이 떨어지는 페이지를 줄이니 꼬리가 다시 완만하게 떨어지고, 조회 수를 40%까지 높일 수 있다는 것을 발견했습니다. 이 연구는 데이터 수집, 분석, 집필, 탈고까지 저의 모든 열정을 쏟아부은 연구입니다. 이 연구가 미국 컴퓨터 협회(ACM)에서 최우수 논문상을 받으며 유튜브 빅데이터 분석에 관한 첫 연구로 기록됐습니다.

차미영 CI가 2014년 미국 페이스북 본사에 방문해 무엇이든 쓸 수 있게 한 페이스북 담벼락을 배경으로 서 있다. 차미영 제공

Q 사회와 밀접한 연구를 많이 하는 이유는 무엇입니까.

제가 재미있다고 생각하는 연구, 아무도 하지 않은 연구에 도전하는 게 즐겁습니다. 그러다 보니 사회와 밀접하게 관련 있는 연구를 많이 하게 된 것 같습니다. 2010년에는 소셜미디어로 관심을 넓혀 ‘백만 팔로워의 오류(The Million Follower Fallacy)’라는 논문을 미국 인공지능협회(AAAI)의 국제 소셜웹 학술대회(ICWSM)에 게재했습니다. 5400만 명의 트위터 사용자 정보와 20억 개의 소셜 팔로우 링크, 17억 개의 트위터 메시지를 분석한 결과 단순히 팔로어 수가 많다고 영향력이 크지 않다는 걸 보인 연구였습니다. 당시에 전산학에서 사회학 문제를 왜 연구하냐는 질문을 많이 받았습니다. 그런데 저는 소셜 플랫폼을 통해 사회를 이해하고 나아가 인간을 이해하는데 큰 도움이 될 것이라는 믿음을 갖고 있었습니다. 그래서 이 연구의 가치를 믿고 나아갔던 것 같습니다. 이 논문은 바로 하버드 비즈니스 리뷰 온라인판에 소개됐고, 현재까지 4000번 넘게 피인용됐습니다. 2020년에는 지난 10년간 학계에 꾸준히 영향을 준 연구로 선정돼 AAAI의 ICWSM에서 테스트 오브 타임 어워드(Test of Time Award)를 받았습니다.

Q 현재 어떤 연구를 진행 중입니까.

기초과학연구원(IBS)에 합류한 뒤 2020년부터는 전산학자, 경제학자, 지리학자들과 함께 범 지구적 차원의 빈곤문제를 다루기 위해 고해상도 인공위성인 ‘센티넬-2’의 영상 데이터를 분석하는 융합 연구를 새로 시작했습니다. 이 연구를 통해 위성영상을 분석하는 인공지능 딥러닝 알고리듬을 개발했고, 이러한 첨단 과학의 응용 분야는 무궁무진합니다. 지난 6월엔 정우성 포스텍 산업경영공학과 교수, 원동희 미국 뉴저지공대 교수 등과 공동연구를 통해 위성 영상 빅데이터로 도시의 녹지 면적을 계산하는 방법을 개발했습니다. 이를 통해 도시 녹지 면적이 넓을수록 시민 행복도가 높아지는 경향이 있다는 결과를 밝혀냈습니다.

지금은 이번에 개발한 도구를 기후학자 등과 교류하며 이산화탄소 배출량이나 해양 쓰레기 배출량, 기후 변화로 인한 영향 등 다양한 사회 문제에 적용해볼 계획입니다. 인공지능 모델은 이렇게 다양한 분야의 협업을 가능하게 한다는 점에서 발전 가능성이 많습니다. 

○ 차 교수가 꼽은 데이터 과학자들 

차 교수는 KAIST 전산학과에서 박사과정을 밟았고 이때 미국 AT&T 연구소와 스페인 텔레포니카(Telefonica)에서 인턴십을 거쳤다. 이후 독일 막스 플랑크 연구소에서 박사후연구원을 지냈습니다. 2010년 이후에는 페이스북, 유엔 글로벌 펄스, 세계관세기구(WCO) 등과 협업하며 다양한 데이터 과학자를 만났다고 합니다. 차 교수가 꼽은 세상을 바꾸고 있는 데이터 과학자들을 소개합니다.  

존 크로크로프트 영국 케임브리지대 교수 

영국 케임브리지대와 앨런 튜링 연구소에서 활동하는 존 크로크로프트 교수는 인터넷 발전에 크게 기여하고 있다. 특히 네트워크에서 동영상과 음성을 전달하는 방법을 연구해 인터넷을 멀티미디어로 확장하는 데 도움을 줬다. 크로크로프트 교수는 학생, 연구자들과 펍에서 맥주를 마시며 삶과 연구를 논하는 걸 즐긴다. 실제로 차미영 CI와 펍에서 얘기를 나누다 연구 아이디어를 떠올렸다고 한다

무수 무수크리시난 아마존 부사장

미국의 IT 기업 아마존에서 일하는 무수 무수크리시난 부사장은 퍼즐을 푸는 것을 즐기는 수학자이자 전산 이론가다. 데이터 전송이나 인터넷 경매와 같은 문제를 해결하는 알고리듬을 연구했다. 이후 미국 럿거스대학과 AT&T 연구소와 구글의 과학자를 거쳐 지금의 자리에 이르렀다. 무수크리시난 부사장은 차미영 CI를 AT&T 연구소에 인턴으로 초대한 사람이기도 하다.

라다 아다믹 페이스북 디렉터

미국의 네트워크 과학자인 라다 아다믹 전 미시간대 교수는 응용물리학을 전공했고, 네트워크에서의 정보 역학을 연구한다. 네트워크 구조가 정보 전달에 어떤 영향을 미치는지를 연구하며, 블로그들 사이의 네트워크가 정치 성향에 따라 양극화돼 있다는 세계적인 성과를 냈다. 미국 HP 연구소 연구원과 미시간대 교수를 거쳐 지금은 페이스북 연구팀의 디렉터로 일하고 있다

※관련기사

수학동아 9월호, [IBS 수학동아 | 나의 삶, 나의 수학]  수학의 눈으로 사회를 이해하는 데이터 과학자

[김미래 기자 futurekim93@donga.com]

Copyright © 동아사이언스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?