AI 아직 갈길 멀어…데이터 확보·디지털화 `숙제`

제2회 세계 한인 과학기술인 대회
'AI혁명과 미래전망'…아직 저작권 등 문제 많아

"생성형 AI를 우리가 원하는 수준으로 쓰기 위해서는 전문적이고 사실적인 정보를 기반으로 대답을 할 수 있어야 한다. 그러기 위해서는 많은 양의 신뢰성 있는 데이터가 모아져야 하는데 현장에서 데이터가 너무 없고 저작권 문제 등도 계속해서 발생하고 있어 그 과정이 쉽지 않다."

10일 배경훈 LG AI 연구원 원장이 서울 강남구 한국과학기술회관에서 열린 제2회 세계 한인 과학기술인 대회 'AI혁명과 미래전망' 토론회에서 이같이 말했다. 이날 토론회에서는 AI 혁명의 전반적인 현황과 미래 전망을 살펴봤다. 특히 전 세계에서 활동하는 한인 과학기술인들이 모여 AI와 계산 과학을 활용한 지속 가능한 미래를 위한 새로운 에너지 소재 발견과 AI 기술이 바이오산업에 가져올 패러다임의 전환을 중심으로, 산업별 최신 응용 사례를 통해 기술 발전의 현황과 그 가능성에 대해 논의했다.

토론회에 참가한 전문가들은 아직까지 AI에 대한 신뢰성이 부족하다며 미래 AI의 발전을 위해서는 데이터 확보가 중요하다고 말했다. 토론회 발제자로 참석한 임형순 하버드 의과대학 교수는 "암 종류만 해도 2만여 가지가 넘는데, 아무리 데이터를 모은다 해도 모든 범위를 잘 커버할 수 있을 만큼의 데이터를 모으는 것이 어렵다"며 "의료의 경우 프라이버시 문제도 있어 환자의 동의 없이 데이터를 공유할 수 없어 많은 부분이 비어있다"라고 강조했다.

데이터 확보보다 데이터 디지털화와 체계화가 더 중요하다는 목소리도 나왔다. 신숙 버지니아 테크놀로지 대학교수는 "이미 발표된 데이터를 수집할 때도 어떤 사람은 데이터를 그래프로 표현하고 어떤 사람은 텍스트로 표현한다"며 "이런 식으로 머티리얼(재료)의 특성을 나타내면 데이터를 읽어내는데 매우 어렵기 때문에 실제로 데이터가 있지만 사용되지 않는 것들에 대해 디지털화에 많은 노력이 필요하다"고 말했다.

임 교수는 "AI가 진단을 내릴 때 실제 질병과 관련한 요소들을 가지고 진단해야 하는데 나이나 인종 등 다양한 변수를 가지고 (잘못된) 진단을 내리는 경우가 많다"며 "예를 들어 AI가 어떤 환자에게 암 진단을 내린 경우 왜 그런 진단을 내렸는지 설명하라고 하면 하지 못하는데, 이건 데이터 체계화가 아직 덜 됐기 때문"이라고 어려움을 토로했다.

한편, 이날 'AI혁명과 미래전망' 토론회에는 사회 차영수 고려대 교수 외에 배경원 LG AI 연구원 원장, 신효민 캐나다 내셔널 리서치 카운슬 시니어 리서치 오피서, 임형순 하버드 의과대학 교수, 전병국 퍼듀대학교 교수, 정지원 데프트 테크놀로지 대학교 조교수, 신숙 버지니아 테크놀로지 대학교 교수, 김종옥 고려대학교 교수, 이학연 서울과학기술대학교 교수 등이 참석했다.

유진아기자 gnyu4@dt.co.kr

디지털타임스

IT/과학

AI 아직 갈길 멀어…데이터 확보·디지털화 `숙제`