[이덕환의 과학세상] ‘AI 연구동료’…화려한 말솜씨에 가려진 데이터 의존성

과학기술정보통신부가 연구실에서 실제 연구를 수행하는 ‘인공지능(AI) 연구동료(Co-Scientist)'를 ‘개발’하는 사업을 추진하고 있다. 인간의 수준을 훌쩍 뛰어넘는 능력을 갖추고 분야별로 특화된 초인공지능(ASI artificial super intelligence) 수준의 ‘결과물’을 만들어 내는 것이 목표다.

바이오·지구과학·수학·재료·화학·반도체·디스플레이·이차전지 분야의 과학기술 특화 AI 모델을 만들어 국가경쟁력을 확보하겠다고 밝혔다.

연구개발 행정에도 AI를 투입한다. 과기부의 연구개발 행정에 AI를 접목해서 본격적인 혁신을 이루겠다는 것이다. 다만 연구행정 ‘AI 동료’는 과기부의 공무원들이 직접 개발한다. 이미 주요 전력기술 분야의 동향과 지역별 혁신기업의 현황과 투자 단계별 분포를 분석하는 AI 동료를 뚝딱 만들어 냈다고 한다.

2022년 11월에 처음 등장한 ‘생성형 AI’가 놀라운 잠재력을 가지고 있는 것은 아무도 부정하지 않는다. 실제로 AI가 단순한 자료의 정리·분석을 넘어서 상당한 수준의 추론 능력도 갖추고 있는 것은 사실이다.

그렇다고 현재의 생성형 AI가 연구실과 정부에서 인간 과학자나 관료의 ‘동료’ 역할을 감당할 수 있을 것인지는 아무도 장담할 수 없다. 오히려 AI 동료가 연구 윤리와 행정의 공정성을 무너뜨리고 인재 양성의 맥(脈)을 끊어버릴 수 있다는 우려를 걱정해야 하는 상황이다.

● 노벨상까지 수상한 AI

‘생성형 AI’가 세상을 완전히 바꿔놓고 있는 것은 분명한 사실이다. 과학기술 분야의 연구와 행정도 예외일 수 없다. 실제로 과기부가 적극적인 관심을 보이는 ‘AI 연구동료’도 먼 미래의 이야기가 아니다.

그래픽을 비롯한 새로운 정보화 기술에 유별난 관심을 보여왔던 화학이 선두를 달리고 있다. 실제로 생성형 AI를 이용해서 실제 화합물을 합성하는 과정을 설계해서 실행에 옮기는 ‘AI 화학자’가 실용화를 목전에 두고 있다. 실험실의 화학자가 고려해야 하는 여러 가지 요소를 분석해서 분자를 합성하는 최적의 조건과 경로를 설계하고 가장 적합한 시약과 실험 방법을 찾아내는 능력을 추구한다.

AI 화학자가 스스로 위키피디아와 미국화학회(ACS)·영국왕립학회(RSC)의 자료를 검색해서 학습에 활용할 뿐만 아니라 실험실의 로봇을 직접 제어해서 액체 시료를 섞어서 가열하는 실제 실험도 수행한다. 로봇을 제어하는 코드에서 발견된 오류를 스스로 수정·진화하는 능력도 갖추었다.

아스피린이나 파라세타몰과 같은 간단한 유기화합물의 합성은 물론이고 의약품 합성에 널리 사용되는 팔라듐 촉매를 이용하는 스즈키 반응도 4분 이내에 성공적으로 설계하는 놀라운 성과도 확인되었다.

인간 화학자와는 달리 AI 화학자는 24시간 연속해서 아이디어를 내고 실험을 수행하고 개선점을 찾아내는 능력을 발휘한다. 자칫하면 화학 실험실에서 인간 화학자가 ‘퇴출’되어 버릴 가능성도 걱정해야 하는 상황이다. 연구실의 인간 화학자의 형편이 휴머노이드 로봇의 등장을 걱정하는 자동차 공장의 근로자와 크게 다르지 않은 셈이다.

연구실에서의 인공지능이 초보적인 개발 단계에만 머물러 있는 것도 아니다. 이미 놀라운 성과도 이룩했다. 실제로 2024년 노벨 물리학상과 화학상은 인공지능이 휩쓸어버렸다.

물리학상은 인공신경망(artificial neural network)을 이용하는 기계학습(machine learning)의 기반을 구축한 존 홉필드 프린스턴대 교수와 제프리 힌턴 토론토대 교수에게 돌아갔다. 화학상은 인공지능을 기반으로 단백질의 구조와 기능을 예측하고 설계하는 소프트웨어를 개발한 데이비드 베이커 워싱턴대 교수와 구글 딥마인드의 데미스 허사비스 최고경영자(CEO)와 존 점퍼 수석연구원이 차지했다.

● 화려한 말솜씨에 가려진 데이터 의존성

생성형 AI의 가장 강력한 무기는 화려한 ‘말(글)솜씨’다. 문법에 어긋나는 비문(非文)도 없고 한 치의 머뭇거림이나 중언부언(重言復言)도 없다. 모든 문장이 간결하고 명쾌하다.

기승전결(起承轉結)의 서술 구조도 분명하고 논리 전개 과정에서의 억지·비약·과장도 없다. 생성형 AI의 놀라운 설득력은 바로 그런 뛰어난 말솜씨에서 비롯되는 것이다. 탁월한 언변(言辯)을 가진 사람을 함부로 무시하기 어려운 것과 마찬가지다.

AI의 현란한 말솜씨는 문장에 포함된 단어에 대한 개별적 지식에 통계적 방법론을 적용해서 구축하는 ‘대형 언어모델’(LLM)에서 비롯된다. 생성형 AI는 단어를 꿰어 맞춰서 학습한 패턴에 맞는 확률론적으로 그럴듯한 문장을 만들어 내는 과정에서 함부로 넘보기 어려운 화려하고 현란한 말솜씨를 자랑하게 된다는 것이다.

그런데 어떤 개념을 언어적으로 ‘설명’하는 능력과 그 개념을 정확하게 이해하고 실제로 ‘활용’하는 능력은 다른 것이다. 메타의 얀 르쿤과 AI 철학자 제이콥 브라우닝의 지적이다. 언어 모델의 ‘얄팍한 이해력’을 인간이 세상을 살아가면서 다른 사람이나 문화와 교류하면서 습득하게 되는 ‘깊은 이해력’과 혼동해서는 안 된다는 뜻이다.

생성형 AI는 ‘논리 체계’를 철저하게 무시한 ‘확률론적 언어 조합 프로그램’에 지나지 않는다는 가혹한 평가도 있다. 자칫 설익은 생성형 AI 때문에 1996년 뉴욕대학의 수리물리학자 앨런 소칼이 촉발시켰던 소모적인 ‘과학전쟁’이 일상화될 수도 있는 상황이다.

AI의 딥러닝에 사용하는 데이터의 ‘양’과 ‘질’이 언제나 부족할 수밖에 없는 것이 냉혹한 현실이다. 실제로 범용(汎用) 생성형 AI의 학습을 위해 무한히 많은 양의 좋은 데이터를 제공하는 일은 현실적으로 불가능하다.

결국 인간이 현실적으로 제공하는 데이터에 의존하는 생성형 AI에게 ‘환각’(hallucination)은 절대 회피할 수 없는 숙명일 수밖에 없다. 생성형 AI가 수행하는 ‘동향 분석’에서는 언제나 오류의 가능성을 경계해야 한다는 뜻이다.

실제로 생성형 AI는 ‘참’(眞)과 ‘거짓’(僞)을 판별할 수도 없고 ‘선’(善)과 ‘악’(惡)도 구분할 수도 없다. 더욱이 생성형 AI에게 인간의 ‘창조성’이나 ‘자아’(自我)를 기대하기도 어렵다.

스스로 창의적인 질문을 제기하지 못하는 생성형 AI는 아인슈타인처럼 자연에 숨겨져 있는 새로운 과학적 사실을 밝혀내지도 못하고 셰익스피어와 같은 창조적인 문학 작품도 창작하지 못한다. 물론 살바도르 달리와 같은 독창적인 화풍도 기대할 수 없다. 생성형 AI는 낮은 수준의 ‘표절기’에 지나지 않는다는 언어학자 노엄 촘스키의 경고를 무시하지 말아야 한다.

생성형 AI의 ‘의도적’인 거짓말도 경계해야 한다는 지적도 있다. 당당하게 상대를 배신하고 허세를 부리고 의도적으로 속임수를 쓰는 생성형 AI도 있다는 것이다. 정부가 AI의 속임수 가능성을 규제하는 ‘AI 안전법’을 서둘러 마련해야 한다는 주장도 있다.

● 창조·윤리는 인간 과학자의 책임

AI의 능력이 놀라운 것은 사실이지만 ‘만능’(萬能)의 능력을 갖춘 ‘요술 방망이’는 아니다. 그리고 AI가 아무도 찾아내지 못한 새로운 길을 찾아내는 ‘창의성’도 기대할 수 없다. AI의 화려한 언변에 대한 경계를 게을리하지 말아야 한다.

AI가 과학논문을 오염시킬 수 있다. 생성형 AI가 과학 연구에서 철저하게 경계하는 위조(fabrication)·변조(falsification)·표절(plagiarism)의 가장 현실적인 수단으로 활용될 수 있기 때문이다. 특히 생성형 AI가 제공하는 문헌 정보는 섣불리 믿을 것이 절대 아니다.

‘화려한 말솜씨’로 무장한 생성형 AI가 과학 연구의 현장을 어지럽게 만들 수 있는 연구실의 새로운 ‘악동’(惡童)으로 전락하는 일을 막아내는 책임은 온전하게 ‘인간’ 과학자의 몫이다.

연구의 결과를 분석하고 논문을 작성하는 과정에서 생성형 AI의 활용에 대해서는 구체적이고 분명한 교육과 지침이 필요하다. ‘AI 연구동료’와 ‘AI 행정동료’에 대한 섣부른 관심은 철저하게 경계해야 하는 상황이다.

최근 버클리대 법대가 제정한 엄격한 ‘인공지능 정책’을 참고할 필요가 있다. 인간 과학자가 AI 연구동료를 활용하기 전에 스스로 충분한 ‘사고력’과 ‘인지능력’을 갖추는 것이 꼭 필요하다(sine qua non)는 사실을 분명하게 인식하도록 해주는 것이 핵심이다.

AI 연구동료가 연구의 주제를 도출하고 논문을 작성해 줄 것은 기대하지 말아야 한다. 국가연구개발 사업을 수행하는 주체는 언제나 ‘인간 과학자’라는 사실을 절대 잊지 말아야 한다.

※필자 소개
이덕환 서강대 명예교수(화학·과학커뮤니케이션). 2012년 대한화학회 회장을 역임하고 과학기술, 교육, 에너지, 환경, 보건위생 등 사회 문제에 관한 칼럼과 논문 3200여 편을 발표했다. 《같기도 하고, 아니 같기도 하고》《거의 모든 것의 역사》《우리 몸을 만드는 원자의 역사》《질병의 연금술》《지금 과학》을 번역했고 주요 저서로 《이덕환의 과학세상》이 있다.

[이덕환 서강대학교 화학·과학커뮤니케이션 명예교수 duckhwan@sogang.ac.kr ]

동아사이언스에서 직접 확인하세요. 해당 언론사로 이동합니다.

속보

[이덕환의 과학세상] ‘AI 연구동료’…화려한 말솜씨에 가려진 데이터 의존성