[기고] 신뢰할 수 있는 인공지능
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
필자는 인공지능이 최근 우리 생활 속으로 파고들고 있다는 것을 체감하고 있다.
또한 인공지능의 적대적 입력에 대해 강건성을 유지할 수 있는 기법에 대한 연구가 있다.
마지막으로, 인공지능의 성능을 제어 가능한 알고리즘을 개발하는 연구도 수행되고 있다.
필자는 적대적인 공격을 포함한 분포 이동 상황에서 인공지능의 추론 불확실성을 정량화하여 환각효과의 제어 가능성을 확인하는 연구를 다년간 수행했다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
이미 학계에서는 인공지능의 신뢰성 문제에 대해서 심각성을 인식하고 해결책을 마련하고 있다. 관련된 문제의 예로 환각효과 및 적대적인 공격에 대한 강건성 문제를 꼽을 수 있다. 환각효과는 인공지능 모델 중 생성모델에서 도드라지는 문제로 생성모델이 거짓된 대답을 자신있게 말하는 문제를 칭한다. 강건성 문제는 모델이 적대적인 입력에 대해서 의도한 동작을 하지 않을 경우 발생한다. 가령 오픈AI 챗GPT의 경우 탈옥공격으로 폭탄을 만드는 법같이 인간 가치에 부합하지 않는 대답을 하기도 한다.
그런데 이런 인공지능의 신뢰성 문제는 군사적인 목적을 고려하면 그 문제가 더 두드러지게 된다. 특히 군사용 인공지능은 적대적인 환경에 노출될 가능성이 높다. 그래서 기존의 오작동을 유발하는 환각효과 문제가 적대적인 공격으로 극대화될 수 있다. 2023년에 미국 국방부의 드론이 시리아에서 민간인을 실수로 살해한 사건이 있었는데 이런 오작동을 공격자가 악용한다면 충분히 피해를 극대화할 수 있다.
필자가 재직하고 있는 포스텍에서는 인공지능의 신뢰성에 대한 연구를 심도 있게 진행하고 있다. 가령 인공지능이 의도적 또는 비의도적 입력에 대해서 원하는 기능을 수행하는지를 평가하는 레드팀 연구가 있다. 김슬배 교수는 물체 탐지 기능이 탑재된 자동주행 자동차 소프트웨어가 오작동을 일으키는지 평가하는 연구를 수행했다. 또한 인공지능의 적대적 입력에 대해 강건성을 유지할 수 있는 기법에 대한 연구가 있다. 김동우 교수는 기존 적대적 공격의 정제방법 평가 및 효과적인 정제방법에 대한 연구를 했다. 마지막으로, 인공지능의 성능을 제어 가능한 알고리즘을 개발하는 연구도 수행되고 있다. 필자는 적대적인 공격을 포함한 분포 이동 상황에서 인공지능의 추론 불확실성을 정량화하여 환각효과의 제어 가능성을 확인하는 연구를 다년간 수행했다.
오는 9월 9일부터 이틀간 서울에서 인공지능의 책임 있는 군사적인 활용을 논의하기 위한 고위급회의가 열린다. 필자는 이 회의에서 인공지능의 일반적인 이용뿐만 아니라 군사적 이용에서 신뢰성 문제의 중요성이 확산될 것이라고 본다. 더 나아가 책임 있는 인공지능 개발은 이를 이용한 군사적 보안 문제를 해결하는 데 선결되어야 할 과제라고 생각한다. 실제로 미국 국방고등연구계획국(DARPA)에서는 인공지능을 이용해 자동 취약점 탐지 및 보안패치 생성대회(AIxCC)를 개최했고, 이는 인공지능의 책임 있는 군사적인 이용이 앞으로 더욱 중요해질 것임을 보여주는 단적인 예가 되겠다.
박상돈 포스텍 인공지능대학원 컴퓨터공학부 교수
Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.
- 최현욱, 장난감 자랑하다 전라노출…사진 빛삭
- 남편상 사강, 4년만 안방 복귀…고현정 동생
- "눈 떴는데 침대에 피가 흥건"..토니안, 정신과 증상 8가지 나타났다 고백 [헬스톡]
- 이재명 유죄에 비명계 뜬다…민주 균열 가속화
- '8번 이혼' 유퉁 "13세 딸 살해·성폭행 협박에 혀 굳어"
- "치마 야하다고"…엄지인, 얼마나 짧기에 MC 짤렸나
- 영주서 50대 경찰관 야산서 숨진채 발견…경찰 수사 착수
- "조카 소설, 타락의 극치" 한강의 목사 삼촌, 공개 편지
- "엄마하고 삼촌이랑 같이 침대에서 잤어" 위장이혼 요구한 아내, 알고보니...
- "딸이 너무 예뻐서 의심"…아내 불륜 확신한 남편