오픈AI “AI 설명 능력 향상 방법 밝혔다”...입증자-검증자 게임 모델
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈AI는 AI 모델이 자신이 도출한 답변을 사용자에게 더 잘 설명할 수 있도록 학습하는 새로운 알고리즘을 개발했다고 18일 밝혔다.
연구 결과, 검증자(Verifier) 모델은 입증자(Prover)의 설득 기법에 저항하는 능력이 향상됐고, 입증자(Prover) 모델 역시 자신이 선택한 답변을 인간 사용자에게 더 잘 설명하게 됐다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
오픈AI 연구원인 얀 헨드릭 키르히너(Jan Hendrik Kirchner)는 “우리는 이번 연구를 막 마쳤다”며 “이제 가능한 한 빨리 이러한 통찰력을 커뮤니티와 공유해 사람들에게 ‘가독성 문제’를 알리고 해결책을 기여할 수 있도록 하는 것이 중요하다”고 말했다.
오픈AI 연구진이 발표한 새로운 알고리즘은 ‘입증자-검증자 게임(Prover-Verifier 게임)’에 기반하고 있다. 해당 방법론은 2021년 토론토 대학교와 벡터 인공지능 연구소의 연구진이 처음 고안해 논문으로 발표한 것이다. 게임은 두 개의 AI 모델을 짝지어 더 강력하고 지능적인 ‘입증자(Prover)’와 덜 강력한 ‘검증자(Verifier)’가 서로를 설득하려는 상황을 만들었다.
입증자(Prover)의 목표는 검증자(Verifier)가 특정 답변을 믿게 만드는 것이며, 검증자(Verifier)의 목표는 입증자(Prover)의 주장과 상관없이 항상 올바른 답변을 선택하는 것이다. 오픈AI 연구진은 두 개의 맞춤형 GPT-4 모델을 사용해 이 게임을 여러 차례 반복하면서 각각의 성능을 개선했다.
연구진은 매 라운드 후 두 모델을 재훈련시켰으며, 특히 입증자(Prover) 모델이 인간 사용자에게 더 잘 설명할 수 있도록 데이터를 활용했다. 인간 평가자들은 입증자(Prover) 모델의 답변이 얼마나 이해하기 쉬운지 평가했다. 연구 결과, 검증자(Verifier) 모델은 입증자(Prover)의 설득 기법에 저항하는 능력이 향상됐고, 입증자(Prover) 모델 역시 자신이 선택한 답변을 인간 사용자에게 더 잘 설명하게 됐다.
오픈AI는 이번 연구 결과가 “출력이 정확할 뿐만 아니라 투명하게 검증 가능하도록 하는 AI 시스템 개발에 기여할 것”이라며 “신뢰성과 안전성을 향상시키는 데 중요한 역할을 할 것”이라고 밝혔다. 연구진은 향후 더 지능적인 모델을 인간 평가자가 신뢰성 있게 평가하기 어려운 상황에서도 이러한 방법론이 유용할 것이라고 기대하고 있다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- 남친 귀엽다고 놀렸는데…이범수와 이혼 이윤진, 딸 한 마디에 말문 ‘턱’ - 매일경제
- “맘 편히 죽으러 이민간다”…한국부자 1200명 ‘엑소더스’, 자녀들도 안 말린다는데 - 매일경
- “집값 불붙는 게 심상치 않다”…뒤늦게 놀란 정부, 부동산장관회의 연다는데 - 매일경제
- “막강 김연아로 인해 항상 고통”…아사다 마오, 13년 만에 밝힌 심경 - 매일경제
- “슈퍼사이클 온다, 하반기 주도주는 나”…한달새 30% 급등한 ‘이 종목’ - 매일경제
- “출근하는데 갑자기 몸이 ‘쑥’ 들어갔다”…세종 아파트 인근서 ‘3m 싱크홀’ - 매일경제
- “뼈만 있고 고기는?” “재활용?”...1만7천원짜리 해장국·육개장 진실 공방 - 매일경제
- ‘36주 낙태’ 유튜버 영상 모두 삭제…“거짓이어도 강력 처벌해야” 요구 빗발 - 매일경제
- “난 채식주의자, 잠도 여기서만 자”…판매 3배 늘어난 ‘이것’ - 매일경제
- 인종차별 이후 적반하장 황당! 황희찬 “인종차별 용납할 수 없다, 동료들 감사” 강경 입장 밝