가장 정확한 답 내놓는 AI…3위 퍼플렉시티 2위 챗GPT 1위는?

이지윤 기자 2025. 8. 29. 14:19
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

검색 도구로 활용할 때 가장 정확한 답을 내놓는 인공지능(AI) 모델이 구글의 'AI 모드'라는 전문가 평가가 나왔다.

미국 워싱턴포스트(WP)는 구글의 AI 모드와 AI 오버뷰, 챗GPT, 클로드, 메타 AI, 그록, 퍼플렉시티, 빙 코파일럿 등 9개의 AI 모델의 검색 정확도를 측정하는 실험을 진행한 결과 AI 모드가 가장 정확한 답변을 내놨다고 전했다.

AI 모드는 구글 제미나이 2.5 기반의 검색 도구다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글 AI 모드. 구글 제공.
검색 도구로 활용할 때 가장 정확한 답을 내놓는 인공지능(AI) 모델이 구글의 ‘AI 모드’라는 전문가 평가가 나왔다.

미국 워싱턴포스트(WP)는 구글의 AI 모드와 AI 오버뷰, 챗GPT, 클로드, 메타 AI, 그록, 퍼플렉시티, 빙 코파일럿 등 9개의 AI 모델의 검색 정확도를 측정하는 실험을 진행한 결과 AI 모드가 가장 정확한 답변을 내놨다고 전했다. WP는 9개의 모델에 30가지 까다로운 질문을 한 뒤 전문 사서 3명에게 의뢰해 답변의 정확성을 1~10점으로 평가했다.

테스트 결과 AI 모드가 100점 만점에 60.2점을 얻어 가장 높은 점수를 받았다. GPT-5 기반의 챗GPT가 55.1점으로 2위를, 퍼플렉시티가 51.3점으로 3위를 차지했다. 그록3(40.1점)과 메타 AI(33.7점)은 각각 8위와 9위로 하위권을 기록했다.

AI 모드는 구글 제미나이 2.5 기반의 검색 도구다. 여러 출처를 종합한 뒤 답변을 제공하는 기능을 제공하나 아직 한국에서 출시되지 않았다. AI 오버뷰는 구글 검색창에 검색어를 입력하면 검색 결과를 요약해서 보여주는 기능이다.

WP는 “AI가 정보의 최신성과 출처의 신뢰도를 판별하는 데 어려움을 겪고 있으며, 잘못된 답을 자신 있게 내놓기도 했다”며 “비판적 사고를 통해 AI가 내놓은 답변을 한차례 더 검증하는 것이 바람직하다”고 전했다.

이지윤 기자 asap@donga.com

Copyright © 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지