가장 정확한 답 내놓는 AI…3위 퍼플렉시티 2위 챗GPT 1위는?

검색 도구로 활용할 때 가장 정확한 답을 내놓는 인공지능(AI) 모델이 구글의 ‘AI 모드’라는 전문가 평가가 나왔다.

미국 워싱턴포스트(WP)는 구글의 AI 모드와 AI 오버뷰, 챗GPT, 클로드, 메타 AI, 그록, 퍼플렉시티, 빙 코파일럿 등 9개의 AI 모델의 검색 정확도를 측정하는 실험을 진행한 결과 AI 모드가 가장 정확한 답변을 내놨다고 전했다. WP는 9개의 모델에 30가지 까다로운 질문을 한 뒤 전문 사서 3명에게 의뢰해 답변의 정확성을 1~10점으로 평가했다.

테스트 결과 AI 모드가 100점 만점에 60.2점을 얻어 가장 높은 점수를 받았다. GPT-5 기반의 챗GPT가 55.1점으로 2위를, 퍼플렉시티가 51.3점으로 3위를 차지했다. 그록3(40.1점)과 메타 AI(33.7점)은 각각 8위와 9위로 하위권을 기록했다.

AI 모드는 구글 제미나이 2.5 기반의 검색 도구다. 여러 출처를 종합한 뒤 답변을 제공하는 기능을 제공하나 아직 한국에서 출시되지 않았다. AI 오버뷰는 구글 검색창에 검색어를 입력하면 검색 결과를 요약해서 보여주는 기능이다.

WP는 “AI가 정보의 최신성과 출처의 신뢰도를 판별하는 데 어려움을 겪고 있으며, 잘못된 답을 자신 있게 내놓기도 했다”며 “비판적 사고를 통해 AI가 내놓은 답변을 한차례 더 검증하는 것이 바람직하다”고 전했다.

이지윤 기자 asap@donga.com

동아일보

국제

가장 정확한 답 내놓는 AI…3위 퍼플렉시티 2위 챗GPT 1위는?