가장 정확한 답 내놓는 AI…3위 퍼플렉시티 2위 챗GPT 1위는?
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
검색 도구로 활용할 때 가장 정확한 답을 내놓는 인공지능(AI) 모델이 구글의 'AI 모드'라는 전문가 평가가 나왔다.
미국 워싱턴포스트(WP)는 구글의 AI 모드와 AI 오버뷰, 챗GPT, 클로드, 메타 AI, 그록, 퍼플렉시티, 빙 코파일럿 등 9개의 AI 모델의 검색 정확도를 측정하는 실험을 진행한 결과 AI 모드가 가장 정확한 답변을 내놨다고 전했다.
AI 모드는 구글 제미나이 2.5 기반의 검색 도구다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

미국 워싱턴포스트(WP)는 구글의 AI 모드와 AI 오버뷰, 챗GPT, 클로드, 메타 AI, 그록, 퍼플렉시티, 빙 코파일럿 등 9개의 AI 모델의 검색 정확도를 측정하는 실험을 진행한 결과 AI 모드가 가장 정확한 답변을 내놨다고 전했다. WP는 9개의 모델에 30가지 까다로운 질문을 한 뒤 전문 사서 3명에게 의뢰해 답변의 정확성을 1~10점으로 평가했다.
테스트 결과 AI 모드가 100점 만점에 60.2점을 얻어 가장 높은 점수를 받았다. GPT-5 기반의 챗GPT가 55.1점으로 2위를, 퍼플렉시티가 51.3점으로 3위를 차지했다. 그록3(40.1점)과 메타 AI(33.7점)은 각각 8위와 9위로 하위권을 기록했다.
AI 모드는 구글 제미나이 2.5 기반의 검색 도구다. 여러 출처를 종합한 뒤 답변을 제공하는 기능을 제공하나 아직 한국에서 출시되지 않았다. AI 오버뷰는 구글 검색창에 검색어를 입력하면 검색 결과를 요약해서 보여주는 기능이다.
WP는 “AI가 정보의 최신성과 출처의 신뢰도를 판별하는 데 어려움을 겪고 있으며, 잘못된 답을 자신 있게 내놓기도 했다”며 “비판적 사고를 통해 AI가 내놓은 답변을 한차례 더 검증하는 것이 바람직하다”고 전했다.
이지윤 기자 asap@donga.com
Copyright © 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지
- 농어촌 6곳 주민에 월 15만원…‘이재명표 기본소득’ 시험한다
- 임은정 “정성호조차 검찰에 장악…개혁안 참담한 수준”
- “한덕수, 김용현과 손가락 세며 국무회의 정족수 체크”
- 채상병특검, 공수처 압수수색…이종호 관련 검사 위증 혐의
- 김건희, 변명 않겠다면서도 “마치 사실처럼 기사 쏟아져” 혐의 부인
- 전한길 “나를 품는 자가 공천 받고 대통령도 될 수 있어”
- 최교진 “음주운전 잘못…현재까지 운전 안하고 있다”
- 박단, 세브란스 전공의 복귀 불합격…“제가 부족해서”
- [단독]대통령실, 이진숙 방통위원장 직권면직 검토
- 박지원도 中전승절 참석…“김정은과 대화 가능할지 의문”