[주니어전자]구글 AI 모드, 워싱턴포스트 테스트 1위

최성훈 2025. 8. 29. 15:56
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

주요 인공지능(AI) 모델 중 가장 정확한 답을 내놓는 AI 검색 도구는 구글 'AI 모드'라는 테스트 결과가 나왔어요.

워싱턴포스트는 27일(현지시간), 미국 공공·대학 도서관들과 함께 진행한 AI 검색 도구 테스트에서 구글 AI 모드가 1위를 차지했다고 보도했어요.

AI 모드와 AI 오버뷰는 구글의 검색 도구로, AI 모드는 웹을 깊이 검색해 여러 출처를 종합한 뒤 답변을 제공하고, AI 오버뷰는 검색 결과를 AI가 요약해줘요.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글 AI 모드 / 유튜브 @Google 영상 캡처

주요 인공지능(AI) 모델 중 가장 정확한 답을 내놓는 AI 검색 도구는 구글 'AI 모드'라는 테스트 결과가 나왔어요.

워싱턴포스트는 27일(현지시간), 미국 공공·대학 도서관들과 함께 진행한 AI 검색 도구 테스트에서 구글 AI 모드가 1위를 차지했다고 보도했어요.

이번 테스트는 구글 AI 모드와 AI 오버뷰, 챗GPT(오픈AI), 퍼플렉시티, 클로드(앤스로픽), 빙 코파일럿(마이크로소프트), 그록(xAI), 메타 AI 등 총 9개의 AI 도구를 대상으로 진행됐어요.

챗GPT는 GPT-5와 GPT-4 터보 두 모델을 포함했어요.

AI 모드와 AI 오버뷰는 구글의 검색 도구로, AI 모드는 웹을 깊이 검색해 여러 출처를 종합한 뒤 답변을 제공하고, AI 오버뷰는 검색 결과를 AI가 요약해줘요.

테스트는 까다로운 질문 30개를 던진 뒤 AI 도구가 내놓는 답변 900건을 점수화했어요.

모든 도구는 무료 기본 버전(7∼8월 기준)으로만 테스트했고, 질문은 퀴즈, 전문 자료 검색, 최신 사건, 내재된 편향(편견), 이미지 인식 등 5가지에 집중했어요.

자료 출처: 워싱턴포스트

테스트 결과 구글 AI 모드가 100점 만점 가운데 60.2점을 얻어 가장 높은 점수를 받았어요. GPT-5 기반의 챗GPT가 55.1점으로 2위를, 퍼플렉시티가 51.3점으로 3위를 차지했어요.

일론 머스크의 그록3는 40.1점을 얻어 8위를, 메타 AI는 33.7점으로 가장 낮은 순위를 기록했어요.

구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확한 답을 제시했고, 전문 출처 검색에서는 빙 코파일럿, 이미지 인식에서는 퍼플렉시티가 가장 높은 점수를 받았어요.

GPT-4 터보는 가장 치우치지 않는 답을 제공했어요.

GPT-5는 전체적으로 성능 개선을 보여 2위를 차지했지만, 일부 영역에서는 GPT-4보다 오히려 낮은 점수를 받았어요.

이번 테스트는 AI의 약점을 의도적으로 공략했는데, 일상적인 질문에서도 여전히 AI가 제대로 답하지 못하는 경우가 많다는 사실이 드러났다고 워싱턴포스트는 분석했어요.

최성훈 기자 csh87@etnews.com

Copyright © 전자신문. 무단전재 및 재배포 금지.