"딥시크 R1보다 3배 정확"...오픈AI, 새 툴 `딥리서치` 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈AI가 중국 AI 스타트업 딥시크(DeepSeek)의 공세에 맞서 심층 추론 모델 '딥리서치(DeepResearch)'를 전격 출시했다.
이 모델은 AI 성능 평가에서 딥시크의 최신 추론 모델 'R1'보다 약 3배 높은 정확도를 기록하고, 기존 오픈AI의 최고 성능 모델인 'O3'보다도 두 배가량 뛰어난 정답률을 갖췄다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI가 중국 AI 스타트업 딥시크(DeepSeek)의 공세에 맞서 심층 추론 모델 '딥리서치(DeepResearch)'를 전격 출시했다. 이 모델은 AI 성능 평가에서 딥시크의 최신 추론 모델 'R1'보다 약 3배 높은 정확도를 기록하고, 기존 오픈AI의 최고 성능 모델인 'O3'보다도 두 배가량 뛰어난 정답률을 갖췄다.
오픈AI는 2일(현지시간) 일본 도쿄에서 생중계 발표를 통해 '딥리서치'를 깜짝 공개했다. 이 모델은 기존 'O3' 추론 모델에 인터넷 검색 기능을 추가한 형태로, 방대한 온라인 자료를 분석·종합해 더욱 심층적인 답변을 생성하는 것이 특징이다. 오픈AI는 "챗GPT가 수백 개의 온라인 소스를 탐색해 연구자 수준의 포괄적인 보고서를 생성한다"며 "사람이 수 시간 걸려 수행해야 하는 작업을 단 몇십 분 만에 처리할 수 있다"고 설명했다.
딥리서치는 단순한 정보 제공을 넘어 금융, 과학, 정책 등 전문 연구자들을 위한 심층 분석을 지원한다. 기존 챗GPT처럼 질문과 동시에 답변이 생성되는 것이 아니라, 5~30분의 검색·분석 과정을 거쳐 보다 정밀한 결과를 내놓는다. 이는 지난해 구글이 시범적으로 선보인 기능과 유사하다.
오픈AI는 "모든 출력 결과에는 명확한 인용문과 사고 과정 요약이 포함돼 있어 참조 및 검증이 용이하다"며 "여러 웹사이트를 직접 탐색해야 하는 비직관적인 정보 검색에 특히 효과적"이라고 강조했다.
딥리서치는 AI 성능을 평가하는 가장 어려운 벤치마크 중 하나로 꼽히는 '인류의 마지막 시험(Humanity's Last Exam)'에서 25.3%의 정답률을 기록했다. 이는 GPT-4o의 3.3%, 오픈AI의 기존 추론 모델 'O1'과 딥시크 R1의 9.1%, 9.4%를 크게 상회하는 수준이다. 또한, 오픈AI의 최신 추론 모델 'O3 미니'가 고사양 자원을 투입했을 때 13.0%의 정답률을 기록한 것과 비교해도 월등한 성과다.
오픈AI는 "언어학, 로켓 과학, 고전문학, 생태학 등 100개 이상의 주제에서 3000개 이상의 객관식 및 단답형 문제를 테스트했다"며 "특히 화학, 인문학, 사회과학, 수학 등에서 높은 성과를 보였고, 전문 정보를 탐색하는 방식에서도 인간과 유사한 접근법을 보여줬다"고 설명했다.
딥리서치는 우선 챗GPT 프로(월 200달러) 사용자들에게 제공되며, 월 최대 질문 한도는 100개로 제한된다. 이후 플러스 및 비즈니스 사용자로 서비스 대상을 확대할 계획이다. 오픈AI는 "딥리서치는 연산 집약적인 모델로 막대한 컴퓨팅 자원이 필요하다"며 "향후 더 작은 모델로도 고품질 결과를 제공할 수 있는 비용 효율적인 버전을 개발할 예정"이라고 밝혔다. 팽동현기자 dhp@dt.co.kr
Copyright © 디지털타임스. 무단전재 및 재배포 금지.
- 전광훈 "내가 서부지법 난동 배후? 우리는 밤 8시에 해산"
- "美동맹국 믿고 투자했는데"…트럼프발 무역전쟁 韓배터리 직격탄
- 일본서 1시간 일하면 빅맥 고작 2개 구매…한국은?
- 수업중 여교사에게…`성적 언동` 중학생의 최후
- 중학생 의붓아들 폭행해 숨지게 한 30대…병원서 긴급체포
- 원안위, 국내 최초 원전 고리 1호기 해체 승인… 원전 해체 시장 열렸다
- "선생님, 보험 안 돼도 로봇수술로 해주세요"…수술 로봇 수입 1년 새 57% 증가
- 트럼프, 이란과 핵협상 한다면서 무력충돌 가능성도 제기
- 하반기 산업기상도 반도체·디스플레이 `맑음`, 철강·자동차 `흐림`
- `6조 돌파`는 막아라… 5대은행, 대출조이기 총력전