"AI도 12분 걸리고 틀려?"...'수능 수학 22번' 킬러문항 시켜봤더니
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
중국 인공지능(AI) 스타트업 딥시크가 가성비 높은 AI 'R1'으로 충격을 주자 오픈AI가 지난 1일(현지시간) 새 저가형 추론 모델 챗GPT 'o3 미니'를 공개하며 맞불을 놨다.
딥시크 R1은 12분 걸려 오답, o3 미니는 2분만에 정답 2일 기자가 추론(Reasoning) 기능이 들어간 두 모델을 이용해 2025학년도 수능 수학 영역에서 가장 오답률이 높았던(94.4%) 22번 문제를 풀게 해봤다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
가성비 AI 딥시크 충격에 오픈AI 절치부심
최근 저가형 챗GPT o3 미니 선봬
악명 높은 수능 수학 22번 수열 문제 풀이
R1는 12분간 일률적 개산하며 진땀 끝 '오답'
o3는 2분만에 체계적 추론해 '정답' 도출'
[파이낸셜뉴스] 중국 인공지능(AI) 스타트업 딥시크가 가성비 높은 AI 'R1'으로 충격을 주자 오픈AI가 지난 1일(현지시간) 새 저가형 추론 모델 챗GPT 'o3 미니'를 공개하며 맞불을 놨다. R1과 o3 미니의 차이는 얼마나 될까. 파이낸셜뉴스가 두 모델을 직접 테스트해본 결과 범용적 쓰임새로는 R1과 o3의 결과치가 유사했다. 가성비 측면에선 R1이 압승이다. 다만 정밀 추론이 필요한 영역에선 R1이 o3 미니를 따라가기엔 무리였다.
2025학년도 수능 국어 독서 영역 문제도(1~34번 문제) 텍스트를 기입하는 방식으로 풀게 해보니 R1은 9개, o3 미니는 8개를 틀렸다. 언어 추론에서 두 모델의 성능이 엇비슷하다고 볼 수 있지만, 저작권 인식에서 차이를 보였다. R1의 경우 저작권과 관련 없이 풀이와 답을 제공한 반면에 o3 미니는 문제 전체를 기입할 경우 저작권에 따라 문제를 풀 수 없다고 답변해 일일이 문제를 나눠 입력했다. 한편 두 모델 모두 국어 문제를 프로그래밍 언어로 변환해 입력하면 더 나은 결과를 내놓을 것으로 예상된다.
특히 비용 측면에서 R1의 매력도가 높다. 기업들이 자신의 업무에 AI를 붙여 사용하려면 개발사가 제공하는 애플리케이션 프로그래밍 인터페이스(API)를 끌어 쓰고 사용료를 낸다. API 사용료를 비교해 보면 R1은 100만개 당 입·출력 토큰 비용이 각각 0.14달러·2.19달러지만 o3 미니는 각각 0.55달러·4.40 달러로 2배 이상 비싸다. 오픈 AI가 기존 추론 모델 o1에 비해 가격을 93%나 낮췄지만 R1은 비용 부담이 훨씬 적다. 가격만으로는 R1이 완승이다. 다만 보안성과 안정성을 고려하면 얘기는 달라진다. R1은 중국 정부의 검열과 개인정보 유출 문제 등이 제기돼 각국 정부가 규제 움직임을 보이고 있다.
#수능 #AI #수학 #챗GPT #오픈AI #딥시크 #o3
wongood@fnnews.com 주원규 기자
Copyright © 파이낸셜뉴스. 무단전재 및 재배포 금지.
- 20대 구직 여성 연이어 시신으로…남성 정액 발견
- 이용기 국힘 대전시의원, 차량서 숨진 채 발견
- 조세호 결혼 7개월만에 건강 문제 "긴급 수술했다"
- 'SNL 출격' 설난영, 김혜경에 "법카 쓰지마" 이준석엔 "식구"
- "폭행애 성병 옮겨" 폭로…배우 전호준 "정당방위" 반박(종합)
- "시동생과 불륜 아내, 시아버지와도 관계" 유재석도 말문이…
- 제주 모 중학교 40대 교사 숨진 채 발견…경찰 수사중
- "故 김새론, 2018년 김수현과 교제? 당시 유명 아이돌 멤버와 사귀어"
- 손흥민에 3억 뜯어낸 협박女, 무속인에 8천만원 입금.."우리도 협박 당했다" 주장, 무슨일?
- "낮에는 환자 진료, 밤에는…" 中여의사, 이중생활 이유가