이 녀석 수포자야?…수능 봤더니 영어 2등급 수학 9등급
기술검증기관 애나는 연세대 인공지능대학 김시호교수 연구팀과 함께 인공지능(AI)챗봇인 챗GPT에게 2023학년도 수능 영어와 수학 과목을 풀어보게한 후 이 결과를 6일 공개했다. 이번 테스트는 수능에 출제된 문제 전체를 입력하고 답을 확인하는 방식으로 진행됐다. 그림이 포함돼 문항의 입력이 불가능한 경우는 제외했다.
실험 결과 챗GPT는 영어 수능 시험에서 듣기 평가의 경우 16문제 중 14문제, 독해 평가는 17문제 중 13문제를 맞춰 합산 점수 82점을 취득했다. 이는 수능 2등급 수준에 해당하는 점수다. 챗GPT는 문단에 함축된 의미 추론, 요지 파악, 글의 목적과 주제 파악 등 난이도가 높은 문제에서도 모두 정답을 맞췄다.
반면 수학에서는 상반된 결과가 나왔다. 공통 과목 분야에서는 20문제 중 6문제에 정답을 맞췄지만 확률과 통계, 미적분학, 기하 분야의 문제는 전부 틀렸다. 수능 등급으로 환산할 경우 최하등급인 9등급 수준의 실력이다.
이상호 애나 최고기술경영자(CTO)는 “챗GPT는 한자리수 곱셈만 가능한 것으로 보인다. 두자리수 곱셈부터는 거의 다 오답”이라고 밝혔다. 그는 “기계학습 방법으로 수학을 배우는 챗GPT의 경우 정확한 데이터가 아니라 오히려 너무 많은 데이터를 분석해 답을 내놓기 때문에 수리영역에서는 ‘애매한 답’을 내놓게 된다”며 “하지만 내년 2월 출시될 챗GPT4는 수리영역에서도 개선된 모습을 보여줄 것으로 기대한다”고 덧붙였다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- “재작년 꼭지에 집 산 제 자신 용서할 수 없네요” [매부리레터] - 매일경제
- “여보 설마했는데”…연 6%대 중도금 대출 통보에 비명 - 매일경제
- “안녕하세요 조민입니다” 인스타 개설 조민…팔로워 보니 - 매일경제
- 얼굴 공개 조민 “표창장으로 의사될 순 없어…의사 자질 충분하다더라” - 매일경제
- “잘났어 정말” 타는 순간 ‘멋진 아빠’ 됐다…75년간 질투유발 SUV [카슐랭] - 매일경제
- “유명셰프 믿고 산 갈비, 비계 많아 못 먹을 지경”...홈쇼핑 LA갈비에 부글부글 - 매일경제
- “주가 지지부진하네, 팔자”...23만 동학개미 삼성전자 떠났다 - 매일경제
- 새벽4시 튀르키예 난민촌 '와르르'…"사망자 최대 1만명 이를듯" - 매일경제
- "AI, 자본주의 흔드는 날 온다"… 챗GPT 아버지의 경고 - 매일경제
- 송은범 계약 협상 다시 원점? LG의 속내는 과연 무엇일까 - MK스포츠