“오픈AI GPT-5 개발 지연”…AI 개발 속도 둔화 현실화?(종합)

변선진 2024. 12. 23. 09:13
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

WSJ “데이터 한계로 GPT-5 개발 지연”
시장 우려했던 AI 개발 속도 둔화 현실화

챗GPT 개발사 오픈AI의 차세대 인공지능(AI) 모델 GPT-5 개발이 데이터 한계로 기약 없이 지연되고 있는 것으로 전해졌다. 앞으로 AI 모델 학습·추론의 핵심인 데이터 부족 등으로 테크 기업의 AI 기술 개발 속도가 본격적으로 둔화될 것이라는 평가가 나온다.

GPT-5 도대체 언제 공개되나…“개발 어려움”
로이터연합뉴스

월스트리트저널(WSJ)은 22일(현지시간) 복수의 소식통을 인용해 오픈AI의 코드명 ‘오리온(Orion)’으로 알려진 차세대 AI 모델 GPT-5는 막대한 개발 비용에도 개발이 당초 일정보다 훨씬 지연되고 있다고 보도했다.

오픈AI는 지난해 3월 GPT-4가 출시된 이후 곧바로 GPT-5 개발에 착수한 것으로 알려졌다. 오픈AI의 최대 투자사 마이크로소프트(MS)는 올해 중반께 이 모델이 나올 것으로 예상했다. 그러나 최소 두 차례 실시한 방대한 양의 데이터를 처리하는 대규모 훈련 과정에서 매번 새로운 문제가 발생하면서 기대했던 결과를 얻지 못했다는 것이다.

WSJ는 “새 모델은 기존의 GPT-4보다 나은 성능을 보였지만, 여기에 투입된 막대한 비용을 정당화할 만큼의 충분한 발전은 보여주지 못했다”고 평가했다. 업계 추정치에 따르면 이 정도의 대규모 AI 훈련에는 6개월간 컴퓨팅 비용만으로 약 5억달러(약 7200억원)가 소요될 수 있다.

샘 올트먼 오픈AI 최고경영자(CEO)는 지난 20일 고급 추론 AI 모델 ‘o3’를 공개했지만, GPT-5라고 부를 만한 새 주력 모델이 언제 나올지에 대해서는 언급하지 않았다. WSJ는 “GPT-5의 경우 항공편 예약과 같은 인간의 일상 작업뿐만 아니라, 새로운 과학적 발견의 문을 열어줄 것”이라고 전망했다. 한 전직 오픈AI 임원은 GPT-4가 똑똑한 고등학생 수준이었다면, GPT-5는 일부 작업에서 박사 학위를 받은 수준을 보일 것이라고 자신했다.

다만, 현재까지 개발이 지연되고 있는 데는 더 지능적인 훈련에 필요한 데이터가 그만큼 충분하지 않다는 점이 가장 큰 난제로 꼽힌다. 이전 모델의 경우 오픈AI는 인터넷에서 수집한 뉴스 기사, 사회관계망서비스(SNS) 게시물, 과학 논문 등 데이터를 AI 훈련에 사용했는데, 이제 이는 부족하다는 설명이다.

이에 따라 오픈AI는 데이터를 직접 생성하기로 했다. 이를 위해 소프트웨어 엔지니어, 수학자들을 고용해 새로운 소프트웨어 코드를 만들거나 복잡한 수학 문제를 풀도록 해 AI가 이를 학습하게 하는 방식을 시도했다.

그러나 매우 느리다는 게 치명적인 단점이다. WSJ는 “GPT-4의 경우 약 13조개의 토큰(GPT 모델 입력 기본단위)으로 훈련됐다. (하물며 GPT-5 개발을 위해) 1000명의 사람이 하루에 5000개의 단어를 쓰면 10억 개의 토큰을 생성하는 데만 몇 달이 걸린다”고 부연했다.

이 와중에 경쟁업체에서 수백만달러를 제시하며 오픈AI 최고 연구원을 빼가려는 시도가 이어지고 있다. 올해에만 일리야 수츠케버 오픈AI 공동 창업자를 비롯해 20명 이상이 오픈AI를 떠났다. WSJ는 “그 사이 경쟁사는 오픈AI의 GPT-4와 비견할 만한 수준의 AI 제품을 내놨다”며 예로 앤스로픽의 클로드 3, 구글의 노트북LM을 들었다.

AI 개발 속도 둔화 현실화?

생성형AI의 선두주자 오픈AI마저 AI 모델 개발이 한계에 부딪히면서 AI 모델 성능 향상이 본격적으로 정체기를 맞는 게 아니냐는 우려가 커지고 있다.

수츠케버 오픈AI 전 공동 창립자는 지난 13일 강연에서 “컴퓨터 연산 능력은 향상하고 있지만, 데이터는 늘지 않고 있다”며 “인터넷은 오직 하나뿐이기 때문”이라고 지적했다. 이어 AI 모델 학습·훈련에 필요한 데이터를 유한한 자원인 화석연료 비유하며 “우리가 알고 있는 (생성형 AI 모델의) 사전 훈련은 고갈돼 끝날 것”이라고 전망했다. 순다르 피차이 구글 CEO는 관련해 지난 4일 뉴욕타임스(NYT) 딜북 서밋에서 “쉽게 따먹을 수 있는 과일은 모두 수확됐다”며 AI 기술 개발 속도가 지연되고 있다고 강조한 바 있다.

블룸버그통신은 “챗GPT의 등장은 AI가 모든 종류의 사업을 뒤흔들고 있다는 우려를 불러일으켰으나 2년이 지난 지금, 예상했던 것만큼 대재앙이 일어나지는 않았다”고 전했다.

변선진 기자 sj@asiae.co.kr

Copyright © 아시아경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?