“오픈 AI, 새 모델 개발 지연···학습할 데이터 부족”

김세훈 기자 2024. 12. 23. 07:54
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

오픈AI 이미지. AP연합뉴스

챗GPT 개발사 오픈AI의 차세대 주력 인공지능 모델 개발이 당초 목표보다 늦어지고 있다고 월스트리트저널(WSJ)이 22일 전했다.

WSJ가 이날 여러 소식통을 이용해 보도한 내용에 따르면 오픈AI의 코드명 ‘오리온’(Orion)으로 알려진 차세대 AI 모델 GPT-5는 개발 일정이 기약 없이 지연되고 있다. 애초 오픈 AI의 최대 투자사인 마이크로소프트(MS)는 올해 중반께 새 모델이 나올 것으로 예상했으나 실현되지 못했다.

샘 울트먼 오픈 AI 최고경영자(CEO)는 지난 20일 고급추론 AI 모델 ‘o3’를 공개했지만, 새 주력 모델이 언제 나올지는 언급하지 않았다.

오픈 AI는 지금까지 18개월이 넘는 기간 동안 방대한 양의 데이터를 처리하는 대규모 훈련을 최소 2차례 진행했지만 매번 새로운 문제가 발생해 기대했던 결과를 얻지 못한 것으로 전해졌다.

새 모델은 기존의 GPT-4보다는 나은 성능을 보였지만, 투입된 막대한 비용을 정당화할 정도로 발전된 모습은 보여주지 못했다는 것이다. 업계 추정치에 따르면 대규모 AI 훈련에는 6개월간 컴퓨팅 비용으로만 약 5억달러(7247억5000만원)가 쓰일 수 있다.

이전 모델은 인터넷에서 수집한 뉴스 기사나 소셜미디어 게시물, 과학 논문 등 데이터를 AI 훈련에 사용했다. 그러나 새 모델의 경우 더 지능적인 훈련에 필요한 데이터를 충분히 구하지 못한 것이 주요 난관으로 꼽힌다고 WSJ는 전했다.

문제를 해결하기 위해 오픈 AI는 새로운 데이터를 직접 만들기도 하고, 소프트웨어 엔지니어나 수학자들을 고용해 새로운 소프트웨어 코드를 만들거나 복잡한 수학 문제를 풀도록 해 AI가 이를 학습하게 하는 방식 등을 시도하고 있다. 다만 이런 과정은 기존 방식보다 시간이 훨씬 많이 걸린다. 경쟁업체서 수백만 달러를 제시하며 최고 연구원을 빼가려는 시도도 비용부담을 키우고 있다고 WSJ는 보도했다.

AI 모델 개발이 한계에 부딪혔다고 우려하는 회사는 오픈AI만이 아니다. AI 모델의 성능 향상이 정체기를 맞은 것 아니냐는 논쟁이 업계에서 가열되고 있다.

오픈AI의 공동창립자이자 수석과학자였다가 회사를 떠난 일리야 수츠케버는 지난 13일 한 강연에서 “컴퓨터 연산 능력은 향상되고 있지만, 데이터는 늘지 않고 있다”며 “우리가 가진 인터넷은 오직 하나뿐이기 때문”이라고 했다. 그는 AI 모델 학습·훈련에 필요한 데이터를 유한한 자원인 화석연료에 빗대며 “우리가 알고 있는 (생성형 AI 모델의) 사전훈련은 의심할 여지 없이 끝날 것”이라고 했다.

김세훈 기자 ksh3712@kyunghyang.com

Copyright © 경향신문. 무단전재 및 재배포 금지.