전문가들도 관심 대폭발..."GPT-4 진보 놀라워, 일부 한계점도"

14일(현지시각) 공개된 GPT-4 소개 페이지. /사진=오픈AI 홈페이지 갈무리

오픈AI가 GPT-4를 깜짝 공개하면서 IT 전문가들의 관심도 대폭발했다. 이들은 이미지의 맥락까지 이해하고 설명해주는 멀티모달(Multimodal) 기능뿐만 아니라 전문지식이 늘었고, 긴 글까지 이해하는 고급 추론 기능이 추가되면서 생산성이 크게 향상됐다고 평가했다. 그러나 여전히 할루시네이션(환각)을 완전히 해결하지 못했고, 답변 생성 속도 등으로 미루어 GPT-3.5에서 파라미터(매개변수)를 크게 늘리지는 못한 것으로 봤다.

삼성생명 소속 데이터 사이언티스트 이상훈 씨는 한국 텐서플로 페이스북에 GPT-4 기술 리포트를 리뷰하며 "대부분 시험에서 큰 향상을 보여주고 있고, GPT-3.5 대비 각종 벤치마크 점수를 크게 갱신했다"며 "특히 GPT-3.5의 영어 정확도(70.1%)보다 GPT-4의 한국어 정확도(77.0%)가 높아진 점이 가장 인상 깊었다"고 말했다. GPT-4의 영어 정확도는 85.5%였는데, GPT-4는 영어뿐만 아니라 다양한 언어의 독해 능력까지 끌어올렸다는 의미다.

전문가들은 마이크로소프트(MS)와 손잡은 오픈AI가 유료 가입자 확보를 위해 GPT-4의 생산성 향상에 집중했으리라 추측했다. B2B 측면에서 기업들이 기꺼이 구매할 물건을 만들었다는 것이다. 하정우 네이버 AI연구소장은 "B2B 향으로 정말 지갑을 제대로 열게 할 쓸만한 물건을 만들어 낸 느낌"이라고 강조했다.

하 소장은 "변호사시험이나 SAT, GRE 같이 특정 범위에 대해서는 상위 10%를 기록할 만큼 믿을 수 있는 답변을 하게 됐으니 상당히 믿을 수 있는 생산성 도구다"며 "마이크로소프트(MS) 클라우드 비즈니스 관점에서는 합이 굉장히 잘 맞는 도구다"고 설명했다.

오픈AI에 투자한 MS는 오는 16일(미 현지 시각) 'AI와 함께하는 일의 미래(Future of Work with AI)' 컨퍼런스를 개최한다. 이 자리에서 사티아 나델라 MS CEO는 AI를 통해 '일하는 방식의 변화', 즉 생산성 확대가 어떻게 이루어질지 직접 설명할 예정이다. 하 소장은 "(GPT-4를 보고 나니 MS가) 그래서 Productivity(생산성)를 강조했구나 싶었다"고 덧붙였다.

━

여전히 거짓말을 하는 GPT·응답 속도 변화 없어…"예상했던 수준 벗어나지 않아"

━

다만 일부에서는 한계점을 지적하는 목소리도 있다. 파라미터가 100조 수준으로 늘어날 것이라는 전망과 달리 크게 늘지않았다는 평가나 멀티모달역시 이미지 맥락을 이해하지만 음성·이미지·영상을 이해·생성하는 수준에는 아직 못미쳤다는 평가다.

하 소장은 "GPT-4는 GPT-3.5 레거시 모드와 속도가 동일한 것으로 나오는데 이를 통해 추산하면 모델 크기가 그리 많이 커지지 않았다고 봐야 될 것 같다"며 "맥락 전체를 볼 수 있는 총 글의 길이가 많이 늘었다는 것을 고려해도 세간에서 이야기하는 100조 파라미터는 말도 안 되는 소리 같다"고 설명했다.

[서울=뉴시스] 권창회 기자 = 출판계에 대화형 인공지능(AI) 챗GPT 바람이 거세다. 예스24에 따르면 1월 '챗GPT' 도서 판매량은 전월 대비 3.4배 증가한 데 이어 2월에는 94.5배로 급증했다. 사진은 9일 오후 서울 시내 대형서점에 진열된 챗GPT 관련 도서. 2023.03.09.

실제 유료 서비스인 챗GPT 플러스 사용자들은 이날부터 GPT-4를 체험할 수 있게 됐는데 GPT-4가 GPT-3.5와 속도 차이가 없다고 입 모았다. 특히 챗GPT 플러스 사용자 중 속도가 향상된 '터보' 모드를 이용했던 사용자들은 "오히려 느려졌다"고 불평했다.

아울러 테크 리포트에 따르면 GPT-4가 GPT-3.5보다 정답을 내놓을 확률, 할루시네이션에 빠지지 않을 확률이 40% 높지만 여전히 할루시네이션이 완전히 해결되지 않았다고 꼬집었다.

전문가들은 오픈AI가 GPT-4와 관련 정보를 공개하지 않는 점도 아쉽다는 반응이다. 지금까지 오픈AI는 주로 R&D(연구·개발) 영역에서 활동하며 AI 생태계 전반의 발전에 기여해왔다. 그러나 GPT-3.5부터 파라미터 수를 비밀에 부치는 등 모델의 자세한 내용을 공개하지 않고 있다.

이상훈 씨는 "이제는 API도 실무에 바로 쓰일 수 있도록 확대 제공하고 킬러앱 영역으로의 진출까지 고려하고 있다"며 "이미 텍스트 생성 AI 앱 재스퍼는 유료 구독자를 많이 잃었다고 한다"고 했다. 기술 발전과 함께 경쟁이 심화되면서 오픈AI가 이제 연구 집단이 아닌 하나의 기업으로 변화하는 것으로 풀이된다.

하 소장은 "오픈AI는 윈도우 초창기의 영화를 다시 한번 걸어보겠다는 MS 때문에 앞으로 (모델 공개를) 못할 것 같지만, 만약 구글의 팜(PaLM)이 메타의 라마(LLaMA)처럼 모델을 공개하고 사용성이 늘면 패권이 어떻게 변화할지 모른다"고 지적했다.

배한님 기자 bhn25@mt.co.kr

머니투데이

IT/과학

전문가들도 관심 대폭발..."GPT-4 진보 놀라워, 일부 한계점도"