AI 경쟁서 뒤처지는 구글… 구글의 바드, MS의 빙보다 성능 떨어져

실리콘밸리/김성민 특파원 입력 2023. 3. 24. 11:21 수정 2023. 3. 24. 14:10
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글. /AFP 연합뉴스

구글이 지난 21일(현지시각) 미국과 영국에서 일부 사용자를 대상으로 내놓은 인공지능(AI) 챗봇 ‘바드’의 성능이 기대에 미치지 못한다는 평가가 나왔다. 오픈AI의 챗GPT와 마이크로소프트(MS)의 빙 챗봇에 비해 성능이 떨어진다는 것이다.

23일(현지시각) 인사이더는 “이용자들이 바드에 대해 실망감을 나타내고 있다”고 보도했다. 사용자가 챗GPT와 빙, 바드에 똑같은 질문을 던질 경우 바드가 제대로 된 답을 내놓지 못하는 경우가 많다는 뜻이다. 유명 테크 유튜버 마르케스 브라운리는 자신의 트위터에 “오늘 구글 바드를 이용해봤는데 이런 말을 하게 될 줄 몰랐다. 지금까지 빙이 (특정 채팅 기능에서) 구글의 바드보다 훨씬 앞서 있다”고 했다.

미 펜실베이니아대 와튼스쿨의 에단 몰릭 교수도 “아직 판단이 이른 감이 있지만, 구글의 바드는 MS의 빙이나 오픈AI의 GPT-4만큼의 학습 도구로서의 능력은 없는 것 같다”고 했다. 몰릭 교수는 바드에게 프랑스 고정 운문 형식인 시를 짓도록 실험했는데 결과물의 품질이 챗GPT나 빙에 비해 떨어진다는 것이다.

영화제작자 데이비드 린치도 바드에게 영화 스타워즈의 새로운 시나리오를 쓰라고 명령했고 실망했다고 밝혔다. 그는 “GPT-4로 만든 영화 시나리오는 흥미진진했지만 바드는 평범한 것을 내놓았다”고 했다. 바드는 단어 퍼즐 게임에서도 빙에 비해 성능이 떨어졌다. 게임 제작자들에 따르면 한 쌍의 단어가 무엇을 의미하는지를 맞추는 온라인 퍼즐 ‘투퍼 구퍼(Twofer Goofer)’에서 바드는 정답을 하나도 맞추지 못했다. 오픈AI가 최근 출시한 GPT-4가 96%, 인간이 82%의 정답률을 보이는 것과 큰 차이다.

테크 업계에선 ‘AI의 선두주자’로 알려졌던 구글이 오픈AI의 부상으로 완전히 코너에 몰렸다고 본다. 특히 AI의 안정성을 강조하다가 AI 챗봇 바드의 능력을 과도하게 제한한 것 아니냐는 분석도 나온다. 인사이더는 “구글은 혁신가의 딜레마에 빠졌다”며 “혁신에 실패하면서 민첩한 신생 기업의 위협에 직면할 수 있다”고 했다.

Copyright © 조선일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?