피차이 "챗GPT보다 강력하고 다재다능"… 한국어 지원

팽동현 2023. 5. 11. 10:28
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

구글이 챗GPT 대항마로 쇄신한 '바드(Bard)'를 본격적으로 선보인다.

'바드'에 챗GPT 대비 경쟁력을 물은 결과 △더 큰 텍스트·코드 데이터셋으로 학습되므로 더 광범위한 프롬프트와 질문에 대해 더 정확하게 응답 가능 △구글 검색을 통해 실제 세계 정보에 접근·처리할 수 있으므로 보다 포괄적이고 최신의 정보 제공 △시, 코드, 대본, 음악, 이메일, 편지 등 다양한 창의적 콘텐츠 생성 등을 꼽았다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

구글 AI챗봇 '바드' 출격… 전세계 180개국 서비스
100개 언어지원하는 '팜2' 적용
최신정보·사칙연산 수행 개선
어도비와 협업 이미지 자격증명
MS·오픈AI와 주도권 본격 경쟁
순다르 피차이 구글 CEO가 구글 I/O 2023 행사에서 기조연설하고 있다. 구글 제공

구글이 챗GPT 대항마 '바드(Bard·음유시인)'를 본격 출격시켰다. 광고부터 오답을 냈던 성능을 대폭 개선해 전면 공개, MS(마이크로소프트)·오픈AI와 생성형AI(인공지능) 주도권을 놓고 맞대결에 나선다.

구글은 10일(현지시간) 자사 연례 개발자 콘퍼런스(I/O)에서 AI챗봇 '바드'의 대기자 명단 운영을 종료하고 전세계 180개국을 대상으로 서비스를 제공한다고 밝혔다. 지난 3월 첫 선을 보인 뒤로 일부 사용자 대상으로 영어 서비스만 해 왔으나 이날 두 번째 지원언어로 한국어와 일본어를 포함시켜 공개 서비스를 개시했다. 곧 40개 언어로 확대할 계획이다.

'바드'는 5400억개 파라미터(매개변수)를 지닌 새로운 LLM(대형언어모델) '팜2(PaLM2)'를 기반으로 한다. 구글에 따르면 '팜2'는 학습에 쓰인 광범위한 데이터셋에 과학논문과 수학적 표현이 포함돼 추론·수학·논리에 강점을 지닌다. 자바스크립트·파이썬 등 인기 언어뿐 아니라 프롤로그·포트란 등 특수 목적 언어까지 20여개 프로그래밍 언어를 학습, 생성AI를 통해 다양한 언어에 대한 코딩·디버깅을 돕는다. 100개 이상 언어에 대한 말뭉치를 학습해 다국어 지원도 강화됐으며 언어의 미묘한 뉘앙스를 이해·생성·번역할 수 있다. 의학 분야에 특화된 메드-팜(Med-PaLM), 사이버보안 업무를 지원하는 세크-팜(Sec-PaLM)도 지원한다.

이날 순다 피차이(사진) 구글 CEO(최고경영자)는 기조연설에서 "'바드'를 비롯한 25개 구글 제품에 '팜2'를 적용했다"고 밝혔다. 특히 '바드'를 MS의 새로운 '빙'과 같이 구글 검색엔진에 접목해 검색서비스를 개선한다는 방침이다. 이용자 피드백을 바탕으로 '바드' 답변을 '지메일'과 '구글 닥스'(Google Docs)'로 바로 내보낼 수 있는 기능도 추가한다. 조만간 '바드'의 질문과 답변에 시각적인 요소도 추가할 예정이다. '바드'의 답변에 텍스트뿐 아니라 구글 검색에서 관련 이미지를 찾아 제시하는 기능을 우선 탑재하고, 이후에는 텍스트와 이미지를 함께 활용해 질문할 수 있는 기능을 추가하기 위해 바드에 '구글 렌즈(Google Lens)'를 결합할 계획이다.

어도비와 생성형AI 분야 협업에도 나선다. 구글 '바드'와 어도비 '파이어플라이(Firefly)'를 통합, 생성된 이미지에 투명성을 부여하도록 오픈소스 기반 콘텐츠 자격증명(Content Credentials) 기술을 적용할 예정이다. '파이어플라이'는 이미지 생성 및 텍스트 효과에 중점을 둔 AI모델로, 저작권 문제 없이 상업적으로 안전하게 쓸 수 있는 콘텐츠를 생성하는 데 중점을 두고 설계됐다. 어도비 스톡 이미지, 개방형 라이선스 콘텐츠 및 저작권이 만료된 퍼블릭 도메인 콘텐츠를 기반으로 학습한다.

이날 구글은 '알파고'로 유명한 딥마인드와 자사 AI 연구조직 간 통합을 바탕으로 새롭게 개발한 AI 기반(파운데이션)모델 '제미니(Gemini)'도 발표했다. 처음부터 멀티모달로 제작되는 '제미니'는 미세조정(파인튜닝) 및 안전성을 위한 테스트 과정을 거쳐 '팜2'와 같이 구글의 여러 제품과 앱 및 기기에 활용될 수 있도록 다양한 규모와 기능으로 제공 예정이다.

현재 구글은 자사 주력사업인 광고 매출의 근간을 이루는 글로벌 검색 시장에서 93%에 달하는 점유율을 보유하고 있다. 하지만 오픈AI의 최신 LLM 'GPT-4' 기반으로 챗GPT와 같은 챗봇 기능을 접목한 MS '빙'의 거센 도전에 직면한 상황이다. '바드'에게 챗GPT 대비 경쟁력을 물은 결과 △더 큰 텍스트·코드 데이터셋으로 학습되므로 더 광범위한 프롬프트와 질문에 대해 더 정확하게 응답 가능 △구글 검색을 통해 실제 세계 정보에 접근·처리할 수 있으므로 보다 포괄적이고 최신의 정보 제공 △시·코드·대본·음악·이메일·편지 등 다양한 창의적 콘텐츠 생성 등을 꼽았다.피차이 CEO는 "전반적으로 '바드'는 '챗GPT'보다 더 강력하고 다재다능한 언어모델"이라며 "더 정확하고 유익한 텍스트를 생성할 수 있으며 질문에 대한 응답으로 더 포괄적이고 최신 정보를 제공할 수 있다. 또한 다양하고 창의적인 텍스트 콘텐츠를 생성할 수도 있다"고 답했다. 사용해보니 최신 정보 반영과 사칙연산 수행 등에 있어선 챗GPT나 '빙'보다 좀 더 나은 모습을 보였다. 다만 인물에 대한 정보를 물으니 엉뚱한 이력을 끼워넣는 등 할루시네이션(환각·거짓말) 문제는 여전히 지적된다.

이런 문제에 대해 피차이 CEO는 "현재 사용되는 LLM들은 아직 한계가 있는 초기 기술"이라며 "구글은 앞으로도 관련 서비스를 확장해 나가며 품질을 중시하고 엄격한 기준을 유지하며 AI 원칙을 준수해 나갈 것"이라고 덧붙였다. 팽동현기자 dhp@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?