이젠 음성 대화도 나눈다…'말문' 트인 챗GPT

최진석 2023. 9. 26. 17:53
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

생성 인공지능(AI) 챗GPT가 한 단계 더 진화했다.

25일(현지시간) 로이터 등에 따르면 오픈AI는 이날 챗GPT에 '보고 듣고 말하는' 새로운 기능을 제공한다고 밝혔다.

말로 질문하면 챗GPT가 이를 텍스트로 변환해 대규모언어모델(LLM)에 전달하고, 이에 대한 답변을 다시 음성으로 변환해 말하는 구조다.

영상에서 한 사용자가 자전거 이미지를 업로드하고 시트 높이를 조정하기 위해 도움을 요청하자 챗GPT는 일반적인 답을 제시했다.

음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

말로 질문하면 음성으로 대답
사진 보고 수학문제 풀이도
오픈AI "유료 구독자에 先제공"

생성 인공지능(AI) 챗GPT가 한 단계 더 진화했다. 사람과 음성으로 대화하고, 이미지를 분석해 질문에 답할 수 있는 기능이 추가됐다. 챗GPT 개발회사인 오픈AI가 최종 목표인 범용인공지능(AGI)에 한 걸음 더 다가섰다는 평가가 나온다.

25일(현지시간) 로이터 등에 따르면 오픈AI는 이날 챗GPT에 ‘보고 듣고 말하는’ 새로운 기능을 제공한다고 밝혔다. 프롬프트(명령어)를 대화창에 입력한 것과 원리는 같다. 말로 질문하면 챗GPT가 이를 텍스트로 변환해 대규모언어모델(LLM)에 전달하고, 이에 대한 답변을 다시 음성으로 변환해 말하는 구조다.

오픈AI는 또 세계 최대 음원 스트리밍 서비스인 스포티파이와 협력해 같은 목소리를 다른 언어로 번역하는 방안도 검토 중이라고 설명했다. 이 회사는 이 기능을 향후 2주 안에 챗GPT 유료 구독자에게 제공하고, 이후 모든 사람이 이용할 수 있도록 할 것이라고 밝혔다.

이미지를 보고 답하는 기능도 적용했다. 이용자가 이미지를 대화창에 올리고, 그 이미지를 토대로 질문하면 챗GPT가 이미지를 보고 답해주는 방식이다. 수학 문제를 사진으로 올리면 챗GPT가 사진에 담긴 문제를 인식해 풀이 과정을 설명해줄 수 있다.

오픈AI는 이와 관련한 동영상도 공개했다. 영상에서 한 사용자가 자전거 이미지를 업로드하고 시트 높이를 조정하기 위해 도움을 요청하자 챗GPT는 일반적인 답을 제시했다. 이후 이용자가 자전거 시트 고정 장치 주위에 동그라미를 한 다음 도움을 요청하자 챗GPT는 볼트 유형을 인식하고 육각 렌치가 필요하다고 알려줬다. 또 사용 설명서와 공구 상자의 사진을 보고 올바른 크기의 렌치가 있는지도 확인해 줬다. 이 기능은 향후 몇 주 내 유료 구독자와 기업 이용자에게 제공될 예정이다.

회사 관계자는 “사용자에게 도움이 될 새로운 도구를 꾸준히 제공할 계획”이라며 “최종 목표는 안전하고 유익한 AGI를 구축하는 것”이라고 말했다.

실리콘밸리=최진석 특파원 iskra@hankyung.com

클래식과 미술의 모든 것 '아르떼'에서 확인하세요
한국경제·모바일한경·WSJ 구독신청하기

Copyright © 한국경제. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?