챗GPT, 말로 대화하고 사진으로 소통한다

김우용 기자 2023. 9. 26. 09:46
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

챗GPT와 말로 대화하고, 사진을 올려 답변을 받아낼 수 있게 된다.

오픈AI는 25일(현지시간) 챗GPT의 인터페이스에 음성과 이미지 업로드를 추가한다고 발표했다.

이미지 대화 기능은 여행 중 랜드마크 사진을 찍어 올리면, 챗GPT가 흥미로운 부분을 알려준다.

복잡한 그래프를 분석할 수 있고, 모바일 앱에서 이미지 특정 부분에 초점을 맞춰 표시하면 해당 부분으로 대화를 집중시킬 수 있다.

음성재생 설정 이동 통신망에서 음성 재생 시 데이터 요금이 발생할 수 있습니다. 글자 수 10,000자 초과 시 일부만 음성으로 제공합니다.
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

인터페이스에 음성과 이미지 추가

(지디넷코리아=김우용 기자)챗GPT와 말로 대화하고, 사진을 올려 답변을 받아낼 수 있게 된다.

오픈AI는 25일(현지시간) 챗GPT의 인터페이스에 음성과 이미지 업로드를 추가한다고 발표했다.

오픈AI는 새로운 챗GPT 인터페이스를 2주일 내 유료 가입자에게 제공하고, 향후 모든 사용자에게 제공할 계획이라고 밝혔다.

오픈AI가 챗GPT 인터페이스에 음성과 이미지를 도입한다.

챗GPT는 채팅 창 대화로 생성 AI의 대중화를 열었다. 이제 버튼을 눌러 질문을 말하면, 챗GPT가 이를 문자로 변환해 답변을 생성한 뒤 다시 음성으로 변환해 들려준다.

음성 입력을 시작하려면 모바일 앱에서 '설정'의 '새로운 기능'에 들어가 음성 대화를 선택한다. 홈화면 오른쪽 상단의 헤드폰 버튼을 누르고 5가지 음성 중 하나를 선택하면 된다.

이는  음성-텍스트 변환 작업에 특화된 음성 인식 AI 모델인 오픈AI '위스퍼(Whisper)'에 기반한다. 오픈AI는 전문 성우와 협력해 개성있는 목소리를 생성했다. 몇초의 샘플 음성으로 사람과 유사한 소리를 만들 수 있다. 오픈AI는 스포티파이와 협력해 팟캐스트 진행자의 목소리를 다른 언어로 번역하는 작업을 진행중이다.

이미지 대화 기능은 여행 중 랜드마크 사진을 찍어 올리면, 챗GPT가 흥미로운 부분을 알려준다. 냉장고 사진을 찍어 올리면 식사 메뉴를 추천해준다. 이후 조리법을 질문해 레시피를 받을 수 있다. 복잡한 그래프를 분석할 수 있고, 모바일 앱에서 이미지 특정 부분에 초점을 맞춰 표시하면 해당 부분으로 대화를 집중시킬 수 있다.

이미지 기능을 이용하려면 사진 버튼을 탭해 이미지를 캡처하거나 선택하면 된다. iOS나 안드로이드 모바일 앱의 경우 더하기 버튼을 눌러 이미지를 올릴 수 있다.

오픈AI 측은 "우리의 목표는 안전하고 유익한 AGI 구축"이라며 "도구를 점진적으로 제공함으로써 시간이 지남에 따라 개선하고 위험을 완하면서 모든 사람이 미래에 더욱 강력한 시스템에 대비할 수 있을 것"이라고 강조했다.

김우용 기자(yong2@zdnet.co.kr)

Copyright © 지디넷코리아. 무단전재 및 재배포 금지.