오픈AI, 목소리 복제하는 '보이스 엔진' 미리보기 공개
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
오픈AI가 음성을 복제할 수 있는 인공지능(AI) 모델을 공개했다.
29일 벤처비트는 오픈AI가 AI 음성 모델 '보이스 엔진'을 미리보기 버전으로 공개했다고 보도했다.
이번에 공개된 모델은 음성 복제까지 가능하다.
오픈AI 측은 공식 블로그에서 해당 모델을 소수 파트너 그룹에만 우선 제공한다고 밝혔다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
(지디넷코리아=김미정 기자)오픈AI가 음성을 복제할 수 있는 인공지능(AI) 모델을 공개했다. 현재 소수 테스터들만 해당 모델에 접근할 수 있다.
29일 벤처비트는 오픈AI가 AI 음성 모델 '보이스 엔진'을 미리보기 버전으로 공개했다고 보도했다. 모델 개발 기간은 약 2년 걸렸다.
그동안 보이스 모델은 챗GPT의 음성 기능에 탑재됐다. 사용자 음성을 인식하고, 답변을 음성으로 제공하는 역할에 그쳤다. 이번에 공개된 모델은 음성 복제까지 가능하다. 사용자가 15초 분량의 음성 클립을 넣으면, 해당 목소리와 매우 유사한 음성을 생성하는 식이다.

오픈AI 측은 공식 블로그에서 해당 모델을 소수 파트너 그룹에만 우선 제공한다고 밝혔다. 각국 선거를 앞둔 상황에서 악영향을 미칠 수 있다는 우려에서다. 실제 올해 초 일레븐랩스의 음성 복제 기술을 사용해 조 바이든 미국 대통령의 목소리를 복제한 사건이 발생해 연방 정부가 조사에 나선 바 있다.
회사는 "해당 모델은 언어 장애인이나 학생들에게 유용할 것"이라며 "신뢰할 수 있는 소규모 파트너 그룹에게만 제공한 상태"라고 밝혔다. 현재 교육 업체 에이지 오브 러닝, 비디오 번역 업체 헤이젠, 의료용 도구 업체 디마지, 언어 장애용 장치 업체 리복스, 의료 및 교육 장치 업체 라이프스판 등이 보이스 엔진을 받았다.
블로그 내용에 따르면, 파트너사는 무단 사칭을 금지하고 음성 제공자의 사전 동의를 요구하는 사용 정책을 지켜야 한다. 생성된 복제 음성에는 귀에 들리지 않는 워터마크도 넣어야 한다.
김미정 기자(notyetkim@zdnet.co.kr)
Copyright © 지디넷코리아. 무단전재 및 재배포 금지.
- MS-오픈AI, 135조 규모 AI 슈퍼컴퓨터 개발...전용칩만 수백만개
- '오픈AI 라이벌' 앤트로픽, 3.7兆 투자금 '잭팟'…"아마존 최대 투자"
- [영상] "영화 한 편도 뚝딱"…오픈AI, '소라'로 할리우드 넘어설까
- "오픈AI 연봉이 130억"…저커버그, AI 인재 유출에 직접 나섰다
- 아르테미스 2호 국내 위성, 교신은 끝내 안돼…"추락 가능성"
- "충전 없이 50년"…꿈의 배터리 개발, 어디까지 왔나
- LG디스플레이 "특허 로열티 수익 매년 증가"
- "잠이 안 온다"…주주들 고성 이어진 한화솔루션 유증 설명회
- "갤럭시Z 와이드 폴드, 4대 3 화면 채택…애플 폴더블 대응"
- 쿠팡Inc, 로저스 한국 대표에 60억원 규모 주식보상