[머니 시그널] 듣고 말하는 AI, 세상을 어떻게 바꿀까
당신에게 귀 기울여 주고 그리고 당신을 이해해주고 알아줄 존재.
인공지능 AI를 이렇게 표현한 영화 그녀.
기억하십니까?
[영화 '그녀' 중 일부 : "좋은 아침, 테어도르 (좋은 아침) 5분 후에 회의야, 벌떡 좀 일어나 보실래요? 일어나!"]
사람처럼 말하고 그림도 그리고 작곡까지 했던 인공지능 운영 체계 사만다.
남자 주인공은 사만다와 사랑에 빠지기도 합니다.
10년 전 이 영화가 다시 소환된 이유?
오픈AI의 GPT-4o 때문입니다.
4o에서 o는 옴니라는 단어의 앞글자로써 영화 속의 사만다로서 어디서나 존재한다는 뜻인데요.
핵심은 말, 음성입니다.
사람처럼 듣고 말합니다.
혹시 이미 그런 거 많잖아. 라고 생각하신다면 큰 착각이십니다.
이미 있는 아마존의 아이폰의 시리, 그리고 갤럭시의 빅스비도 음성 기반이죠.
다만 기존 인공지능은 음성형 텍스트로 바꿔서 음성을 텍스트로 바꿔서 인식하고 답변도 텍스트로 먼저 만든 다음 음성으로 합성하는 식이었습니다.
이제는 음성을 음성 그 자체로 인식합니다.
처리 과정이 그만큼 빨라졌다는 것이고요.
목소리에 담긴 감정이나 배경이 섞인 소리도 알아차릴 수 있습니다.
0.3초, 눈 깜빡이는 찰나의 시간에 GPT-4o가 바로 반영할 수 있는 겁니다.
실시간 대화가 가능하고 중간에 말을 끊어도 됩니다.
일단 AI 비서 시장이 큰 힘을 받을 수 있습니다.
지금까지 부진했지만, 앞으로는 차원이 다를 수 있습니다.
구글은 음성을 기반으로 기억력까지 갖춘 AI 비서 아스트라를 이미 선보였고 애플과 아마존도 시리, 알렉사를 업그레이드하겠다고 나섰습니다.
돈이 될 거라고 보고 너도나도 뛰어드는 분위기입니다.
듣고 말하는 AI가 가져올 변화, 가늠하긴 어렵습니다.
당장 80 넘으신 저희 부모님도 GPT-4o와 대화할 수 있습니다.
스마트폰을 켜서 무언가를 입력하고 읽고 또 입력하고 보통 어려운 일이 아니었습니다.
말로 다 가능해진다면 어르신들에게 또 하나의 혁명일 수 있습니다.
여러 분야의 산업에 지각 변동을 일으킬 수 있습니다.
이렇게 생성 AI 중심엔 분명 말, 음성이 있습니다.
그런데 이런 측면도 있을 수 있습니다.
영화 그녀의 인공지능 사만다와 GPT-4o의 목소리를 들어보실까요?
[영화 '그녀' 중 일부 : "안녕하세요, 저 여기 있어요. (안녕하세요.) 저는 사만다예요."]
[GPT-4o 삽입 목소리 : "안녕, 오늘 좋은데 당신은 어때요? 오픈AI 로고가 들어간 옷을 입고 있네요. 좋은 선택이에요."]
영화 속 사만다는 여러분도 잘 아시는 영화배우 스칼렛 요한슨의 연기였습니다.
GPT-4o의 음성의 허스키한 목소리와 많이 닮았죠?
배우가 목소리 사용을 허락한 거 아닙니다.
반대로 명확하게 거절했습니다.
그런데도 오픈AI가 비슷한 목소리를 사용해 논란이 커졌고 이 목소리 삭제됐습니다.
이 문제 표절이나 저작권에 그치지 않습니다.
한번 상상해 보시죠.
AI가 내 가족의 목소리를 뺏겨 보이스피싱을 해온다면 어떻겠습니까?
아이폰이 세상을 뒤집어 놓은 만큼 생성형 AI도 그만큼 세상을 바꿀 거다.
엔비디아의 젠슨 황의 말입니다.
■ 제보하기
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : kbs1234@kbs.co.kr
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 카카오 '마이뷰', 유튜브에서 KBS뉴스를 구독해주세요!
KBS
Copyright © KBS. 무단전재 및 재배포 금지.