“텍스트·이미지는 너무 쉽잖아”...이제 ‘말발’로 이겨야한다는 ‘이것’
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.
생성형 인공지능(AI)가 나날이 고도화하고 있다.
29일 정보기술(IT)업계에 따르면 아마존은 조만간 전면 개편한 AI 음성 비서 '알렉사(Alexa)'를 출시한다.
오픈AI도 지난달 유료 사용자 일부를 대상으로 멀티모달이 적용된 'GPT-포오(4o)'의 고급 음성 모드 알파 버전을 제공했다.
AI가 텍스트 및 이미지 정보를 음성으로 빠르게 변환해 응답을 조속히 도출해내는 것이 특징이다.
이 글자크기로 변경됩니다.
(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.
29일 정보기술(IT)업계에 따르면 아마존은 조만간 전면 개편한 AI 음성 비서 ‘알렉사(Alexa)’를 출시한다. 워싱턴포스트는 전날 알렉사가 대규모언어모델(LLM)을 활용해 복잡한 대화도 가능한 AI가 될 것이라고 보도했다. 기존에는 날씨나 환율과 같은 간단한 질문에만 음성으로 답변할 수 있었다.
오픈AI도 지난달 유료 사용자 일부를 대상으로 멀티모달이 적용된 ‘GPT-포오(4o)’의 고급 음성 모드 알파 버전을 제공했다. AI가 텍스트 및 이미지 정보를 음성으로 빠르게 변환해 응답을 조속히 도출해내는 것이 특징이다. 사용자의 목소리에서 느껴지는 감정도 인지할 수 있다.
애플은 다음 달 신제품 출시 행사에서 아이폰16에 들어가는 음성 비서 ‘시리(Siri)’의 업그레이드 버전을 공개할 방침이다. 구글은 올해 안에 ‘프로젝트 아스트라’를 선보이기 위한 작업에 한창이다.
메타 역시 유명 연예인의 목소리를 ‘메타 AI’에 탑재하기 위해 협상 중이라는 소식이 전해졌다. 텍스트형 서비스를 대화형 서비스로 전환해 사용자 편의성을 제고하고 커뮤니케이션 능력을 끌어올리겠다는 구상이다.
우리나라도 네이버가 초대규모 AI ‘하이퍼클로바X’ 기반의 ‘스피치X’ 기술을 내놨다. 복잡한 발화 패턴을 인식하고 언어와 문맥을 이해하도록 설계돼 자연스러운 음성을 생성한다. 음성 번역, 심리 상담, 가상 비서, 법률 자문 등에 이르기까지 다양한 용도로 활용될 전망이다.
복수의 IT업계 관계자는 “이용자들이 정확한 답변을 주고 대화 능력이 뛰어난 AI를 원하는 만큼 다양한 형태의 데이터를 처리하는 AI로의 기술 발전 속도가 빨라지고 있다”며 “초반에는 무료로 제공하다가 어느 정도 시간이 지나 유료화하면 수익 창출로 이어지기 때문에 테크기업들의 AI 사업 모델이 재편될 것”이라고 말했다.
Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지
- [MBN] 무속인으로 사는 '순돌이' 이건주 - 매일경제
- [단독] 두산밥캣·로보틱스 흡수합병 철회...금감원 정정 요구에 원안 수정 - 매일경제
- 오늘의 운세 2024년 8월 29일 木(음력 7월 26일) - 매일경제
- 김태호 PD, 청담동 노후 연립주택 300억 매입…신사옥 짓나 - 매일경제
- 서울 한복판 싱크홀에 달리던 승용차 빠져...80대男 운전자·70대 女 병원 이송 - 매일경제
- “성인물 강압 촬영 없었다”…두 달 만에 한선월 사망이유 밝힌 남편 - 매일경제
- 이재명 수사했던 이정섭 검사 탄핵안 기각…헌재 전원일치 결정 - 매일경제
- “아무나 소화 못해”…평범한 티셔츠 대변신, 한예슬 패션 ‘화제’ - 매일경제
- “尹, 전직 검사 아니라 대통령답게 행동해야”…민주당, 의료대란특위 출범 - 매일경제
- “5명밖에 안 뽑혔는데...” 울산 선수가 대표팀에 많이 뽑혔다? 김판곤 감독 “‘더 뽑혀야 한다