시각장애인에 웹툰 읽어주고, 눈짓·몸짓으로 스마트폰 작동 디지털 문턱 허무는 '접근성 기술'

우수민 기자(rsvp@mk.co.kr)정호준(jeong.hojun@mk.co.kr) 2023. 1. 15. 15:48
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

# 시각장애인 A씨는 마트에서 컵라면을 살 때 포장 용기 질감으로 종류를 식별한다. 봉지라면은 봉지 소리로 구별하기도 한다. 하지만 볶음라면을 라면으로 착각해 구매하는 일이 부지기수다. 직원 도움 없이는 깨알 같은 글씨로 적힌 유통기한을 확인하기도 쉽지 않다.

# 중증장애인 B씨는 희귀병인 소뇌위축증으로 제대로 걷거나 서지 못해 주로 바닥에서 생활한다. 전등을 켤 때는 스위치를 누르기 위해 긴 막대를 사용해야 하고 택배가 오면 배송기사에게 현관 비밀번호를 알려줘야 한다. 불편함을 넘어 크고 작은 사고 위험에 늘 노출되는 셈이다.

하지만 스마트폰 카메라로 식료품을 비추면 음성으로 그 종류와 유통기한을 확인해주거나 직접 움직이지 않고도 음성 비서에게 명령해 집 안 가구와 가전을 제어할 수 있다면 이야기가 달라진다. 가족이나 전문 돌봄 인력의 도움 없이도 장애인들이 기술을 통해 일상적 자립이 가능해질 수 있다는 의미다. 이른바 '접근성 기술(Accessibility Technology)'이 꼭 필요한 이유다. 다양성을 존중하는 사회적 분위기와 환경·책임·투명경영(ESG) 강화 기조 속에 국내외 테크업계가 앞다퉈 접근성 확대에 열을 올리고 있다.

◆ 모바일 화면·경험(UI·UX)에 디테일 더해

쇼핑부터 금융, 택시·지하철 같은 대중교통 이용에 콘텐츠 감상까지 전부 스마트폰으로 통하는 시대다. 최근 코로나19와 함께 각종 공공 민원 서비스와 직장 내 업무의 디지털 전환도 빠르게 진행되고 있다. 모바일 서비스를 이용할 수 없다면 사회·경제 활동에 참여하는 일 자체가 어려워지는 셈이다. 이에 장애를 가진 이들이나 노약자처럼 디지털 소외계층의 접근성을 보장하기 위한 UI·UX 개편이 다양하게 이뤄지고 있다.

사지가 자유롭지 못한 스티븐 호킹 박사가 뇌 신호를 읽어내는 컴퓨터를 사용했듯 찰나의 눈짓을 파악해 스마트폰을 조작하는 기능이 등장했다. 손가락이나 목소리로 휴대폰 화면을 조작하기 어려운 사용자를 위해 구글이 개발한 '카메라 스위치'다. 휴대전화 전면 카메라와 기계학습 기술을 활용해 기기가 눈 근처 근육의 미세한 움직임을 포착한다. 상하좌우로 이동하는 눈동자와 입꼬리 올려 미소 짓기, 입 벌리기, 눈썹 움직이기를 비롯한 여섯 가지 신호를 조합해 명령어를 만들 수 있다. 이 같은 동작으로 사진이나 이메일을 열람하고 음악과 영상을 감상할 수 있다. 음식 주문이나 택시 예약, 시계 알람도 이용할 수 있다.

일상과 업무에서 전방위적으로 소통을 이어주는 '메신저'도 시각장애인의 이용 문턱을 낮추고 있다. 카카오톡은 최근 앱 업데이트를 단행하며 '이모티콘을 읽어주는 기능'을 추가했다. 이모티콘 대체 텍스트 제공을 강화하면서다. 대체 텍스트란 시각 약자도 콘텐츠 의미를 알 수 있도록 설명을 제공하고 음성으로 표현할 수 있게 하는 기능이다. 기본 이모티콘뿐 아니라 카카오톡 채팅방에 전송된 모든 이모티콘에 음성 안내가 가능해졌다. 예컨대 '컴퓨터를 보며 일하는 이모티콘'을 전송받은 경우 '일하는 중, 컴퓨터, 곰, 움직이는 이모티콘'이라는 안내가 제공되는 식이다.

카카오톡 채널에 게시되는 이미지도 대체 텍스트 입력이 가능하다. 카카오는 최근 광학문자인식(OCR) 솔루션을 활용해 이 대체 텍스트를 자동으로 완성할 수 있는 기능을 더했다. 이미지상에 있는 문자를 인식해 자동으로 입력되는 방식이다. 카카오페이지는 웹소설 문자음성전환(TTS) 듣기 기능을 제공한다. 낭독 서비스처럼 웹소설 내용을 소리로 들을 수 있다.

시각장애인이 웹툰을 즐길 수 있는 길도 열리고 있다. 네이버웹툰은 이달 완결되거나 연재 중인 웹툰 약 18만개에 대체 텍스트를 적용하기로 했다. 웹툰 속 줄거리를 텍스트로 잘 풀어내려면 말풍선 순서를 명확히 인식하고 말풍선과 말풍선 밖 대사도 구별할 수 있어야 한다. 네이버웹툰은 말풍선과 대화 영역을 추론하는 웹툰 특화 객체 탐지 기술을 개발했다.

◆ 일상 자립 보조하는 애플리케이션도 각광

스마트폰이 그 자체로 장애인들의 '눈'과 '입' '손발'이 되기도 한다. 구글은 2019년 시각장애인과 저시력자를 위한 시각 보조 애플리케이션 '룩아웃'을 선보였다. 스마트폰 카메라를 사용해 사물과 텍스트를 인식하고 이를 음성으로 안내한다. 식품 식별부터 주변 물체 설명까지 다양한 일상 작업을 지원하기 위해 여러 모드를 제공한다. 예컨대 문서 모드는 텍스트 캡처에 유용하다. 포스트잇이나 생일카드 등에 손으로 작성한 문구도 인식할 수 있다. 식품 라벨 모드를 사용하면 포장이나 바코드를 통해 해당 식품이 옥수수 통조림인지 녹두 통조림인지 등을 올바르게 식별한다. iOS 사용자들을 겨냥해서는 마이크로소프트(MS)가 이와 유사하게 '시잉 AI'를 내놨다. 카메라를 비추면 인공지능(AI)이 사람·텍스트·사물 등을 설명해준다. 눈앞에 있는 장면을 묘사해주거나 현금으로 결제할 때 지폐 단위를 확인해주기도 한다.

국내 이용자들에게는 SK텔레콤과 소셜벤처 투아트가 선보인 AI 기반 시각 보조 서비스 '설리번플러스'가 유용하다. 사물이나 인물, 풍경을 스마트폰 카메라로 촬영하면 AI가 화면 속 이미지를 인식해 음성으로 이를 묘사한다. SK텔레콤의 얼굴인식 기술 덕분에 '나이가 33세 정도 된 남성이 웃고 있다'는 식으로 생생한 서술이 가능하다. 지하철 노선도나 식음료 유통기한 역시 쉽게 확인할 수 있다.

비즈니스에 특화한 서비스도 상용화를 앞두고 있다. 3~4월 중 공식 출시 예정인 '설리번A'가 주인공이다. 설리번A에 탑재된 AI는 문서 종류를 빠르게 파악한다. 각 문서의 핵심 내용을 요약하거나 특정 단어를 검색할 수도 있다. 명함 저장 기능도 갖췄다. 명함에 표기된 연락처로 전화를 걸거나 이메일, 문자메시지를 발송할 수 있다. 영수증을 인식해 요약 정보, 품목 정보, 금액처럼 필요한 정보만 선별해 확인할 수 있는 기능도 탑재했다. SK텔레콤 관계자는 "서비스를 향후 AI 비서 앱 '에이닷'과 연계하는 부분까지 폭넓게 검토하고 있다"고 전했다.

AI가 사고나 질병 탓에 후천적으로 목소리를 잃은 이들의 목소리를 되찾아주기도 한다. 개인화 음성합성기술(P-TTS)을 기반으로 루게릭병 환자들의 목소리를 복원한 KT가 대표적이다. 음성 표본 심층학습을 통해 사람의 음색, 어조, 말투를 반영한 목소리를 구현하는 기술이 활용됐다. KT는 환자들이 스마트폰으로 대화체 문장 500개를 녹음한 파일로 목소리를 생성했다. 환자들이 KT의 '마음톡' 앱에 텍스트를 입력하면 앱이 해당 환자의 목소리로 읽어준다. 음성·영상통화도 가능하다.

AI와 사물인터넷(IoT)이 돌봄 인력을 대신하기도 한다. KT는 중증장애인 거주시설에 '24시간 AI 돌봄 서비스'를 무상으로 제공하고 있다. 중증장애인 생활 공간을 스마트홈으로 구현했다. 거동이 불편한 중증장애인도 AI 스피커 음성명령만으로 선풍기, 가습기, 공기청정기, TV 같은 가전을 관제하고 커튼을 여닫을 수 있다.

[우수민 기자 / 정호준 기자]

Copyright © 매일경제 & mk.co.kr. 무단 전재, 재배포 및 AI학습 이용 금지

이 기사에 대해 어떻게 생각하시나요?