시각장애인에게 작품을 그리듯 설명… AI 기술로 장애 보듬는다

전남혁 기자 2024. 5. 25. 01:43
음성재생 설정
번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

[위클리 리포트] 사회적 약자 돕는 AI
시청각 정보 동시 처리 ‘멀티모달’ 기술이 눈-귀 역할
MS는 미술 작품 해설 서비스, 오픈AI는 음성비서 개발
삼성에선 케어기능 가전 내놔… 노인 돌봄 로봇도 진화
오픈AI는 시각장애인이 GPT-4o 를 통해 각종 정보를 제공받는 동영상을 13일(현지 시간) 공개했다. 오픈AI 유튜브 화면 캡처
《윤리-안전 우려속 ‘선한 AI’


인공지능(AI) 기술 악용에 대한 우려가 커지며 AI 윤리와 안전을 두고 세계 각국이 규제를 도입하고 있다. 하지만 한편에서는 노인과 장애인 등 사회적 약자를 돕는 서비스가 출시되고 있다. AI가 시각장애인에게 작품을 그리듯 설명하고, 홀로 사는 노인들의 안부를 체크한다. 장애인의 눈과 귀, 어르신의 말벗으로 거듭나는 ‘선한 AI’의 세계를 들여다본다.》


“‘자화상’은 1887년 빈센트 반 고흐가 판지(板紙)와 유성 페인트를 사용해 그린 그림입니다. 갈색과 흰색이 살짝 섞인 붉은 콧수염과 턱수염을 가진 남자가 그림의 주인공입니다. 그의 녹색 눈은 관람자를 직접 응시하고 있으며, 피부는 창백하고 뺨은 분홍빛입니다.”

큐레이터가 작품 앞에서 설명하는 듯한 이 내용은 마이크로소프트(MS)의 인공지능(AI) 서비스 ‘코파일럿’이 작성한 것이다. MS는 최근 네덜란드 암스테르담 국립미술관과 협력해 AI로 약 100만 건의 미술 작품에 대한 상세한 해설을 만들어내는 작업에 착수했다. 예술 작품을 온전히 향유할 수 없는 시각장애인들에게 작품 설명을 제공하기 위해서다.

암스테르담 박물관 관계자는 “코파일럿이 아니었다면 몇 년은 걸렸을 일을 단 몇 시간 만에 끝낼 수 있게 됐다”고 했다. 청력 손실과 실명을 유발하는 어셔 증후군을 앓고 있는 카린 더 브라윈 씨는 “AI가 생성한 자세한 설명을 통해 머릿속으로 작품을 그릴 수 있게 됐다”고 평가했다.

AI 기술이 딥페이크와 허위정보를 양산하고 인류의 삶에 위협이 될 것이라는 우려가 많다. 안전과 윤리를 위한 규제를 요구하는 목소리가 커지고 있다. 하지만 챗GPT가 촉발한 AI 경쟁이 각종 정보통신기술(ICT)과 결합되며 장애인, 노약자 등 취약계층 지원에 활용되는 순기능 사례도 늘고 있다.

● 장애인 눈, 귀 돼 주는 빅테크 ‘멀티모달’ 기술

빅테크 기업들은 지난해부터 문서를 넘어 이미지와 음성, 텍스트를 동시에 처리하는 ‘멀티모달 AI’ 기술을 개발하고 있다. 오픈AI의 ‘GPT-4’, 구글의 ‘제미나이’가 대표적이다. AI의 음성과 이미지 처리 능력이 고도화되면서 사람들의 눈과 귀 역할까지 일부 가능해졌다.

오픈AI가 13일(현지 시간) 공개한 새로운 음성비서 서비스 ‘GPT-4o’의 시각 및 음성 처리 능력도 시각장애인 등에게 도움이 될 수 있을 것으로 전망된다. GPT-4o는 전작 대비 10배 이상 개선된 0.32초가량의 빠른 응답 속도가 특징이다. 장애인에게 사람 수준으로 즉각적인 도움을 줄 수 있다는 얘기다.

오픈AI는 같은 날 시각장애인으로 보이는 사용자가 GPT-4o를 사용하는 동영상을 공개했다. 버킹엄궁 앞에서 사용자가 “지금 왕이 궁 안에 머물고 있니”라고 묻자 GPT-4o는 “왕이 머물고 있다는 것을 의미하는 왕실 깃발이 꽂혀 있는 걸 보아 그런 것 같다”고 답했다. 또 택시를 타야겠다고 하자 즉시 “길 왼편에서 당신을 향해 한 대가 오고 있다. 택시를 잡을 준비를 하라”고 도움을 주기도 했다.

하루 뒤인 14일 연례개발자회의 I/O를 연 구글도 기술의 사회적 포용성을 강조했다. 이날 구글은 인터넷에 연결하지 않아도 동작하는 ‘온디바이스 AI’ 형태의 소형언어모델(sLLM) ‘제미나이 나노’의 멀티모달 기술이 하반기(7∼12월) ‘토크백’에 결합될 것이라고 밝혔다.

시각장애인 등을 위해 개발된 토크백은 화면에 있는 문자를 음성으로 읽어주는 기능이다. 여기에 이미지와 음성을 고도로 처리할 수 있는 멀티모달 기술이 결합될 경우 더욱 명확하고 풍부한 정보를 시각장애인에게 전달할 수 있을 것으로 전망된다.

예를 들면 드레스를 온라인으로 구매할 때 제미나이가 화면에서 옷의 형태 등을 인지하고 사용자에게 “이 드레스는 짧은 드레스이며, 칼라와 긴 소매가 있고 큰 리본이 허리에 달려 있습니다”라는 식으로 음성 안내를 전달해 사용자의 구매를 돕게 된다. 이 외에도 구글은 휴대전화 카메라를 이용해 주변의 자세한 정보를 설명하는 ‘룩아웃’ 기능도 지원하고 있다.

● 국내 대기업, 노약자 특화 서비스 선보여

게티이미지코리아
국내 기업들도 최근 잇따라 노약자나 장애인 등을 지원할 수 있는 AI 등 정보기술(IT)을 도입하고 있다. 삼성전자는 14일 AI를 통해 가족 돌봄을 지원하는 ‘패밀리 케어’ 서비스를 공개했다. 패밀리 케어는 일상적으로 사용하는 가전에 AI를 적용하고, 비정상적인 생활 패턴이 감지될 시 자녀 등에게 알림을 보내는 서비스다.

예를 들면 부모님이 약을 복용하지 않으면 미리 설정해 놓은 약 먹는 시간을 스피커가 음성으로 알려주고, 약이 들어 있는 서랍을 열 경우 복약 기록을 저장하는 방식이다. 또 보호자가 미리 설정한 시간 동안 가전을 사용하지 않을 경우 이를 이상 현상으로 감지하고 알림을 제공하기도 한다. 삼성전자는 부모님의 TV, 냉장고, 정수기, 인덕션 등 사용 여부를 통합 연결 플랫폼인 ‘스마트싱스’로 확인하고, 자녀가 원격으로 가전을 제어하는 것도 가능하다고 밝혔다.

삼성전자는 10월경에는 로봇청소기가 내부에 탑재된 카메라를 활용해 집 안에 쓰러진 사람을 감지하고 알림 서비스를 제공하는 기능도 도입할 예정이다.

초대규모 AI ‘하이퍼클로바’를 보유한 네이버는 하이퍼클로바를 활용해 돌봄이 필요한 홀몸노인에게 ‘클로바 케어콜’을 제공하고 있다. 노인에게 자동으로 전화를 걸어 식사, 수면, 건강 등의 주제로 안부를 묻는 서비스다. 네이버는 클로바 케어콜이 단순히 “예, 아니요”의 대답만 제공하는 것이 아니라 자연스러운 대화가 가능해 노인들의 외로움과 고립감을 완화하는 효과도 기대할 수 있다고 밝혔다.

클로바 케어콜은 2021년 부산 해운대구에서 시범 서비스를 시작해 2022년 5월 정식 출시됐다. 현재 110여 개 시군구에 도입돼 2만4000여 명을 대상으로 서비스를 진행하고 있다.

● 장애인 위한 서비스 개발한 스타트업

엄종환 SK텔레콤 ESG혁신 담당(오른쪽)과 조수원 투아트 대표(왼쪽)가 MWC 2024 글로모 어워드에서 설리번 파인더 로 수상하는 모습. SK텔레콤 제공
대기업뿐 아니라 스타트업, 소셜벤처 등도 사회적 약자를 위한 IT 서비스를 내놓고 있다. 2018년 시각장애인 보조 애플리케이션(앱) ‘설리번 플러스’를 출시한 투아트가 대표적이다. 설리번 플러스는 스마트폰 카메라와 AI 기술을 결합해 전방의 물체를 인식하고, 이를 음성으로 전달해 시각장애인의 이동이나 사물 인식 등을 돕는 서비스다.

이 앱을 실행해 봤더니 “책상 위에 노트북이 놓여 있고 책꽂이에 책들이 꽂혀 있다. 방문이 닫혀 있고 방문에는 명찰이 달려 있다”는 식으로 눈앞의 장면을 상세히 묘사했다. 문자 인식 기능을 이용하자 조그마한 책의 제목까지도 인식해 음성으로 제공하기도 했다. 해당 서비스는 현재 200개 이상의 국가에서 36만5000여 명의 시각장애인이 이용 중이다. 회사는 올해 1월에는 검색 등의 기능을 추가해 고도화한 ‘설리번 파인더’라는 새로운 앱을 내놓기도 했다.

2021년부터 SK텔레콤과 협업하고 있는 투아트는 최근 설리번 플러스와 설리번 파인더에 SK텔레콤의 멀티모달 AI ‘에이닷 엑스’를 탑재했다. 해당 AI는 10억 장 이상의 이미지를 학습해 더욱 정교하게 이미지 묘사를 할 수 있다. 조수원 투아트 대표는 “새로운 멀티모달 AI가 적용되고 난 뒤로 기술의 수준이 높아졌고, 사용자도 증가했다”고 말했다.

반려로봇 효돌 은 어르신에게 투약 정보 등을 알리고, 실시간 대화를 통해 정서적 지지를 제공한다. 효돌 제공
국내 기업 효돌은 AI 기술이 도입된 반려로봇 ‘효돌’을 2018년부터 전국 지방자치단체 등에 보급하고 있다. 전국 156개 지자체, 1만여 명의 노인이 로봇을 사용 중이다. 머리나 손을 만지면 일곱 살 손주처럼 애교를 부리거나 설정된 시간에 식사, 운동, 약 복용 등의 알림을 제공한다. 노인이 위급 상황에서 효돌에게 도움을 요청하거나 특정 시간에 움직임이 감지되지 않을 경우 응급관제센터나 보호자에게 응급 연결을 하기도 한다.

회사는 효돌의 ‘정서 교감 기능’을 강조했다. 효돌이 2021년부터 2023년까지 전남 지역 홀몸노인 186명을 대상으로 로봇을 보급한 결과 노인우울척도가 10.29에서 9.05로, 자살생각척도는 15.52에서 9.25로 낮아지는 등 정신건강 상태가 호전된 결과를 보였다고 밝혔다. 이러한 성과를 바탕으로 전남도는 2023년부터 2025년까지 총 30억 원의 예산을 투입해 22개 전체 시군에 효돌 1100대를 도입 중이다.

회사는 지난해에는 기존보다 업그레이드된 ‘효돌 2.0’을 출시했다. 효돌 2.0에는 챗GPT가 도입돼 노인과의 소통 기능이 강화됐다. 효돌 관계자는 “보다 자연스러운 ‘양방향 대화’가 가능하다는 것이 효돌 2.0의 특징”이라고 설명했다.

또 다른 국내 기업 소리를 보는 통로는 청각장애인을 위한 실시간 자막 서비스를 제공하고 있다. AI가 실시간으로 현장의 소리를 인식해 텍스트로 자막을 띄우는 형태다. 회사에 따르면 실시간 자막은 96∼97% 수준으로 높은 정확도를 보였다. 이 회사는 2017년부터 최근까지 학교, 은행 등 800여 개 기관을 대상으로 서비스를 제공하고 있으며, 올해부터는 일반 소비자를 대상으로도 서비스를 확장했다.

● 국제사회도 인정한 포용 서비스… 정부도 팔 걷어붙여

투아트와 효돌은 삼성전자, SK텔레콤 등 대기업과 함께 2월 스페인 바르셀로나에서 열린 ‘모바일월드콩그레스(MWC) 2024’의 ‘글로벌 모바일 어워드(글로모 어워드)’에서 수상하기도 했다. 세계이동통신사업자연합회(GSMA)가 선정하는 글로모 어워드는 ‘모바일 업계의 오스카상’으로 불릴 만큼 ICT 업계에서 권위를 인정받는 상이다. 투아트의 설리번 파인더가 ‘접근성·포용성을 위한 최고의 모바일 사용 사례’ 부문에서, 효돌의 효돌 로봇이 ‘건강과 웰빙을 위한 최우수 혁신 분야’에서 각각 수상의 영예를 얻었다.

정부와 지자체도 IT를 통한 사회적 포용 서비스에 팔을 걷어붙였다. 과학기술정보통신부와 지자체는 2019년부터 현재까지 인구 감소, 고령화, 주민 복지 등을 개선하기 위해 ‘스마트 빌리지’ 사업을 진행하고 있다. 2019년 40억 원으로 시작한 사업은 올해 1039억 원의 예산을 배정받았다.

경기 부천시의 노인들이 스마트 경로당 에서 비대면 화상기기를 통해 운동 프로그램을 진행하고 있다. 부천시 제공
특히 노인 복지를 위해 경기 부천시가 운영을 시작한 ‘스마트 경로당’ 사업은 그 성과가 인정돼 현재 27개 지자체로 확대됐다. 스마트 경로당에서는 비대면 화상 시스템을 통한 여가·건강 프로그램, 사물인터넷(IoT) 기기를 통한 헬스케어 프로그램 등을 제공한다. 이를 통해 에어로빅이나 웃음 치료, 건강 상담 등을 원격으로 진행하고, 주기적으로 혈압이나 혈당 등을 측정할 수 있다. 부천시 관계자는 “현재 시에 45개소가 설치된 스마트 경로당을 2026년에는 150개소로 늘릴 예정”이라고 말했다.

전남혁 기자 forward@donga.com

Copyright © 동아일보. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?