[Weekly BIZ] [Tech] 필기 인식 기능_'人' 字 필체 사람마다 달라.. 100가지 넘게 DB化

얼마 전 남한산성 수어장대(守禦將臺)에 올라갔다. 중학생쯤 돼 보이는 아이들이 현장 학습을 온 것 같았다. 한 남자 아이가 "저 '어'자는 무슨 뜻이에요?"라고 묻자 인솔 교사가 '글쎄 윗부분은 임금님이라는 뜻인데…"하고 답을 못했다. 그런데 한 여자 아이가 스마트폰을 꺼내 손가락으로 화면에 뭔가를 그리더니 "저건 '지킨다'는 뜻이라고 나오네요"라고 했다. 이 여자 아이가 이용한 것은 네이버 모바일 한자어 사전의 '필기 인식기' 기능이었다. 스마트폰 화면에다가 눈에 보이는 대로 '한자를 그리면' 검색 결과로 글자의 뜻풀이를 보여주는 기술이다. 현재 이 기술은 한자어 사전뿐 아니라 '한자'를 사용하는 일본어·중국어 사전에도 적용돼 있다.

인터넷 사전이 보편화되고, 스마트폰 사용이 늘면서 '모르는 단어' 때문에 곤란한 경우는 별로 없을 것 같다. 그런데 한자(漢子)와 한자어를 사용하는 중국어, 일본어의 경우는 자판을 이용해 검색한다는 게 쉽지 않다. 국어나 영어는 자음과 모음을 하나씩 검색 창에 입력하면 된다. 하지만 한자는 이처럼 자모를 조합하는 '음소문자'가 아니기 때문에 한정된 자판 공간에 문자의 구성 요소(알파벳)를 분배하기 어렵다. 한자의 모든 획과 부수를 담은 자판은 아마 책상 전체를 덮어도 모자를 것이다. 이 때문에 대부분의 인터넷 한자 사전도 총획수·발음부수 등을 이용한 옥편식 검색을 활용한다. 하지만 한자에 익숙하지 않은 일반 이용자들(또는 한자를 처음 보는 외국인)에게는 '너무 어려운 검색방식'이다. 가령 저 '禦'자만 '어'라고 읽는다는 걸 모른다고 해보자. 중·고등학교 시절에 한자를 공부했지만 부수와 총획수로 검색하는 게 쉽지 않다. 또 음소문자라 하더라도 버튼식이 아니라 손으로 쓴 글자를 바로 인식해 검색결과를 준다면 편리할 경우가 있을 것이다.

네이버 사전 등의 '필기 인식' 기능은 사람이 쓴 글자를 '분석'하고 이게 어떤 글자인지 '해독'해서 빠르게 '전송'해 주는 기술이다. 필기 인식기는 가로 세로 수 센티미터의 정사각형 모습이지만, 이 작은 사각형은 다시 수백 개의 더 작은 사각형들로 나누어져 있다. 그리고 각각의 작은 사각형들은 고유 좌표값을 갖고 있다(가령 왼쪽 맨 아래가 0·0이라고 하면 여기서 가장 먼 오른쪽 맨 위는 500·500이 되는 식). 만약 '필기 인식기'에 '人'자를 써 넣는다고 해보자. 글자가 씌어지는 곳에 위치한 작은 사각형들은 마치 화선지에 붓글씨를 쓸 때처럼 색이 덮이면서 음영이 생긴다.

이용자의 스마트폰은 이처럼 변화가 발생한 작은 사각형들의 좌표값 등 관련 정보를 분석해 네이버 서버로 전송하게 된다. 이때 변화가 발생한 모든 좌표값을 보내준다면 정확한 답을 찾는 데 도움이 될 것이다. 하지만 정보량이 늘어날수록 스마트폰에 부담이 갈 뿐 아니라 정보가 오가는 속도도 떨어지게 된다. 따라서 모든 정보가 아니라 글자 인식에 딱 필요한 특정 부분의 정보만을 선별적으로 골라 전송하는 게 필요하다.

정보를 받은 네이버 서버 컴퓨터는 크게 두 가지 작업을 한다. 우선 전송된 정보를 컴퓨터가 이해하기 쉽게 표준화해야 한다. 이는 사람마다 같은 '人'을 쓸 가능성이 없기 때문이다. 크게 쓰는 사람, 작게 쓰는 사람, 삐침이 긴 사람, 글자 끝을 꺾는 사람 등 다양한데, 모든 걸 고려하면 분석 과정이 불필요하게 길어질 수밖에 없다. 이 때문에 노멀라이징(normalizing)이라는 과정을 통해 분석에 불필요한 요소들을 정리한다. 그 후 전송된 정보와 들어맞는 정보를 찾는 레코그니션(recognition·인식) 과정이 이뤄진다. 미리 서버 안에 구축된 데이터베이스 중에서 지금 전송받은 정보(좌표값들의 조합)와 가장 가까운 글자를 찾는 것이다. 그런데 이 과정에서도 사람마다 각기 글씨체가 다르기 때문에 생기는 문제를 고려해야 한다.

비록 표준화 과정을 거쳤지만 사람마다 손으로 쓰는 '人'자는 각기 다르기 때문이다. 이 문제는 발생 가능한 경우의 수를 모두 데이터베이스화하는 것으로 풀고 있다. 즉 '人'자의 경우만 해도 100여가지 이상 모양의 '人'을 미리 저장해놓고, 전송된 정보가 이 100여 가지 중 하나와 일정 정도 이상 맞으면 '사람 인(人)'이라는 결과값을 제공하는 것이다.

필기 인식기는 이처럼 필기 인식 기술과 네트워크 기술이 결합된 산물이다. 기술적으로도 복잡하지만 '사전'이라는 서비스의 특성상 검색결과가 안 나오거나 잘못 나오면 이용자들이 바로 외면해버린다. 이 때문에 수시로 이용자들의 검색 패턴을 확인하고 오류가 발생하는 지점들을 면밀히 검토해서 반영해 나가야 한다. 흔히 인터넷 사전은 오프라인 사전을 디지털화하는 것 정도로 생각하는 경우가 많은데, 기술적 측면과 서비스적 측면에서 결코 쉽지 않은 서비스 중 하나이다. 특히 국내 이용자들의 교육 수준이 높기 때문에 이 눈높이를 맞추려면 몇 배의 노력이 필요하다.

조선비즈 핫 뉴스 Best

경제

[Weekly BIZ] [Tech] 필기 인식 기능_'人' 字 필체 사람마다 달라.. 100가지 넘게 DB化