1998년에 말뭉치 기반 한국어사전 최초로 펴낸 고 이상섭 교수
오마이뉴스는 세종 정신으로 공공언어 바로잡기 운동을 펴고 있는 세종국어문화원과 함께 우리 시대 <우리말글 가꿈이를 찾아서>를 연재한다. 공공언어 바로잡기에 애써온 단체와 우리말글 운동가들을 찾아 성과와 의미 등을 짚어본다. <편집자말>
[김슬옹 기자]
▲ 한국어 말뭉치를 최초로 구축한 고 이상섭 교수 (사진은 유족 제공) |
ⓒ 이기황 |
최근 챗지피티(ChatGPT), 바드(Bard) 등 대화형 로봇 인공지능의 돌풍으로 세상이 떠들썩하다. 이럴수록 빅데이터, 즉 언어 연구를 위해 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 자료인 말뭉치(corpus, 코퍼스)가 부각되고 있다. 말뭉치란 한 언어로 기록된 글과 말을 되도록 다양하게 모아서 대용량 전산기로 처리한 것을 말한다.
'대화형 로봇'의 지식과 지혜는 바로 구축한 말뭉치에 바탕을 두고 있다. 인공지능용 말뭉치가 아니더라도 다양한 분야에서 말뭉치의 중요성이 나날이 커지고 있다. 현재 한국어 말뭉치 관련 연구는 국립국어원이 주도하고 있는데 한국어 말뭉치 구축을 처음으로 시작했던 분이 지난해 85세로 소천한 고 이상섭 교수이다. 물론 처음에는 사전 편찬을 위한 기본 자료로 삼기 위해 한 것이지만, 인공지능 시대를 여는 선견지명이 있었다.
영어 '코퍼스(corpus)'에 대응하는 한국어 용어 '말뭉치'라는 말을 처음 만든 사람이 이 교수였고 '뭉치 언어학(corpus linguistics)'이란 말도 만들었다.
최초 한국어 말뭉치 작업 풍경 어땠냐면
이 교수는 1989년부터 1993년까지 연세대학교 한국어 사전편찬실 실장으로 있으면서 최초 '한국어 말뭉치 구축' 작업과 '말뭉치 분석 프로그램 개발' 작업을 했다. 필자는 1991년∼1994년에 실무 팀장을 맡아 초기 연세말뭉치 구축과 말뭉치 분석 프로그램 개발에 참여했다.
▲ 1991년 8월, 연세대 사전편찬실에서 한국어 말뭉치 입력 작업을 하던 서울여상 학생들. 필자 석사 졸업을 축하하던 장면. |
ⓒ 김슬옹 |
1998년, 연세대학교 언어정보개발연구원(현 언어정보연구원)은 우리나라 최초로 말뭉치에 바탕을 둔 <연세 한국어사전>을 출간했다. 이는 1986년에 이상섭 교수 주도로 연세대 자체의 사전 편찬이 시작된 지 12년 만에 이룩한 성과였다.
사전 편찬은 한국어 연구와 한글문화 운동의 큰 중심인 연세대학교의 일이라고 생각한 290인이 <한국어사전편찬회>를 조직하고 발의하여 1989년에 <한국어사전 편찬실>이 설치되어 편찬이 본격화되었다. 이 공로로 이상섭 교수는 1999년에 외솔상(외솔회)을, 2010년에 보관문화훈장(문화체육관광부)을 받았다.
연세 한국어사전, 말뭉치 언어학 방법론 적용한 첫 사전
연세 한국어사전의 가장 큰 의의는 말뭉치 언어학의 방법론을 적용한 우리나라 최초 사전이라는 점이다. 연세한국어사전편찬회는 새 사전 편찬에는 대규모 말뭉치 구축과 말뭉치 전산 처리가 필요하다고 판단해 국내 최초로 300만 어절 규모의 <연세 말뭉치 1>이 1990년에 구축되었다.
이를 바탕으로 국내 최초로 3000만 말마디에 달하는 대규모 현대 한국어 말뭉치를 전산화하고, 여기서 원하는 용례를 뽑아 분석하는 전산 처리 기술과 소프트웨어를 개발했다. 이와 같은 말뭉치 언어학의 도입은 한국 사전의 역사를 바꾸어 놓았다.
이상섭 교수가 1986년에 기초한 연세한국어사전편 발의문 앞부분을 인용하며 고인의 업적을 추모해 본다.
"세종대왕께서 한글을 창제하심으로써 비로소 우리 겨레가 진정한 뜻의 우리 문화를 향유하게 되었음이 새삼 감격스럽다. 문자는 한 겨레의 말을 기록, 전달, 보존할 뿐 아니라 감정과 생각을 고르고 다듬어 더 바르고 깊고 넓게 하여주는 까닭에 겨레의 삶에 절대로 없어서는 안 될 그릇이다. 한글 덕택으로 우리 겨레가 과거와 현재는 물론 무궁한 미래에 걸쳐 자주적이고 창조적인 문화를 누리게 된 행복을 어찌 다 형언하랴!
그동안 많은 선현들이 한글로 겨레의 감정과 생각을 정교하게 적어 왔고, 우리 말에 대한 우수한 연구 업적을 쌓아 놓았다. 특별히 우리는 한글학회 지은 큰사전을 비롯한 우리 말 사전들을 편찬한 분들의 공적을 높이 기리는 바이다.
▲ 이상섭 교수 발의로 만든 '연세 한국어사전'과 이를 바탕으로 연세대 언어정보연구원이 펴낸 '연세 초등국어사전' 표지 모습. |
ⓒ 김슬옹 |
저작권자(c) 오마이뉴스(시민기자), 무단 전재 및 재배포 금지
Copyright © 오마이뉴스. 무단전재 및 재배포 금지.
- "여기가 한국인지 베트남인지"... 순살 아파트는 누가 짓나
- 홍익표 "윤석열 정부 '따로국밥 정권'...말 따로 행동 따로"
- 유병호 체포, 안하나 못하나
- 여권의 또 하나의 총선카드... "주식 공매도 금지"
- 오세훈 시장의 10년 꿈이 누군가에겐 지독한 악몽
- 줄 서서 먹을 만... 날 '다른 존재'로 만들어주는 놀라운 음식
- 자신의 새로운 무대로 개조... 북한을 고쳐 쓴 친일파
- "공사장 안은 딴 세상"... 아파트 철근공으로 한 달간 일했습니다
- '메가시티 서울'에 민주 맞불... "김기현, 김포에 출마하라"
- "촌에서 청년이 뭐 먹고 살아?"... 이렇게 삽니다