이 책에는 새로 쓴 글이 없습니다. 하여 세상에 내놓기 망설여지는 책일 수도 있습니다.
이제는 동학들이 된 제자들로부터 이 책을 만들자는 제안을 받고는 손사래를 쳤었습니다. 대학원에 들어가 직업적으로 공부를 시작한 1982년부터 벌써 사십 년 넘게 한국어 연구의 마당에서 한 우물을 파고, 이제 곧 정년퇴임을 앞둔 처지에, 학계나 세상에 크게 이바지한 바도 없고, 세상이 많이 변한 요즘 이런 기념 논총(논문집)은 보기 어려워진 걸 너무도 잘 알기 때문입니다. 한동안 망설임의 시간이 있었지만, 곧 마음을 고쳤습니다. 거기에는 두어 가지 까닭이 있습니다.
먼저, 숱한 다른 선택을 할 수 있었을 텐데도, 스스로 제 곁에 다가와서 사제의 인연을 맺기를 선택하고 오래도록 함께해 온 이들 하나하나에 대한 깊은 정과 고마움이 사무쳐왔기 때문입니다. 이들과 함께 책을 꾸밀 수 있다면, 이 또한 내게는 큰 영광임을 깨닫고, 이 책에 실을 글을 고르기 시작했습니다.
이 책의 글은, 말뭉치와 실증적 자료를 토대로 한국어의 구조와 변화를 탐구해 온 결과물입니다. 1980년대 중반 일본 생활을 시작하던 무렵부터 자료와 컴퓨터를 활용해 언어의 본질을 탐구하는, 이른바 전산언어학적 방법론을 익히고, 끊임없이 자료를 모으며 컴퓨터로 다루어 왔습니다. MS-DOS와 플로피디스크를 사용해야 했던 당시로서는 생소했던 컴퓨터 기반 언어 분석이 이제는 언어학 연구의 핵심 방법론으로 자리 잡았음을 감회 깊게 바라봅니다. 처음에는 일일이 손수 타자해 가면서 자료를 수집하여 전산화된 말뭉치를 만들었지만, 이제는 빅데이터와 인공지능 기술을 활용한 언어 연구가 가능해진 것을 보며 격세지감을 느낍니다.
이 책에는 한국어 형태론과 통사론 연구에서 말뭉치를 활용한 실증적 분석 방법을 도입하고 발전시켜 온 연구 성과들이 담겨 있습니다. 이러한 연구들이 한국어의 특성을 보다 객관적이고 체계적으로 이해하고, 단순한 이론적 가설에 그치지 않고, 실제 언어 사용의 양상을 체계적으로 분석하여 한국어의 본질을 밝히는 데 한 걸음 더 나갔기를 바랍니다.
이 책을 엮게 된 또 한 까닭은, 10년에 걸친 일본 생활 시절에 일본의 학술지에 더러는 아예 일본어로 발표했던 글들을 우리말로 번역해서, 국내에서는 구해서 보기 어려웠거나 일본어인 탓에 읽을 수 없었던 분들에게 이제나마 읽어 보실 기회를 드릴 수 있으면 좋겠다는 소망에서 비롯합니다.
이 책에서는 주제나 자료, 방법론적인 기준을 세워서 장절로 나누는 일을 하지 않기로 했습니다. 다만 발표된 시간의 흐름을 따라 읽어 나가다 보면, 그때그때 다룬 자료, 주제, 관심사, 해석의 태도 따위가 어떻게 달라져 왔는지 자연스럽게 이해할 수 있도록 했습니다.
스스로 돌이켜보면 말뭉치와 문법 연구를 통해서 알게 된 가장 뚜렷한 사실은, 언어학적 범주의 경계는 한없이 모호하고 끝없이 변화하고 있다는 것입니다. 낱말과 형태의 범주들이란 것이 뜻밖에도 명확하게 고정되어 있지 않고 심지어 그 경계는 시간과 장소에 따라 끝없이 꿈틀거린다는 것을 이제는 당연한 것으로 이해합니다. 이 책에 실린 글 속에서는 바로 이 문제에 대한 치열한 탐구가 이어지고 있는 것입니다. 하나하나의 글 속에서 보이는 문제 의식과 방법론은 여전히 살아 있으니 모두 새 글과 다름없습니다. 앞으로 한국어의 본질을 밝혀 나갈 동지들에게 작으나마 길잡이가 되었으면 합니다.
기나긴 세월에 말씀으로, 책으로, 앞서가는 뒷모습으로, 그리고 지극한 사랑으로 저를 이끌어 주신 영과 육의 모든 스승님들, 함께 연구하며 성장해 온 제자이자 동료들, 홀로 할 수 없는 큰 일들을 함께 해 주신 헤아릴 수 없는 선배 동료들, 그리고 그 처음부터 이제까지 한결같이 함께해 준 가족들에게 깊은 감사의 마음을 전합니다.
2002년 『한국어 구어 연구 (1)』을 시작으로 해서 이 책이 한국문화사에서 내는 열여덟 번째 책입니다. 출판 환경의 어려움을 마다않고 책으로 엮기 어려운 사전과 학술서들의 원고를 맡아 온전한 책으로 꾸며 세상에 내어 주신 한국문화사의 김진수 사장님과 모든 직원들께 깊은 존경과 감사를 전합니다.
2002년과 2005년에 <한국어 구어 연구(1)>과 <한국어 구어 연구(2)>가 말뭉치 기반 국어 연구 총서로 나온 이후로 실로 오래 간만에 한국어 구어 연구에 관한 저서를 출판하게 되었다. 이번 연구서는 한국어 구어 말뭉치에 관한 것으로 구어 말뭉치 구축 방법론과 함께 구축의 역사와 현황을 보이고자 하였다. 이 책은 앞선 두 권의 연구서보다 늦게 출간되지만, 이들보다 더 이전에 잉태되었다고 할 수 있다. 왜냐하면 이 책은 1998년부터 10년간 국가의 지원으로 이루어진 21세기 세종계획의 구어 전사 말뭉치 구축에서 중요한 역할을 수행했던 연구자들이 함께 모여 그간의 작업에 대한 중요한 기록을 남긴 결과이기 때문이다.
아울러 이 책은 연세 구어 말뭉치를 소개함과 동시에 향후 이 말뭉치를 대상으로 펼쳐질 연구에 대한 서론이기도 하다. 이에 세 번째 구어 연구서의 출간에 대한 큰 의의가 있으며, 비록 세 번째 구어 연구 총서이지만 새로운 구어 연구 저작이기도 한 것이다.
이 책은 구어 자료를 말뭉치의 형태로 이용하고자 하는 모든 연구자들을 대상으로 하여 씌어졌다. 즉, 말뭉치와 구어 연구를 처음 시작하는 언어학 전공 학생들이나 방언이나 담화 연구, 사전 편찬, 음성 처리 등과 같이 다양한 연구 목적으로 구어 자료를 구축하거나 기구축된 자료를 이용하고 싶은 연구자들에게 유용하게 쓰일 수 있을 것이다.
이 연구 성과를 책으로 묶을 수 있도록 애써 주신 여러분들과 10여 년 동안 구어 말뭉치의 전사 작업에 참여해 주신 분들께 이 책을 바치고 싶다. 끝으로 자료 구축과 공동 연구를 수행할 터전을 마련해 주고 말뭉치 기반 국어 연구 총서를 발간해 준 연세대 언어정보연구원과, 한국문화사 김진수 사장님과 편집인들께 감사를 표한다.
이 책 <한국어 기본어휘 연구>는 말뭉치와 컴퓨터를 활용한 국어정보학적 연구 방법론에 따라 한국어 기본어휘를 밝힌 뒤, 그 분석의 결과를 어휘 연구와 사전, 나아가서는 한국어교육이나 국어교육 분야에서 여러 모로 활용할 수 있도록 하기 위한 방법론과 실제를 보이려는 데에 목적이 있다. 구체적으로는, 필자가 오랫동안 몰두해 온 연구거리인 말뭉치의 구성과 주석 방법론, 의미 빈도 사전 편찬 과정에 관련된 제반 요소와 방법론을 밝히고, 아울러서 이 연구를 통해서 이루어진 결과들, 즉 한국어 기본어휘, 의미 빈도 사전, 그리고 의미 빈도를 활용한 새로운 어휘 연구의 방향을 제시하고자 하는 것이다.
제1부(한국어교육과 기본어휘)에는, 기본어휘의 개념으로부터 이를 둘러싼 제반 연구와, 말뭉치를 활용한 대규모 어휘 조사를 통한 실증적 선정 방법론의 수립에 관해 논한다. 제2부(기본어휘의 의미 빈도와 그 활용)에서는 이 연구의 결과를 어디에 어떻게 활용할 것인가, 즉 무엇을 하기 위해 이러한 연구를 했는지를 보이고자 한다.
이 책은, 함께 출간되는 <한국어 기본어휘 의미 빈도 사전>을 만드는 과정에서 발표했던 글들을 한데 모아 고쳐 쓰는 한편, 두 편의 글(4장과 5장)을 새로 써서 묶은 것이다. 글을 고쳐 쓴 가장 큰 까닭은, 글이 여기저기에 나뉘어 발표된 탓에 그 바탕으로 한 연구 결과의 진척도가 달라 서로 앞뒤가 맞지 않거나 겹치는 내용이 있고, 더구나 그 글이 발표된 이후에 이루어진 연구의 결과나 성과가 반영되어 있지 않기 때문이다. 그러므로 이 글을 고쳐 발표함으로써 이전의 글은 자연스레 폐기되는 셈이다.
이 책이 말뭉치 기반 국어 연구 총서의 하나로 세상에 나올 수 있도록 허락해 주신 연세대 언어정보연구원 김하수 원장께 깊은 존경과 감사를 드린다. 사전과 연구서를 한 묶음으로 내는 부담스러운 일을 기꺼이 맡아 주신 한국문화사 김진수 사장과 박재형 팀장, 그리고 책을 온전하게 만들어 주신 김성아님께 고마움을 전한다.
무엇보다도, 함께 하는 인연의 깊은 뜻을 늘 깨우쳐 주는 가족들에게도 이 책이 잠시의 기쁨과 보람이 되었으면 참 좋겠다. - 머리말