본문으로 바로가기

국립국어원 20년사

성과

국어사전 편찬개방형 한국어지식대사전 편찬

2010년 1월 27일, 국립국어원에서는 일상생활에서 사용하는 어휘와 신어 등을 대폭 수록한 100만 어휘 규모의 “개방형 한국어지식대사전” 구축 계획을 발표하였다. “개방형 한국어지식대사전”이란, 인터넷 기반의 위키피디아 방식과 같이 인터넷 사용자 누구라도 참여할 수 있는 설계 방식으로 이루어진 전자사전을 말한다. 이 사전의 주안점은 크게 3가지로 나누어 정리할 수 있다. 첫째는 기존의 용어 풀이를 쉽게 수정하고 생활 용어, 방언 등 실생활의 언어 자료를 대폭 확충하여 수요자 중심의 한국어 자료를 집대성하는 것이다. 둘째는 국민이 참여할 수 있는 인터넷 기반의 위키피디아형 사전을 구축함으로써 정보 지식 사회에 걸맞은 언어 지식 관리 체계를 마련하는 것이다. 그리고 셋째는 한국어기초사전과 한국어 학습용 언어별 한국어-외국어 사전을 구축함으로써 급증하는 한국어 학습 사전의 수요에 대비하는 것이다.
이는 언어 지식 문화 전반의 축적 및 관리 체계에 대한 대대적인 구축 작업으로서 다양한 분야의 상호 교류 및 협업이 필요하다. 이에 ‘개방형 한국어지식대사전’ 구축을 위한 업무 추진 체계 및 기관별 역할을 다음과 같이 설정하였다.

개방형 한국어지식대사전 업무 추진 체계
[그림 3-5] 개방형 한국어지식대사전 업무 추진 체계
[표 3-6] 업무 추진 기관별 역할
[표 3-6] 업무 추진 기관별 역할
기관명 주요 역할
문화체육관광부 사업 진행 총괄, 사전편찬추진위원회⋅국어심의회 운영, 부처 간 협력 사업 추진
전문용어 표준화 협의회 부처별 전문용어 표준화 사업 결과 통보, 자료 협조
국어심의회 단계별 사전 편찬 추진 계획 최종 검토, 자문
사전편찬추진위원회 단계별 사전 편찬 추진 계획 검토, 자문
국립국어원 사업 실무 총괄, 기본 계획 수립, 세부 실행 계획 수립
실무 추진팀 개방형 한국어지식대사전 편찬 작업 수행(직접 수행, 용역 등)
민간 단체, 관련 학계 어휘 수집, 분류, 쉬운 풀이 등 관련 작업 진행
산업계 개방형 한국어지식대사전 시스템 설계, 구축

“개방형 한국어지식대사전” 구축 사업은 총 3단계에 걸쳐 추진된다. 1단계(2010~2012년)은 사전 편찬 단계로서 쉬운 풀이와 신어, 방언, 전문어 등의 확충을 위한 한국어 자료 구축 사업, 위키피디아 방식을 참조한 개방형 언어 지식 관리 체계 구축 사업, 그리고 5개 언어의 기초 어휘 5만 항목 선정과 한국어기초사전 2만 항목 구축 및 다국어 시험 대역 등 3개 부분의 사업이 진행된다.
이 단계의 주요 추진 과제로는 우선 쉬운 풀이 및 보완 자료, 그리고 개방적 실생활 한국어 자료 구축을 들 수 있다. 기존의 지나치게 전문적이거나 비체계적인 용어 설명을 보완하기 위해 뜻풀이에 쓰인 어려운 말을 목록화하여 쉬운 용어로 대체하는 작업이 진행될 예정이다. 그리고 문학 작품 위주의 문어 용례와 실생활의 다양한 용례는 물론, 이미지와 동영상 등 텍스트 중심의 풀이를 보완할 다양한 멀티미디어 자료를 구축하는 작업도 이루어진다. 또한 그간 민간 및 공공 영역에서 축적된 모든 어휘 자료의 수합 및 정리 작업도 진행한다. 이를 위해 신문⋅방송 매체에 나타난 신어와 사전에 등재되지 않는 생활어, 외래어 등을 포함한 생활 용어와, 교과서 사용 어휘 등 실제 필요한 어휘를 중심으로 공공 기관 및 학계에서 이미 구축한 전문용어를 정비한다. 그리고 기존에 국립국어원에서 조사, 발간한 방언 사전 등을 활용하는 등 공공 기관 및 지역별로 구축된 방언 어휘 또한 뜻풀이하여 자료화할 예정이다.
또 다른 추진 과제는 사전 편집 틀 제공 및 구획별(표제어, 뜻풀이, 관련 어휘, 지식 정보, 멀티미디어 자료 등) 편집 권한 부여 등 일반인이 쉽게 참여하여 정보를 제공할 수 있는 개방적 시스템을 구축하는 것이다. 여기에 신뢰도에 따른 표지를 표제어에 부착하도록 하여 검증된 정보와 구축 중인 정보를 구별할 수 있도록 하는 등 관리자와 전문가가 사전 구축 결과를 검증할 수 있는 체제도 함께 마련한다. 그리고 사용자의 검색 편이를 증진하기 위해 맞춤형 언어 정보 제공 시스템의 개발도 추진된다. 비표준어나 활용형 등 다양한 방식의 검색이 가능하도록 할 뿐만 아니라, 분야별⋅수준별 정보 검색 기능과 내려받기 기능도 구현될 예정이다.
“개방형 한국어지식대사전”에는 한국어 학습용 다국어사전을 위한 한국어기초사전과 다국어사전을 구축하는 과제가 포함되어 있다. 다국어사전 구축어로 선정된 5개 언어(베트남어, 몽골어, 러시아어, 타이어, 말레이⋅인도네시아어(마인어))는 민간에서의 사전 구축이 비교적 용이한 영어⋅일본어⋅중국어를 제외한 것으로, 2008년 외국인 입국자 수를 기준으로 선정되었다. 다국어사전 편찬⋅검색 시스템 구축을 위해 외국인 사용자의 의견을 반영할 수 있는 통로를 마련하고 현지 인터넷 환경을 감안하여 언어권별로 다국어사전을 편찬하고 검색할 수 있는 웹 페이지를 구축하는 작업을 진행할 예정이다. 이 개방형 사전이 일반에 공개되는 시기는 2012년 말로 예정되어 있다.

[표 3-7] 개방형 한국어지식대사전 제1단계(2010년~2012년) 사업 내용
[표 3-7] 개방형 한국어지식대사전 제1단계(2010년~2012년) 사업 내용
사업 연도/내용 2010년 2011년 2012년 1단계 최종
한국어기초사전
구축
5만 항목 어휘 선정 2만 항목 집필 3만 항목 집필 5만 항목
언어별 사전 구축
(5개 언어)
5개 언어 시범 대역 (베트남어, 타이어, 몽골어, 러시아어, 마인어) 5개 언어
자료 구축
5개 언어
자료 구축
언어별
5만 항목

2단계(2013년~2015년)은 서비스 지속⋅검증 단계로서, 일반인과 전문가의 참여를 확대하고, 생성된 국어 지식에 대한 전문가 집단의 검증과 가공 작업을 진행하는 단계이다. 그리고 2016년 이후에 진행될 3단계는 응용⋅확산 단계로서, 국가 언어 지식 관리 체계의 안정화 및 활용 극대화에 초점을 둔 사업을 진행할 예정이다.

개방형 한국어지식대사전 단계별 추진 절차
[그림 3-6] 개방형 한국어지식대사전 단계별 추진 절차
  • 우리말 자료 집대성
  • 구축 자료의 전문가 검증
  • 관리 체계 활용 극대화
  • 언어 지식 관리 체계 구축
  • 자료 확대와 규범 사전 구축
  • 민간의 부문 사전 출판 지원
  • 5개 언어 다국어사전 구축
  • 5개 다국어사전 추가 구축
  • 10개 다국어사전 추가