“한글사용성평가위원회는 4차 산업혁명의 핵심 기술인 인공지능 연구 중에서 가장 중요한 한국어 사용 실태와 맥락을 연구하는 기초를 마련했다고 할 수 있다. 구글 통·번역에서 한국어가 (어순이 같은) 일본어와는 다르게 엉뚱하게 나오는 이유는 딱히 전문용어 또는 어휘의 표준이 없기 때문에, 통·번역 구조에서 자료들을 대입하고 바꿔주는 경우의 수가 매우 낮기 때문이다. 요즘 구글은 한국어 통·번역에서 규칙을 적용했다. 그러나 한국어를 구글이 연구했다는 것은 우려되는 부분이 아닐 수 없다. 혹시라도 디지털 한국어 주권이 미국 기업인 구글에게 넘어가지 않을까 하는 염려가 현실이 되지 않기만을 바랄 뿐이다.”
한글사용성평가위원회(위원장: 이 대로)는 2012년에 결성되었다. 일찍이 공 병우 박사님이 말하고 실천하신 한글 기계화 운동의 뜻을 이어받아 관련 단체의 뜻있는 분들과 국어 전문가, 그리고 정보통신(IT) 전문가들이 모여 만든 우리 말글 단체이다. 위원회는 2014년부터 현재까지, 우리나라에서 처음으로 ‘우리 말글 자동 평가 도구’(소프트웨어, 검색 평가 자동 로봇) 누리집을 개발하여 수많은 공공기관들의 공공언어 쓰임새를 조사·평가하고 대안을 제시했다.
먼저, 2014년에 44개 중앙 부·처·청 누리집에 게시된 정책 보고서의 공공언어 사용을 조사·평가하였다. 그 결과, 온통 영어와 한자 등을 섞어 써서 국어기본법을 위반하였으며, 어려운 낱말과 전문용어들이 어지럽게 사용되고 있어, 국민들과의 소통이 어렵게 만들어져 있었다. 같은 해 청와대부터 전국 기초 지방자치단체까지 모두 512개 공공기관 누리집에 게시된 공공언어 실태를 조사한 결과, 일일이 말로 표현할 수 없을 정도로 어지러웠다.
512개 공공기관 대부분의 누리집에서 10개 어절당 1개 이상씩 국어기본법을 위반하였거나 잘 쓰지 않는 어려운 낱말을 사용하는 것으로 나타났다. 전체적으로 어려운 낱말을 많이 사용해 개선이 시급한 것으로 나타났다. 특히 공공기관 누리집에 나타난 알림창(팝업창)은 영어와 우리말, 한자어 등을 마구 섞어 쓴 국적 불명의 신조어나 혼합어가 많이 사용되고 있었다. 또한 로마자나 한자를 그대로 쓰거나, 한글로 표기했지만 바꾸어 쓸 수 있는 순화어가 있음에도 지나치게 어려운 용어를 쓰는 사례도 많았다.
2015년에는 경기도에 속해 있는 100개 공공기관 누리집에 게시된 공공언어 사용 실태 조사를 실시했다. 그나마 다행인 것은 경기도가 공공언어를 통해 도민과 소통하려는 공무원들의 자세가 훌륭해, 2014년 중앙 부·처·청과 비교했을 때보다 좋은 결과가 나타났다. 그리고 평가 조사 이후 경기도는 30개 공공기관을 선정해 2016년 한 해 동안 누리집 공공언어 개선 사업을 진행함으로써, 많게는 절반 이상 개선해 낸 성과를 거두었다.
또, 위원회는 이 해에 대기업 40개를 선정해 보도자료 속 우리말 사용 실태를 조사하였는데, 그 결과 영어와 혼종어, 어려운 한자어 등의 사용이 공공기관보다 더욱 어지러운 심각성을 보여주고 있었다.
그 밖에도 지난해에는 현재 활동하고 있는 제20대 국회의원 300명에 대한 누리집 속 국어기본법 위반 실태를 조사·평가했다.
이와 같이 한글사용성평가위원회가 해 온 일들은 모두 각종 방송·신문을 통해 알려졌으며, 실태 조사 결과 보고서를 책자로 만들어 전자화해서 보관하고 있다. 한글사용성평가위원회가 2014년부터 확보한 공공언어 자료(데이터)는 미국의 컴퓨터 회사인 마이크로소프트사에서 개발한 표 계산 소프트웨어 프로그램 엑셀 (Excel)로 약 1000만 줄에 이른다.
이 방대한 자료는 공공기관 누리집에 게시된 로마자와 한자, 가나문자 등 외국 문자를 비롯하여 외국어, 외래어, 전문용어, 어려운 한자어 또는 어려운 낱말 등을 어떻게 사용하고 있는지 조사하고 평가한 결과물이다. 또, 이들은 모두 일상에서 자주 쓰이고 있는 쉬운 말로 바꿀 수 있는 자료들이기도 하다.
이로써 한글사용성평가위원회는 4차 산업혁명의 핵심 기술인 인공지능 연구 중에서 가장 중요한 한국어 사용 실태와 맥락을 연구하는 기초를 마련했다고 할 수 있다. 구글 통·번역에서 한국어가 (어순이 같은) 일본어와는 다르게 엉뚱하게 나오는 이유는 딱히 전문용어 또는 어휘의 표준이 없기 때문에, 통·번역 구조에서 자료들을 대입하고 바꿔주는 경우의 수가 매우 낮기 때문이다. 요즘 구글은 한국어 통·번역에서 규칙을 적용했다. 그러나 한국어를 구글이 연구했다는 것은 우려되는 부분이 아닐 수 없다. 혹시라도 디지털 한국어 주권이 미국 기업인 구글에게 넘어가지 않을까 하는 염려가 현실이 되지 않기만을 바랄 뿐이다.
우리 말글의 전자화와 그에 따른 표준화는 정보통신 산업에 크게 영향을 미치고 있다. 하루라도 빨리 전문용어 표준을 마련해야 대한민국이 경제대국으로 우뚝 설 수 있을 것이다. 이 글은 한글학회가 매 달 발행하는 잡지 ‘한글 새소식’ 5월호에 게재된 글이다. <글: 김들풀 IT NEWS 공동대표 겸 편집장, 한글학회 정회원, 한글사용성평가위원회 책임연구원>
[임정호 기자 art@itnews.or.kr]