본문 바로 가기

[ 테크 ]

말이 빠른 언어는
정보 효율도 좋을까

by한겨레

한국어, 영어, 일본어 등 17개 언어 분석 결과

말하는 속도는 달라도 정보 전달 속도는 같아

정보 밀도 낮은 일본어, 말하는 속도 가장 빨라

한국어는 중상위 속도...베트남·타이어 가장 느려

뇌가 한 번에 처리할 수 있는 정보량과 관련

인류 언어의 새로운 보편적 특성 확인한 셈

한겨레

말이 빠른 언어가 같은 시간에 정보를 더 많이 전달하는 건 아니라는 연구 결과가 나왔다. 위키미디어 코먼스

현재 지구상에는 약 7천개의 언어가 존재하는 것으로 추정된다. 그런데 모든 언어에 보편적으로 통하는 특성을 찾기는 쉽지 않다. 예컨대 주요 언어들은 음절 수나 음소 수, 성조에서 각기 큰 차이가 난다. 음소의 경우 일본어와 스페인어는 25개에 불과하지만, 영어와 타이어는 40개가 넘는다. 음절의 경우엔 차이가 더욱 커져 일본어는 수백개, 영어는 거의 7천개에 이른다. 성조도 아예 없는 것에서부터 6개(베트남어)에 이르기까지 다양하다. 한국어, 핀란드어, 터키어, 헝가리어 등에선 모음조화라는 특이한 음운현상이 덧붙여진다.


각 언어의 원어민들이 말하는 속도에서도 큰 차이가 난다. 말이 빠른 이탈리아 사람들은 초당 9음절을 발음한다. 비교적 또박또박 말하는 독일인들의 발음 속도는 초당 5~6 음절 정도라고 한다. 그렇다면 말이 빠른 언어를 쓰는 사람들은 다른 언어를 쓰는 사람들보다 더 빨리 정보를 주고받는 것일까? 그렇지 않다는 연구 결과가 나왔다. 말하는 속도는 언어마다 다르지만, 정보를 전달하는 속도는 거의 똑같다는 것이다.


의문을 풀기 위해 프랑스, 한국 등 4개국 공동연구진은 한국어를 비롯해 영어, 이탈리아어, 일본어, 베트남어 등 9개 언어군 17개 언어로 작성한 문서를 이용해, 말하는 속도와 정보 전달 속도의 관계를 측정했다. 이는 언어의 정보 밀도와 관련이 있다. 앞서 2011년 <랭귀지 매거진>에 발표된 7개 언어(영어 프랑스어 독일어 이탈리아어 일본어 만다린어 스페인어) 비교 연구 결과를 보면, 일본어는 정보 밀도가 가장 낮다. 이는 같은 양의 정보를 전달할 때 다른 언어보다 더 말을 많이 해야 한다는 걸 뜻한다. 영어는 일본어보다 정보 밀도가 두배나 높다. 반면 음절 속도(1초당 발음하는 음절 수)는 일본어가 가장 빠르다. 정보 밀도가 낮은 언어는 좀더 빨리 말하는 경향이 있다는 얘기다.

한겨레

16세기 네덜란드 화가 피테르 브뢰헬(Pieter Bruegel le Vieux)의 바벨탑 그림. 구약성서 창세기에선 바벨탑을 쌓아 하늘에 닿으려는 인간의 오만에 분노한 신이 본디 하나였던 인간의 언어를 여럿으로 나눴다는 내용이 나온다. 퍼블릭 도메인

지난 4일 공개 과학저널 <사이언스 어드밴시스>(Science Advances)에 발표된 논문을 보면, 연구진은 이번 연구에서 각 언어의 정보 밀도를 비트 단위로 계산했다. 언어의 정보성은 보통 음절 단위로 계산하는데, 이를 비트로 표현하는 것. 언어에서의 1비트는 정보의 불확실성을 반으로 줄이는 정보량을 가리키는 개념이다. 예를 들어 한 음절을 입 밖으로 말했다고 치자. 이 음절을 말함으로써 내가 가리킬 수 있는 사물의 범위가 사물 전체에서 그 절반으로 줄었다면, 그 음절은 1비트의 정보를 전달하는 것이 된다.


연구진이 계산한 결과, 643개의 음절로 구성된 일본어의 경우, 한 음절당 5비트의 정보 밀도를 갖고 있는 것으로 나타났다. 반면 6949개의 음절을 갖고 있는 영어는 음절당 정보 밀도가 7비트였다. 성조가 6개나 있는 베트남어는 음절당 정보 밀도가 8비트로 가장 높았다.


연구진은 이 가운데 14개 언어별로 각기 10명(남, 여 각 5명씩)을 선정해 그들의 말을 녹음했다. 나머지 3개 언어(영국영어, 독일어, 이탈리아어)는 이전의 녹음 자료를 활용했다. 실험 참가자들에겐 자신의 모국어로 번역된 15개의 똑같은 구절(총 음절 수 24만개)을 보통의 속도로 소리내어 읽도록 했다. 예컨대 한국인에게 주어진 대본 중 하나는 이런 것이었다. "연수기가 고장났습니다. 수위가 너무 높아서 물이 계속 넘치거든요. 화요일 아침에 기사 한 분을 보내줄 수 있으세요? 제가 이번주에는 그날밖에 시간이 안되거든요. 정확한 일정을 문자로 보내주시면 감사하겠습니다."


대본의 뜻을 잘 이해해서 읽을 때 실수를 하지 않게 하기 위해 녹음 전에 두세번씩 읽어보도록 했다. 연구진은 이들이 주어진 대본을 다 읽는 데까지 걸린 시간을 기록한 뒤, 이를 음절 수로 나누어 언어별로 읽기 속도를 계산했다. 말하는 속도는 일본어와 스페인어가 가장 빠르고, 베트남어와 타이어가 가장 느렸다. 한국어는 초당 음절 속도에서 중상위권에 속했다. 이어 마지막으로 이 속도에 정보 밀도를 곱해 초당 얼마나 많은 정보를 전달했는지 계산했다.


결과는 놀라웠다. 각 언어의 시간당 정보 전달량은 대동소이했다. 느린 언어든 빠른 언어든, 언어 체계가 단순하든 복잡하든 별다른 차이가 없었다. 각 언어는 초당 평균 39.15 비트의 정보 전달 속도를 보였다. 이는 모르스 부호 전신의 2배에 이르는 속도다. 언어는 달라도 전달 효율은 같다는 언어의 보편적 특성을 확인한 셈이다.

한겨레

17개 언어의 초당 음절 수(왼쪽)와 초당 비트 수. 한국어(빨간색 네모 부분)는 17개 언어 중 중간속도에 해당한다. 사이언스 어드밴시스

논문 공동저자인 프랑스 리옹대의 진화언어학자 프랑수아 펠레그리노 교수는 "이번 연구에서 얻은 명확한 결론은 언어는 표현 방식에선 큰 차이가 있지만 정보를 전달하는 데서는 특정 언어가 다른 언어보다 특별히 더 효율적이라고는 할 수 없다는 것"이라고 말했다.


연구진은 그러나 그 이유는 규명하지 못했다. 연구진은 다만 뇌가 한 번에 섭취하거나 생산할 수 있는 정보량의 한계와 관련이 있을 것으로 추정했다. <사이언스 매거진>은 이와 관련해, 미국 영어의 경우 초당 9음절이 청각 처리의 상한선이라는 최근의 한 연구 결과를 소개했다. 이 연구에 참여하지 않은 벨기에 브뤼셀자유대의 진화언어학자 바트 드 보어(Bart de Boer)는 청각 처리의 상한선은 얼마나 빨리 정보를 처리할 수 있는지가 아니라 생각을 얼마나 빨리 모을 수 있는지가 좌우하는 것이라고 말했다. 그에 따르면 녹음기 속도를 최대 120%까지 높여도 말을 이해하는 데는 지장이 없다. 뇌에서 정보 처리의 병목 현상이 일어나는 진짜 이유는 뇌가 생각을 종합하는 데 있는 것같다고 그는 덧붙였다.


곽노필 선임기자 nopil@hani.co.kr