본문 바로 가기

[ 테크 ]

애플 이어 네이버도… AI-이용자 대화 엿들었다

by한국일보

‘클로바’ 대화 녹음해 협력사 직원들이 문자 입력

“AI 음성 인식률 강화 훈련” 취지… 사생활 침해 논란


네이버가 인공지능(AI) 서비스의 개선을 위해 이용자들이 AI와 나눈 대화 내용을 녹음한 뒤 협력업체 직원들에게 이를 듣고 문자로 바꾸는 작업을 수행하도록 한 것으로 확인됐다. 음성 인식률을 높이기 위해 AI를 훈련시키겠다는 취지인데, 이 과정에서 사생활 침해와 정보 유출 가능성이 제기돼 논란이 되고 있다. 앞서 미국 애플도 ‘아이폰’의 AI 서비스인 ‘시리’와 이용자들의 대화 내용을 녹음해 제3자가 듣고 문자로 입력하도록 했다가 논란이 되자 공식 사과했었다. 현재 애플은 ‘시리’의 대화 내용을 제3자가 듣지 못하게 조치했다.


2일 포털업계에 따르면 네이버는 수년 간 AI 서비스인 ‘클로바’ 이용자들의 대화 내용을 녹음해 협력사인 그린웹의 외부 계약직 근무자들이 듣고 문자로 입력하는 작업을 해왔다. AI의 음성인식이 완벽하지 않아 문자 입력을 통해 다양한 대화 내용을 훈련시키기 위한 조치다.


네이버가 개발한 AI 플랫폼인 클로바는 아이폰과 안드로이드 스마트폰용 소프트웨어(앱)로 제공되며 지도, 번역, 음악 등 네이버의 다양한 서비스에도 들어 있다. 또 네이버에서 판매하는 AI 스피커, 외부업체와 제휴한 스마트홈 기기 등과도 연동돼 있다.


네이버는 그린웹을 통해 제3자인 외부 인력들과 파트 타임 계약을 맺고 AI 녹음 내용의 문자 입력 작업을 진행했다. 그린웹은 네이버의 각종 서비스에 필요한 운영 업무를 지원하는 협력사다.


관계자들에 따르면 네이버는 클로바 뿐 아니라 지도, 음악, 번역 등 AI가 적용된 다양한 서비스의 이용자 대화 내용을 녹음했다. 해당 녹음 내용은 파일로 저장돼 그린웹의 외부 근무자들에게 제공됐다. 수 년간 관련 업무를 담당한 A씨는 “하루 1만건 이상의 녹음 파일이 네이버의 클로바 관련 서버에 올라왔다”며 “이를 인력별로 할당해 문자로 바꾸는 작업을 했다”고 밝혔다.


외부 근무자들은 서버에 접속해 ‘음성전사’라고 불리는 프로그램을 실행시켜 개인별로 할당된 녹음 파일을 듣고 문자로 입력했다. 파일에는 네이버의 AI 이용자들이 스마트폰과 AI 스피커 등 다양한 기기를 통해 관련 서비스를 이용하며 나눈 대화들이 녹음돼 있다. 여기에는 전화번호나 이용자번호(ID) 등 이용자를 특정하는 정보들은 들어있지 않지만, 일부 민감한 개인 신변에 얽힌 내용을 말한 경우도 있다. 또 다른 관계자 B씨는 “길 묻기, 음악 재생, 날씨 등 서비스 관련 내용들이 녹음 파일에 주로 들어 있지만 마치 친구와 대화하듯 나눈 개인적인 내용도 있다”며 “욕설이나 음란한 내용은 문자 입력에서 제외했으나 나머지 내용들은 모두 입력했다”고 털어놓았다.


네이버의 AI 녹음 청취 작업은 비공개로 이뤄졌다. 녹음 청취를 맡은 외부 근무자들은 공개 채용이 아닌 지인 추천 방식으로 계약했으며 비밀 유지 협약을 맺고 일했다.


그런데 이용자들은 이런 사실을 알 수 없어 논란이 되고 있다. 클로바 이용약관 제4조에는 ‘이용자에게 좀 더 좋은 서비스 제공을 위해 이용자가 클로바 이용 과정에서 입력하는 데이터(음성명령 내용, 메모내용, 대화 내용, 연동기기 위치정보) 등을 저장해 품질 개선 및 성능 향상에 활용할 수 있다’고 돼 있으나 녹음과 제3자 청취 여부에 대해서는 안내하지 않고 있다.


이는 애플의 시리 사태와 유사하다. 영국 가디언 등 외신들은 지난달 26일 애플이 아일랜드에 위치한 협력사를 통해 수백명의 외부 직원을 고용, 애플 서버에 저장된 이용자와 시리의 대화 녹음 파일을 글로 옮겨 입력했다고 보도했다. 외신에 따르면 페이스북, 구글, 아마존도 같은 방식으로 AI를 훈련시켰다. 문제는 해당 업체들이 AI의 대화 녹음 및 제3자 청취 사실을 알리지 않아 이용자들의 불안을 가중시켰다는 점이다. 결국 지난달 28일 애플은 공식 사과했다.


AI 녹음 파일 청취는 사생활 침해 및 정보 유출 논란을 일으킬 수도 있다. 실제 IBM은 애플에서 녹음하는 시리 대화 내용에 기업 정보가 섞이는 것을 우려해 직원들의 시리 사용을 금지시키기도 했다. 아마존 등에서는 AI 스피커의 대화 녹음 여부를 이용자가 설정할 수 있도록 했다. 그러나 네이버 등 국내 AI 서비스는 아직 대화 녹음을 설정할 수 있는 기능이 없다.


전문가들은 네이버의 AI 녹음이 개인정보보호법 위반은 아니지만 사생활 침해 소지는 있을 수 있다고 보고 있다. 법무법인 원의 강윤희 변호사는 “녹음 파일에 개인을 식별할 수 있는 정보가 없어서 익명성이 보장된 상태라면 개인정보 침해로 보기 어렵고 빅데이터의 하나일 뿐”이라면서도 “하지만 누군가 특별한 대화 내용을 들었다면 다른 사람에게 사생활이 공개되지 않을 권리를 침해당한 것이어서 논란이 될 수 있다”고 말했다. 강 변호사는 또 “약관에 구체적으로 녹음이라고 명기하지 않은 점, 제3자에게 전달될 수 있다는 점을 명기하지 않은 것도 문제 소지가 있다”고 지적했다.


이에 대해 네이버는 AI 서비스의 대화 내용을 녹음하는 것은 맞지만 사생활 침해나 정보 유출이 일어나지 않도록 데이터를 처리하고 있다는 입장이다. 네이버 관계자는 “AI가 사투리 등 다양한 억양을 알아듣게 하려면 녹취 작업이 불가피하다”며 “녹취 내용의 유출을 막기 위해 근무자들에게 보안 서약서를 받고 있다”고 해명했다. 이 관계자는 “약관에 데이터 저장 사실을 명기하고 있으며 모든 이용자들의 대화 내용이 녹음되는 것이 아니라 이용자의 1% 정도만 녹음할 뿐”이라며 “녹취 분석이 끝난 파일은 일괄 삭제해 악용 소지를 없애고 있다”고 밝혔다. 아울러 네이버는 향후 이용자가 AI의 대화 내용 녹음 여부를 설정할 수 있는 기능 적용을 검토할 계획이다.

한국일보

네이버의 인공지능 서비스인 클로바를 실행시킬 수 있는 스피커.

최연진 IT전문기자 wolfpack@hankookilbo.com