본문 바로 가기

[ 테크 ]

인공지능과 인간이 '토론배틀'을 벌였다

by한겨레

아이비엠 컴퓨터와 이스라엘 토론 우승자 대결

청중들, 인공지능에 한표..."내용이 더 풍부했다"

인공지능과 인간이 '토론배틀'을 벌였

아이비엠의 `프로젝트 디베이터'(왼쪽)와 인간 사이의 토론 배틀 장면. 아이비엠 제공

토론 주제는 ‘우주탐사 자금 지원’과 ‘원격 진료’

인공지능과 인간 사이에 또 하나의 흥미로운 대결이 펼쳐졌다. 이번에는 토론 배틀이었다. 토론은 바둑이나 체스와는 달리 명확한 규칙이 있는 게 아니어서 승패를 가리기가 어려운 대결이다. 승패 자체가 주관적 판단에 달려 있다. 규칙을 분석하고 추론하는 데 능한 전통적 인공지능엔 익숙하지 않은 게임이다.

 

아이비엠(IBM)이 개발한 인공지능 컴퓨터 ‘프로젝트 디베이터’(Project Debater)가 이 생소한 토론 대결의 주인공이다. 방대한 데이터를 토대로 논리를 세워 주장을 전개하는 이 토론인공지능은 2011년 아이비엠의 슈퍼컴퓨터 왓슨이 ‘제퍼디’ 퀴즈쇼에서 인간 퀴즈왕들을 물리친 뒤, 아이비엠이 이스라엘연구소를 기반으로 새롭게 시작한 프로젝트의 결과물이다.

 

아이비엠의 기술 시연회 성격을 띤 이번 토론은 18일(현지시간) 아이비엠의 샌프란시스코 회의실에서 진행됐다. `프로젝트 디베이터'는 질쭉한 검은색 네모 기둥 모양으로, 상대방의 주장을 듣고 위키피디아와 저널, 신문 등의 자료에서 증거를 끄집어낸 뒤 여성의 목소리로 논리적인 주장을 펴도록 설계됐다.

 

토론자로 나선 사람은 2016년 이스라엘 전국토론대회 우승자인 노아 오바디아(Noa Ovadia) 등 두 사람이다. 아이비엠은 컴퓨터와 인간 토론자 모두에게 사전에 토론 주제를 알려주지 않았다. 둘 다 인터넷을 활용하지도 못하게 했다. 다만 컴퓨터에는 IBM이 100여개의 주제에 걸쳐 수집한 수백만건의 기사를 비롯한 수억건의 자료들이 내장돼 있었다. 대신 이 주제에 대한 사전 토론연습은 없었다고 한다.

 

토론 방식은 단순했다. 양쪽이 먼저 각각 4분간 발제를 하면 상대방이 4분간 반박을 하고, 이어 2분간 결론을 말하는 방식이었다. 토론 주제는 2가지였다. 첫번째 주제는 “우주탐험에 보조금을 지급해야 하는가”, 두번째 주제는 “원격진료를 확대해야 하는가”였다.

인공지능과 인간이 '토론배틀'을 벌였

인공지능의 반박 토론을 듣고 있는 이스라엘 토론 우승자 노아 오바디아. 씨넷 유튜브

첫 주제 물음에 대해 인공지능은 찬성, 인간 토론자는 반대 입장에서 주장을 펼쳤다. 우선 인공지능이 말을 꺼냈다. ”우주탐사는 과학적 발견을 촉진시키고 젊은이들에게 영감을 불어넣어주는 등 여러 모로 인류에게 유익하다”는 요지였다. 토론자 오바디아는 “정부의 돈은 지구에 관한 과학연구 등 좀 더 시급한 곳에 쓰여야 한다”면 반대 의견을 피력했다. 인공지능의 반박이 이어졌다. “더 중요하게 돈 쓸 곳이 있다고 말하기는 쉽다. 이것을 따지는 게 아니다. 아무도 이것(우주탐사)이 유일한 지출항목이라고 주장하지 않는다. 그러나 그것이 핵심은 아니다. 우주탐사에 보조금을 지급하는 것은 사회에 뚜렷한 이익이 되기 때문이다. 나는 이것이 정부가 추구해야 하는 것이라고 주장한다.”

 

아이비엠은 이번 토론배틀의 승자를 발표하지는 않았다. 하지만 청중들은 인공지능의 손을 들어줬다. 전달력은 사람에 뒤졌지만 좀 더 풍부한 정보와 지식을 얻을 수 있었다는 이유를 들었다. 청중들은 원격진료에 관한 두번째 토론에서는 상대토론자보다 인공지능이 더 설득력이 있었다고 평가했다. 다만 이날 토론 청중들의 상당수는 IBM 직원이었다. 청중들이 일부러 인공지능 편을 들어주지는 않았겠지만 인공지능에게는 아무래도 홈그라운드 조건이었던 셈이다.

 

대결을 펼친 토론 당사자의 평가는 어땠을까? 오바디아는 인공지능이 일부 대목에서 섣부른 일반화를 시도하는 우를 범하기는 했지만 만만찮은 상대였다고 말했다. 그는 컴퓨터가 자신이 말하는 논점의 핵심을 잘 파악해 대응했으며, 특히 인공지능의 유창한 어휘와 문장 구사력에 깊은 인상을 받았다고 했다.

 

물론 ‘프로젝트 디베이터’가 순전히 만족할 만한 능력을 보여준 것만은 아니다. 인공지능은 차분한 여성 목소리로 자연스런 억양과 문장 구조를 구사했으나, 언어적 정확성과 논리적 명확성은 떨어졌다고 <가디언>은 지적했다. 예컨대 우주탐사 토론에서 인공지능은 조금씩 다른 단어들을 사용하기는 했지만 경제에 유익하다는 말을 몇번씩 되풀이했다. 문장의 두번째 절이 첫번째 절과 부드럽게 이어지지 않는 경우도 있었다고 한다. 때로는 자연스럽지 않은, 관련이 그다지 없는 사례와 인용문을 끼워넣기도 했다. 인공지능의 또하나 문제는 손짓이나 표정이 없다는 점이었다. 이는 청중들이 토론로봇의 말에 집중하는 걸 어렵게 만드는 요인이다.

인공지능과 인간이 '토론배틀'을 벌였

2011년 미국 ABC 텔레비전의 퀴즈쇼에서 인간과 대결을 펼치고 있는 아이비엠의 슈퍼컴퓨터 왓슨. 아이비엠

기업 이사회 등서 편향없는 의사결정에 도움

아이비엠은 비록 시연이기는 하지만 이번 이벤트를 통해 방대한 정보를 소화해 설득력 있는 내용으로 토론을 끌어가는 컴퓨터의 능력과 잠재력을 보여줬다. 청중들의 호의적인 평가가 이를 뒷받침해준다. 아이비엠은 이를 위해 데이터에 기반한 연설문 작성과 전달, 연설에서 나온 주요 주장을 듣고 파악하는 청취이해력, 원칙에 입각한 주장을 만들어내 표현하는 능력 등 토론인공지능의 역량을 개발하는 데 6년을 보냈다.

 

아이비엠은 충분한 정보에 입각한 결정을 내릴 수 있도록 하는 데 이런 인공지능이 앞으로 큰 도움을 줄 수 있을 것으로 기대한다. 이미 방대한 병원 내부 데이터를 분석해 의사의 암 진단을 돕고 있는 수퍼컴퓨터 왓슨의 능력을 확장시키는 데도 도움이 될 것으로 보고 있다.

 

연구 책임자인 아르빈드 크리시나 이사는 “인공지능은 유익하게 사용할 수 있는 잠재력이 막대하다”며 기업 경영을 그 예로 들었다. 상충되는 견해가 많은 기업 이사회에서 인공지능은 감정을 배제한 채 대화를 듣고 모든 증거와 주장을 고려할 수 있기 때문에, 증거에 기반한 의사 결정의 수준을 높여줄 수 있다는 것이다. 감정적 판단이나 편견에 치우칠 우려가 있는 반테러 정보 분석에서도 토론인공지능이 유용할 것으로 보았다. 그는 “두 경우 모두 기계가 결정을 내리지는 않을 것이지만 의사결정 토론에서 또다른 목소리로 참여해 의사결정에 기여할 수 있다”고 말했다.

악용 위험…“앵무새처럼 되뇐 것일 뿐” 혹평도

전문가들의 반응은 엇갈린다. 연구개발에 참여하지 않은 크리스 리드 영국 던디대 교수(증강기술)는 대체적으로 긍정적 평가를 내렸다. 그는 “프로젝트 디베이터를 이용해 어떤 주제에 관한 찬반을 공평하게 들여다볼 수 있다면 훨씬 유용한 결정을 내릴 수 있을 것”이라며 “컴퓨터가 상대방의 주장을 예상하고 선제적으로 반박하는 수사학적 기법을 사용하는 것이 인상적이었다”고 평했다. 향후 논점은 인공지능 시스템 그 자체가 아니라, 인공지능에 주어지는 데이터, 그리고 그 안에 들어 있을지도 모를 편향이 될 것이라고 그는 진단했다.

 

위험을 지적하거나 유용성에 의문을 제기하는 목소리도 있다. 모든 인공지능이 그렇듯, 어떻게 쓰느냐에 따라 토론로봇은 얼마든지 악용될 여지가 있기 때문이다. 특히 챗봇 등을 많이 쓰는 소셜미디어에서 그런 위험이 커질 수 있다. 〈MIT 테크놀로지 리뷰〉와의 인터뷰에서 알렌인공지능연구소의 오렌 에치오니 소장은 이번 이벤트만을 갖고 아이비엠 시스템의 능력을 판단하기는 어렵다고 말했다. 일반적인 공개토론이 아니라 사전에 잘 계획된 시연회라는 이유다. 크리스티안 하몬드 노스웨스턴대 교수는 혹평에 가까운 진단을 내놨다. 그는 “아이비엠의 소프트웨어는 자신이 뭘 말하는지도 모르면서 단지 앵무새처럼 지껄인 것”이라며 이번 이벤트는 일종의 일탈적 오락일 뿐이라고 주장했다.

 

인공지능은 ‘프로젝트 디베이터’에서 인간의 좀더 복잡한 정신 영역에 다가갔다. 기록물의 내용을 요약하고 이해하는 검색엔진 기술, 사람들의 음성 질문에 간단한 대답을 내놓는 음성인식 기술, 미용실이나 식당에 전화를 걸어 약속을 잡을 수 있는 음성비서 기술에서 한발 더 나아가 ‘인간과의 자유 토론’이라는 새 영역을 열었다. 훗날 이번 토론 배틀이 1997년 체스 챔피언 게리 카스파로프와 아이비엠 딥블루 간의 체스 대결, 2011년 아이비엠 왓슨과 인간 퀴즈왕과의 퀴즈 대결, 2016년 이세돌 9단과 구글 딥마인드 알파고 간의 바둑 대결, 2017년 세계 최고 포커 선수 4명과 카네기멜론대의 인공지능 리브라투스 간의 포커 대결을 잇는 ‘빅 이벤트’로 기록될 수 있을지 주목된다.

 

곽노필 선임기자 nopil@hani.co.kr