본문 바로 가기

[ 테크 ]

구글은 왜 인공지능
엔진을 개방했을까

by테크홀릭

구글은 왜 인공지능 엔진을 개방했을까

구글과 페이스북, IBM 등 실리콘밸리 기업이 인공지능 시장을 놓고 격전을 벌이고 있다. 이런 가운데 지난 11월 10일(현지시간)에는 구글이 인공지능 엔진 텐서플로우(TensorFlow)를 오픈소스로 공개했다. 전 세계에 무료로 공유하겠다고 나선 것이다. 구글은 왜 이런 짓(?)을 했을까.

 

구글이 자사의 인공지능 엔진을 오픈소스화한 건 결국 인공지능의 진정한 가치가 소프트웨어와 알고리즘보다 인공지능 자체를 더 똑똑하게 만드는 데 필요한 데이터가 중요하다는 걸 말해준다. 구글은 인공지능 엔진은 공개했지만 데이터는 공개하지 않았다. 결국 인공지능의 미래가 데이터에 있다는 얘기다.

 

전문가들은 데이터가 중시되면서 소프트웨어를 오픈소스화하는 경향이 있는데 다른 기업이 확보할 수 수 없는 독자 데이터를 보유하고 있기 때문이다. 이런 점에서 구글이 데이터를 앞으로 공개하는 일은 절대로 없을 것이라는 것이다. 실제로 IBM 역시 인공지능 시장 경쟁력을 위해 데이터 확보에만 수백만 달러를 투자하고 있다고 한다. 재미있는 건 기업이 데이터를 사들이는 한편 알고리즘은 오픈소스화하고 있다는 것이다. 결국 인공지능을 위한 기계학습, 딥러닝을 위해 가장 중요한 게 뭔지는 분명하다는 것이다.

구글은 왜 인공지능 엔진을 개방했을까

텐서플로우는 딥러닝을 이용한다. 사람의 뇌 뉴런 같은 광대한 신경망에 데이터를 입력해 이미지 분석과 음성 인식 심지어 자연 언어 처리 같은 작업을 수행할 수 있게 해주는 것이다. 신경망에 고양이 이미지를 주면 고양이를 인식할 수 있게 된다. 대화 데이터를 입력하면 대화를 계속할 수 있게 학습시킬 수도 있다.

 

신경망을 작동하게 하는 알고리즘 자체는 그다지 새로운 게 아니다. 이미 1980년대부터 존재하고 있었다. 그렇다면 새로운 건 뭘까. 인터넷을 통해 처리 능력을 비약적으로 끌어올리고 방대한 데이터 보유가 가능해졌다는 게 차이다. 클라우드 컴퓨팅이 등장하면서 아마존이나 마이크로소프트 같은 기업은 인터넷에 있는 정보를 더 빠르게 처리할 수 있게 됐다. 일반 사용자도 정보 처리 엔진에 대한 접근이 가능해진 건 물론이다.

 

하지만 대량 데이터를 축적하고 있는 건 여전히 구글이나 페이스북 같은 기업이다. 그들은 수십억 명에 달하는 서비스 사용자를 이용해 텍스트와 이미지, 동영상, 음성 등 방대한 정보를 확보하고 있다. 페이스북과 구글은 인공지능 소프트웨어 개발을 진행 중이지만 이들 기업의 진짜 경쟁력은 방대하면서고 고품질인 데이터에 있다. 이를 통해 소프트웨어를 더 인간답게 생각할 수 있는 서비스로 발전시킬 수 있는 것이다.

 

물론 그렇다고 해도 인공지능 알고리즘 자체에 상당 기술이 들어간다는 점도 분명하다. 구글이 인공지능 알고리즘을 오픈소스화한 또 다른 이유는 직원이 아닌 소프트웨어 공개를 통해 외부에서 새로운 기술 공급과 발전을 꾀하려는 것이다. 다만 외부 개발자가 인공지능을 연구하는 게 점점 어려워지고 있는 건 분명하다. 구글이나 페이스북 같은 기업이 보유한 데이터베이스에 접근할 수 없기 때문이다. 어떤 기업이 인공지능 시장 경쟁에서 승자가 될지는 알 수 없지만 한 가지 확실한 건 인공지능의 미래가 데이터 없이는 기대할 수 없다는 것이다. 관련 내용은 이곳에서 확인할 수 있다. 

정희용 IT칼럼니스트