본문 바로가기

바둑

[알파고] 아자황 인터뷰 -알파고 승리의 관건은


記事

sina.com에 실린,

黄士杰揭阿尔法获胜关键 判断优势及最佳棋路

記者 담위성(譚偉晟)

AlphaGo之父黄士杰灵感来源于人类下棋的直觉’

記者 홍성일(洪聖一)

 



발췌 소개한다.

(黃士傑은 한국에 많이 알려진 아자황으로 부른다)

 

 


 

 

아자황은 알파고 승리의 관건은 판단 우세 및 최선의 수읽기라 말한다


 

-아자황 :딥마인드 팀의 일원이자 알파고를 대신하여 돌을 나른 아자황은 대만사람이다. 인터뷰는 대만구글에서 이뤄졌다.

 

-처음에 영어 때문에 고생했다. 엄청난 시간을 쏟아 부어야 했다.


-딥마인드 팀 :대만 출신인 나 외에, 프랑스 인도 중국대륙 영국 독일 오스트리아 등 세계 각국 출신이다. 팀원들의 야망은 크다, 그중 가장 중요한 정신은 개척자정신이다.

  

-바둑과 AI :바둑은 인공지능의 도전에 적합한 분야이다.

 

-두 가지 관건 :알파고 승리의 가장 중요한 관건은, 판단우세 및 최선의 길을 찾아가는 능력이다. 인류 수천 년 지혜의 結晶(결정) 및 대량의 棋譜/수읽기(장면도)를 학습함으로써 알파고는 인류의 직관에 유사한 능력을 갖추게 되었다.

 

-직관은 바둑에서 가장 중요한 관건이다. 직관과 유사한 능력을 갖춤으로써 알파고는 굳이 모든 경우의 를 읽을 필요가 없게 되었다.

 

-인간의 직관과 유사한 능력 :판단우세는 정책망 덕에 가능해졌고, 수를 推斷(추단)하는(;수읽기) 가치망이 정책망을 지원한다.

 

-간단히 말해 :정책망은 수색의 폭을 줄이고 가치망은 수색의 깊이를 줄인다.


-5국 역전승의 動因 :이런 식의 판단 메카니즘이 알파고의 5국 역전승을 가능케 했다. 그 전 4판의 이세돌의 수읽기를 학습한 덕분 외, 5번기 전에 두 대의 알파고 시스템의 자체 연습 또한 인공지능이 인류를 뛰어넘는 능력을 갖게 된 관건이다.

 

-엄청난 진보의 動因(동인) :1990년 당시라면 25점을 깔고도 몰판(다 죽음)을 당했을 것이다. 현재의 비약은 기계학습이라는 기술 덕이다.

(***섭위평에 의하면 그 몇 년 전 아마도 최초의 컴퓨터 바둑 대회가 열렸는데, 어느 컴퓨터가 大우세 장면에서 상대 컴퓨터가 호구 자리에 둬 오자, 초시계를 눌러 불계패를 선언했다고 한다.)

 

-이세돌에 대한 인상 ;대결 당시, 아자황은 이세돌에 대한 상당한 존경심을 품은 채 바둑을 두었다. 물을 먹는다거나 자리를 비운다거나 과다한 얼굴표정 등등을 자제했던 건 기본적으로 이세돌에 대한 존경심으로 그의 집중을 방해하지 않기 위해서였다. 이에 이세돌은 대결이 종료된 후, 아자황이 프로棋士의 기세를 가졌다고 언급했다.

대결 당시 아자황은 아마도 딱 한 번 웃었는데, 이세돌이 이겼을 때 그를 위해 진심으로 기뻤기 때문에 웃었다고 한다.


-이세돌 棋譜(기보)에 대한 사전 연구가 있었는가? :아자황은 부인했다.


-478수에 왜 알파고는 오판했는가? :아자황은, 알파고의 버그임은 분명하다, 그런데 이게 정책망의 오판인지 가치망이 오류 정보(;잘못된 수읽기)를 제공해서인지는 분명치 않다고 말한다. 현재 딥마인드 팀이 원인을 연구 중이다.

 

-돌을 거두는 기준선 :알파고는 희망이 없다고 생각하면 투항하는데 그 기준선은 승률20%이다.

 

-인공지능이 인류를 위협하는 상황의 출현? :이 우려에 대해 아자황은 인공지능을 어떻게 사용하느냐에 달렸다고 강조한다. 딥마인드 팀 또한 이 문제를 중시하고 있으며, 나아가 구글 내부의 이론위원회가 과학기술의 사용 방식이 적절한지 여부를 결정한다고 밝혔다.

 

-알파고가 다른 종목에 도전할지 여부 :예를 들어 스타크래프트 같은 실시간 전략게임에 도전할 가능성은? 단시간 내에 불가능하다. 왜냐 하면 바둑과 달리 불확정요소가 너무 크다, 인공지능에게 아직 곤란하다.

인공지능은 아직 초기단계일 뿐이다. 아직 주동적인 의식이란 것이 없다. 갈 길이 멀다.

  

 


인터뷰 :黃士傑아자황


記者 :담위성譚偉晟    記者 :홍성일洪聖一


발췌번역 :맹물