본문 바로가기

바둑

아자황 대학 후배의 글 -알파고의 승리를 예언


나는 왜 알파고를 지지하는가

 

 

장효인(張曉茵) -대만人, 아자황 대학 후배. 아마추어5단

2016.02.08  

 

 




우선, 구글딥마인드의 컴퓨터바둑인공지능 알파고가 번휘(樊麾)단에게 승리했다는 소식을 접하고, 진짜 놀랐다. 당연히, 두려움 또한 느꼈다. 왜냐하면 번휘단의 실력이 확실히 프로수준임을 알기 때문이며, 고의로 져줄 리도 없기 때문에, 이 소식은 반드시 진실이기 때문이다.

 

둘째로, 이 소식을 놓고 바둑계 곳곳에서 쏟아지는 다양한 토론, 대단히 재미있었다. 즉각, 나는 머릿속으로 한 사람을 떠올렸다. Aja Huang황사걸(黃士傑). 2007, 나는 대만사범대학 대학원에 재학 중에 바둑에 흥미가 있는 선후배들을 모아 바둑클럽을 창설했다. 당시 정보공학대학원에 재학 중이던 Aja선배를 이때 알게 됐는데, 그는 아마추어6단이었으며 또한 바둑클럽에서 나보다 나이가 많은, 즉 유일하게 나보다 선배였다. 그는 열성적으로 후배들을 지도했는데, 바둑AI와 관련한 모든 지식은 당시 그에게 들은 것이다. 이 당시 바둑AI 공인 최강은 Zen이었는데, 대략 아마추어5단 수준이었다. Aja선배가 설계한 프로그램 Erica의 실력 또한 보통이 아니었는데, TAAI(Technologies and Applications of Artificial Intelligence) 개최 2009년 컴퓨터바둑대회 19-은상 및 9-동상을 획득했다. Aja선배의 석사 및 박사 논문은 둘 다 대만사범대학 정보공학대학원 림순희(林順喜)교수 지도하에 완성됐는데, 각각 2003년 석사논문 컴퓨터바둑에서 ()싸움 전략(The Strategies for Ko Fight of Computer Go) 2011년의 박사논문 컴퓨터바둑 몬테카를로 tree 수색법의 응용(New Heuristics for Monte Carlo Tree Search Applied to the Game of Go)이었으며, 박사논문에서 Rémi Coulom이 공동 지도교수였다.



                          바둑대회에서 -두 사람은 왼쪽 ○    출처:장효인 블로그



2007년에 나는 처음으로 Aja선배로부터 몬테카를로 tree수색법에 대해 들었다. 인터넷으로 조사를 해보았더니 원리는 이랬다 :

(몬테카를로기법 상세 설명 ;생략)

그래서 Aja선배 왈, 우리는 매일 매일 대량의 프로 棋譜(기보)를 프로그램에게 처먹인다. 당시 나는, 그럼 프로그램이 충분한 많은 기보를 처먹는다면 분명히 사람보다 더 강해지겠구나 어렴풋이 생각했다. 그런데 그날이 이렇게나 빨리! 올 줄은 생각도 못했다.

 

그 외에도, 요 몇 년에 그들은 정책망 및 가치망 등의 핵심기술을 추가했다. 네이처 지에 실린 알파고 관련 논문을 유심히 살펴본다면 제1저자가 David Silver Aja Huang임을 알 수 있다.

 

Aja선배 또한 알파고 개발팀의 일원이며 게다가 공동 제1저자이며 팀 내 공헌도가 작지 않음을 알고 나도 자랑스러웠다. 내가 알기로 Aja선배는 박사과정 졸업 후 영국으로 건너갔다. 2014년에 그는 나에게 바둑천지(圍棋天地) 2013년 통합간행본을 구해 영국으로 부쳐달라고 부탁하기도 했다. Aja선배는 自身을 드러내지 않는 사람이라 그가 작년에 딥마인드에 들어간 사실을 나는 최근에야 알았다. 최근의 보도를 보면, 그는 역시나 드러내지 않는 성품 그대로로서, 모든 행위는 오로지 팀이 중심이었다. 페이스북에서 내가 그에게 알파고에 대해 좀 더 알고 싶다고 했을 때, 그의 말인즉, (현 성과는) 전체 팀의 노력이며 게다가 많은 일들이 현재는 비밀로 할 수밖에 없다, 3월 이세돌단과의 대결 직후에야 말할 수 있다고 했다.

 

최근 한 네티즌이 발견한 타이젬의 deepmind라는 아디가 알파고 실전 시험을 위한 아디가 아닌가 하는 추측에 대해, 119Aja선배는 대만책벌레사이트 내의 한 커뮤니티에서 정식으로 답변을 했는데, 간단히 말해 그 아디는 그 개인이 사용하는 것이라고 한다.

 

Aja선배의 原文 :

타이젬의 deepmind는 저 본인(Aja Huang)이 사용하는 아디이지 알파고가 아닙니다. 더구나 deepmind14년 초 이전, 즉 알파고팀이 출범하기 이전에 만든 것입니다. 만약 제 기억이 틀리지 않다면, 구글이 DeepMind를 매입하기 전에 제가 타이젬에서 deepmind로 바둑을 두었으며 당시 저는 8단까지 갔습니다. 저는 바둑 두기를 즐깁니다. 棋力은 대만 아마추어6단이며, 작년에 독일에서 열린 대회에서 심지어 일본의 프로기사를 이긴 적도 있습니다. 다만 알파고는 분명히 저보다 훨씬 강합니다.

(역주 ;이 말을 액면 그대로 믿는다 가정하면, 아자황은 약 2년 전에는 8단이 한계였는데 -deepmind 등록정보에 그의 말대로 7,8단 오르락내리락 아주 잘 논 흔적이 고대로 있다 -작년 말~올 초에 걸쳐 급격히 실력이 상승하여 타이젬 강9단이 되었다는 얘기가 된다. 흠 그 나이에? 그렇게 바쁜 시절에? 그 짧은 시간에?... 정녕 그게 사실이라면 당신은 늦깎이 천재입니다. 내친김에 걍 입단하시죠^^

자신이 속한 조직을 둘러싼 상황이 그랬기에 그렇게밖에 말하지 못했을 터, 즉 곧이곧대로 믿으면 심히 거시기... -해당 글 밑에 대만사람들이 단 댓글도 마찬가지로 받아들였고.

참고로, deepmind는 올 2월 한 달에 51판을 두었다. deepmind 최근(2,3) 전적만 살핀 결과, 타이젬 9단들을 A,B,C,D급으로 분류한다면, deepmind의 실력은 B급 정도. 이세돌과 둔 알파고의 극강 실력을 우리가 생생히 목격한바 :20초바둑이면 상당히 약해지겠고, 일반 컴이라면 거기다 또 약해지겠고. 그렇다면, 역자 생각에 아마도 일반 컴으로 알파고를 돌리는 게 아닌가 싶다. A==>B.)

 

프로 수준의 바둑프로그램, 늦어도 1,2년 이내에 시장에 보급된다. 나는, Zen 제작자가 우리가 네이처 지에 공개한 방법을 실현해내기 위해 이 순간 죽어라 노력 중이라 확신한다. 어쩌면 Zen이 머지않은 장래에 알파고를 추월할지도 모른다. (타이젬)7단 수준인 Zen5개월 전의 알파고와의 차이는 석점 이상이다.

(역주 :아자황의 이 말은, Zen개발사가 Zen 성능을 향상시켜 시장에 풀 것이란, 그 나름의 예상인 듯)

 

Aja선배의 이 답변은, 알파고의 진짜 실력은 당연히 프로 수준이며 절대로 얕보아선 안 된다는 말이다. 거기다 구글은 분명히 나름의 확신으로, 작년 이후 치밀한 준비와 사전 작업을 거쳐 올 초 뉴스 공개까지, 즉 완벽한 준비를 마쳤다. 아시아의 바둑 강국이 몽백합배에서 우승을 다툴 당시, 영국의 DeepMind팀은 인간 세계챔피언을 추월하는 길을 조용히 걷고 있었다.

 

3월 이세돌과의 대결, 알파고 연구개발팀은 각종 비밀협의 내용을 철저히 감추었다. 이 때문에 나는 알파고의 승리 가능성을 더 높게 본다. 내가 인류를 지지하지 않는 것이 아니다. 棋士 개인의 실력의 강력함도 믿지만, 인류 지혜의 결정체, 즉 구글 DeepMind팀의 집단 지성을 더 믿는다는 얘기다.

 

(이하, 아자황이 작곡도 할 정도로 음악을 좋아한다는 얘기. 아자황이 알파고팀원이라 대학 동창으로서 대만사람으로서 자랑스럽다는 얘기... 생략 ;역주)