태터데스크 관리자

도움말
닫기
적용하기   첫페이지 만들기

태터데스크 메시지

저장하였습니다.
   맹물국수  
Front Page
Tag | Location | Media | Guestbook | Admin   
 
[딥마인드 자체 총결산] 알파고는 이미 無敵(무적)

 

[-알파고대결] 딥마인드 팀 자체 復棋(복기)

 

 

 

 


 

(역주) 

:알파고-프로젝트 책임자 데이비드 실버(David Silver)가 모교인 런던대학학원(UCL:UniversityCollege London)에서 비공개 강연을 열어 이번 -α 5번기대결 復棋를 했다. 모임 중에 촬영은 허락되지 않았다.

 

:記事는 위 대학 컴퓨터계열(;영국 최고라고) 박사과정 공부 중인 중국인 유학생 장위남(張偉楠)이 해당 강연 참가 후 작성하여 중국 tmtpost.com에 독점 기고한 것이다.

 

:記事 중에 알파고의 현재 ELO점수가 4500점 근처라는 내용은, 며칠 전 대학의 다른 유학생이 미국 인터넷((reddit.com)에 소개한 내용 및 국내 번역記事와 부합한다.

 

:이하 발췌-번역하여 싣는다. 바둑 관련 내용은 중, 후반부에 등장한다.

 

 


  

 

출처 :장위남(張偉楠) tmtpost.com(鈦媒體) 2016.03.29.

  

:알파고팀은 Nature지의 그 논문을 잇는, 또 하나의 논문을 쓸 예정이다.

 

:연구자사회에 공헌하기 위해 알파고팀은 이미 DQN(deep-q-network) 프로젝트의 코드를 공개했다. 앞으로 아마도 알파고의 코드 또한 공개하게 될 것이다.

 

:딥마인드의 이후 주안점은 인간의 일상생활정보와 관련된, 세상을 바꾸어나갈 응용분야이다. 예를 들어 정밀의료, 가정용 기기인간, 지능형 전화기 등이다.

 

 

 

알파고 代父, 십년 간 칼을 갈다

 

:인간 최고수에게 기계의 승리가, 하룻밤 사이에 벌어진 일 같지만 사실은 십수 년의 세월을 들인 끝에 이뤄진 것이다.


:데이비드 실버는 알파고팀의 수석연구원인 동시에 UCL대학 컴퓨터계열 교수이다. 강화학습을 담당한다.


:그는 강화학습 분야에서 세계적으로 손꼽히는 대가인 Richard S.Sutton 지도하에 박사 학위를 땄으며 이후 미국 메사추세츠공대 대학원에서 박사 후 연구에 종사했다. 이 기간 동안 줄곧 강화학습을 이용한 바둑 인공지능 연구에 몰두했다. 영국 UCL대학 교수 부임 후에는 강의 중에 항상 바둑을 응용실례로 삼았다.


:딥마인드팀 가입 전에도 데이비드 실버와 CEO 하사비스(Demis Hassabis)는 강화학습을 공동연구했다. 하사비스는 UCL에서 신경학 박사학위를 땄다. 두 사람은 모두 게임광이다. 하사비스는 소년 시절에 영국 체스대표팀 주장을 지냈으며, 13세 때에 체스 마스터를 획득했다. 청년 시절에는 게임회사를 창업했다. 데이비드 실버는 긴 세월 바둑에 꽂혀있었다.


:딥마인드가 구글에 매각되는 과정 중에 딥마인드는 UCL 측과 협의하여, 데이비드 실버가 교수직을 가진 채로 딥마인드팀에 합류하여 팀의 연구에 전폭 몰두하게 되었다.

 

 

 

-알파고 戰 復棋

 

:1국의 승부처는 백102 우변 침입이었다. 프로들은 날카로운 침입이라 인정했다. 이세돌은 대비가 되어 있는 듯 보였는데, 후에 보니 이세돌의 응수에 실수가 있었고, 흐름이 알파고에게 넘어갔다. 몇 수 진행 후 알파고의 우세가 확실해졌다.

 

:2국 초반에 알파고가 인간프로들을 갸웃하게 만드는 수를 두었다(우변 5선 어깨 짚음). 데이비드 실버는 이를 두고 인간적인(unhuman) 수라 불렀다. 이후 진행에서 이 수의 가치가 점점 부각됐으며 이세돌은 또 한 번 맥없이 졌다.

 

:데이비드의 평가 :“다수 해설들이 즉각 이 를 비판했다. 이전에 이런 국면에서 누구도 두지 않은 수라고. 승패가 가려진 후, 몇몇 프로들이 이 를 재검토했고 그 결과, 그들은 자기도 (앞으로) 그런 수를 두게 될 거라고 말을 바꾸었다.”

 

:1국과 2국이 알파고의 역전승이라고, 많은 인간프로와 언론들의 분석이다. 그러나 알파고 가치망이 행하는 실시간 승률분석에 의하면 알파고가 줄곧 우세했다. 알파고가 이긴 4판에서 알파고 시스템 자체의 승률평가로는 알파고가 줄곧 이세돌을 앞서고 있었으며, 시작부터 끝까지 압도하며 승리했다.

 

:3국과 5국에서, 알파고는 바둑 시작하고 얼마 안 지나서 확실한 우세를 잡았으며, 高 승률예측을 유지한 채로 마지막까지 갔다. 인간프로들의 경험에 의존하여 행하는 승패 판단과 달리, 알파고 자체의 승률평가는 가치모듈에 기반하여 승패확률을 계산한다.

 

:이 두 가지 판단 방식은 완전히 다르다. 5국에서 우하귀의 복잡하게 얽힌 싸움에서 알파고는 선수를 뽑아 다른 곳으로 갔다. 상당수의 인간프로들이 알파고가 실수를 하여 불리해졌다고 보았다. 그러나 알파고의 선택은 全局(전국)을 고려하여 최선의 길을 찾아간 것이다.

 

(역주 :이는 5국 당시 중에 알파고가 초반에 실수한 후 추격 중이라는 알파고팀의 실시간분석과는 상반된다. , 알파고가 이긴 4판에서 단 한순간도 불리했던 적이 없다고 말하면서 5국을 이렇게 말하니, 결국 5국 초반의 그 실수도 실수가 아니며 그 수에 불구하고 그 시점에서 알파고는 자기가 유리하다고 예상했다는 말이다(맨 아래 그림 참조). 그리고 이게 알파고팀의 최종결론인 모양이다. 다만, 이건 인간프로의 대응 연구가 필요한 곳이 아닐까....)

 

:알파고의 이런 식의 판단(;대세관)은 인간보다 정확하다. 알파고의 판단방식은 인간프로가 훈련으로 습득하는 직감과 사고방식에 구속되지 않으며, 결국 인간프로의 전통적 이해범주를 넘어섰다.

  

 

 

의 한 의 배후

 

:알파고의 약점은 소위 흉내바둑이니 ()싸움이 아니다.


:4국에서 일치감치 막다른 골목에 몰린 이세돌이 중국의 고력(古力)의 한 라 평한 백78 끼움수를 두었다. 이 수에 그토록 철벽같던 알파고가 어쩔 줄을 모르고 헤매며 붕괴했다.


:관전 중이던 하사비스조차 도대체 어찌된 일인지 알지 못했다.


:事後 분석에 의하면, 이세돌의 백78 전에 알파고 자체 평가한 승률은 줄곧 우세로서 70%에 달했다. 78 후에 알파고가 평가한 승률은 급전직하했으며 이세돌이 크게 유리했고 이후 다시는 좁혀지지 않았다.


:데이비드에 의하면 알파고의 수읽기에 분명히 이 가 들어있었다. 다만 알파고는 이세돌이 이 수를 둘 확률을 1/10000 정도로 보았다. 결과, 이세돌이 그렇게 두지 않을 거라 보았고 따라서 그 수 이후의 응대를 아예 읽지 않았다.


:알파고의 몬테카를로 수색법의 바탕이 되는 정책망은 인간이 둔 棋譜(기보) 자료에 의한 훈련으로 만들어진 모형이다. 때문에 백78 같은 소위 (고급) 묘수를 예측하기란 매우 어려우며, 그런 에 터 잡아 계속 수색한 결과 승부 상황이 어찌 될지를 판단하기 또한 매우 어렵다.


:이게 바로 알파고가 5판 중에 드러낸 유일한 파탄이며, 또한 인간지혜가 대량의 자료에 의존하여 구동되는 범용인공지능보다 앞서는 부분이다.

 

 

 

인공지능은 이제 無敵(무적)인가?

 

:대결이 벌어지기 전에, 이세돌을 포함한 대다수 바둑계 프로들은 이세돌이 쉽게 이기리라고 보았다. 그러나 딥마인드팀은 자신에 차있었다. 딥마인드팀의 다른 한 사람은 UCL에서 알파고의 발전을 설명하면서 알파고가 이긴다고 확신에 찬 예언을 하였다.

 

:3월의 알파고(이세돌을 이긴)는 반년 전의 알파고(중국 프로를 이긴)4점을 접는다.

 

:알파고 최신판은 스스로의 ELO점수를 4500점 내외로 평가한다. 이는 3600여 점의 가결(柯潔)을 훨씬 앞서는 점수이다. 대략 13단 수준으로서 이미 인간에게는 무적이다.

 


                                                         4500

                                                   


(이하 생략)










                                                   승률예측 그래프












                                   사진 :http://imgur.com/a/29mOG
















 

 

저작자 표시 변경 금지
신고
Commented by 斯文亂賊 at 2016.04.01 13:28 신고  r x
국수 님, 덕분에 잘 보았습니다. 그런데 저로서는 제3국 78수 부근과 제5국 58수 부근의 실시간 승리 기대값을 보이는 그래프를 도저히 납득할 수가 없네요. 저 수들 이후 흑백을 바꿔 잡아도 과연 승패 불변이었을까요? 물론 그 이후에도 인간의 상상을 초월하는 수가 숨어 있을지도 모르고 또 실수가 나올 수도 있겠습니다만, 저 그래프로는 승착과 패착을 찾아내기가 어렵지 않을까 싶네요. 간접적으로 복기가 가능하리라던 제 예측이 빗나간 듯합니다 ㅠ.ㅠ 아무튼 의외(?)의 수를 당하면 알파고가 사람보다 더 큰 충격(?)을 받는 듯하고^^ 분명히 실수도 하는 것 같습니다. 제 짧은 생각으로는 이제 알파고와 호각 이상으로 둘 수 있으려면 조합게임이론에 기대를 거는 수밖에 없지 않을까 합니다. 그런데 이 이론의 원산지도 영국이고, 적어도 부분적으로는 바둑에서 영감을 얻은 것이라고 하네요. 그 참.
Commented by 청인 at 2016.04.18 01:39 신고  r x
저는 정말로 보고싶은게 금용성배같이 인간의 대표가 3명정도 시간을 넉넉하게 두고 상담기를 가지면 어떻게 되는지 궁금합니다 지금 현재 4500과 커제의 3600 수준을 상담기를 통해서 같은 수준으로 될수 있지 않을까요? 어차피 알파고도 인간고수의 바둑기보를 토대로 발전한 것인데 말이죠
Commented by at 2016.04.28 21:24  r x
비밀댓글입니다
Commented by at 2016.04.28 21:38  r x
비밀댓글입니다
Commented by 잡기 at 2016.04.28 21:41 신고  r x
A.Patterson 바둑두지 못한다
Commented by 잡기 at 2016.04.28 21:41 신고  r x
A.Patterson 바둑두지 못한다
Commented by ㅜㅜㅜ at 2016.04.28 21:51 신고  r x
에드워드리는 교도소에서 바둑을 배웠다.....
에드워드리는 결백하다.....
Commented by fdsfs at 2016.05.11 12:10 신고  r x
할배가 또.. ㅋㅋㅋㅋㅋ 할배들의 미신이 이제 로봇에게까지...!

name    password    homepage
 hidden


BLOG main image
 Notice
안녕하세요 이곳의 저작권 정..
 Category
모두 (784)
바둑 (546)
棋士 인터뷰-바둑2 (41)
앗! 이럴 手가-바둑3 (13)
바둑저작권-저2-바둑4 (42)
표절이야기-저작권1 (12)
이런저런 (63)
자료 (67)
 TAGS
 Calendar
«   2017/07   »
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          
 Recent Entries
알파고의 한 手 (19)
[펌譯] 삼성배 大捷(대첩) 즐기는.. (2)
 Recent Comments
ㅋㅋㅋㅋㅋㅋ아 너무 웃겨
팔자야 - 01.31
http://image.baidu.com/search/..
quanzhou - 2016
http://tieba.baidu.com/p/112308..
quanzhou - 2016
ㅇㅇ님 여기에 가보세요. 뭐가 좀..
맹물국수 - 2016
아 2004년부터 좀 보고싶은 기록..
ㅇㅇ - 2016
저 자료는 tom.com이 정리해준 꺼..
맹물국수 - 2016
맹물국수님 항상 자료잘보고 있는..
ㅇㅇ - 2016
알파고-알파고의 바둑을 보니 알..
지나가다 - 2016
Deep Mind가 공개한 알파고 대 알..
斯文亂賊 - 2016
싫으면 안보면 되잖아요 오로나..
뭐래 - 2016
 Recent Trackbacks
김미리, 정관장배 바둑 끝내나?
삼삶스토리
 Archive
2016/07
 Link Site
○●한국기원●○
○이창호●
●이세돌(go9dan.com)○
綜合 - Tygem.com
綜合 - CyberOro.com
綜合 - HanGame.com
言 - 박치문의바둑時論
言 - 문용직,중앙일보
言 - 문용직의 지평과 안목
言 - 조선일보,이홍렬입력
言 - 이홍렬의 19로산책
言 - 한겨레
言 - 연합뉴스 바둑란
言 - 엄민용,스포츠경향
게시판 - 프바사
블 - 조혜연九단영문블로그
블 - 정동환의 바둑동네
블 - 목진석박정상
블 - 이하진三단영문블로그
블 - 진동규六단
블 - 이영호(laoxiong老兄)
일본 - 일본기원
일본 - 바둑칼럼,讀賣(요미우리)
일본 - 日刊바둑(日刊圍碁)
일본 - 2ch Go세계바둑글타래
블日本 - 요다(依田)
블日本 - 우메자와(梅澤)日記
블日本 - 타카오신지(高尾紳路)
블日本 - 검토실에서반집승
블日本 - Yukari House
중국 - 중국기원
중국 - 新浪網Sina.com
중국 - 搜狐Sohu.com
중국 - 棋聖道場Tom.com
중국 - 體壇週報(체단주보)
중국 - 중국棋牌網
중국 - 바둑TV(圍棋TV)
중국 - 弈城eweiqi.com
중국 - 野狐foxwq.com
중국 - 통계끝판왕hoetom.com
대만 - 대만기원
블中國 - 섭위평
미니블 - 사예(謝銳)기자
블中國 - 사예(謝銳)기자
블中國 - 일본通(양삭楊爍)
블中國 - 西子林의풍경
블中國 - 문학과바둑
미니블 - 고력(古力)
미니블 - 가결(柯潔)
미니블 - Sina바둑웨이보
 Visitor Statistics
Total : 112,032
Today : 24
Yesterday : 261
rss
 

티스토리 툴바