2016年3月19日 星期六

AlphaGo贏棋王 靠兩大密技

http://udn.com/news/story/9574/1573619
2016-03-19 04:01 經濟日報 記者彭慧明/台北報導






AlphaGo相關資料 圖/經濟日報提供


Google轉投資DeepMind的人工智慧(AI)系統「AlphaGo」對戰南韓棋王李世乭大勝,DeepMind資深研究員黃士傑昨(18)日表示,AlphaGo的人工智慧,最重要的是將廣泛的資訊歸納為有效率的小範圍知識,減少人做決定的困難,未來可望用在判斷醫療輔助、機器人等項目。


黃士傑表示,AlphaGo的獲勝是以類神經網路基礎的兩大網路:策略網路與值網路(Value Network)共同運算、深度學習的結果。


他解釋,策略網路與值網路,就是直覺與運算。例如圍棋有361個可下棋的點,對方下出第一手後,還有360處可下。這時策略網路會綜合過去棋譜,找出頂級棋手下過最好的20種落子法,消去340步多餘的步數,這是吸取前人的成就。


接著值網路開始運算、判斷盤面在未來幾步占優勢的狀況,再建議下一步走法,減少搜尋的深度,找出最有效率的走法。


黃士傑對未來人工智慧的應用樂觀,不認為有「消滅」、「取代」人類的負面因素,相信人工智慧是中性的,端看使用者的應用方向。他說,DeepMind內部還有倫理委員會,針對人工智慧的應用有一套政策,不會讓人工智慧淪為犯罪的開發。


黃士傑謙稱,AlphaGo是結合30萬個棋譜、7000萬盤面的成果,是人類智慧結晶,沒有這些累積知識,AlphaGo不會成功。對於AlphaGo四勝一負的結果,他覺得很完美,「但我們正在找失敗的bug(程式錯誤)」。


黃士傑是出身台灣的碩、博士,他說,台灣資訊科系的訓練紮實,並不輸外國人,台灣不用妄自菲薄。問到AlphaGo的下一步,他回應,仍未決定是否向世界棋王、中國棋士柯潔挑戰。


黃士傑幫AlphaGo擺棋,南韓瘋狂研究他「面無表情」、「不去洗手間」。黃士傑說,電腦沒有感情,不受影響,但他坐在李世乭的對面,「不能做出什麼表情影響對方判斷」,加上AlphaGo設計沒有「人幫忙」的參數,他不願影響程式運算,所以不離開棋局。