英國《自然》雜志27日公開的論文,報道了一種能在傳統策略游戲——圍棋上擊敗專業選手的電腦程序。圍棋被認為是人工智能領域一個非常具有標志性的“大挑戰”,這項成果可能會給人工智能領域其他看似難以實現的人類級別能力的項目帶來希望。
現在的國際象棋領域,人類頂尖選手都會被電腦殺得丟盔棄甲,圍棋則不然。圍棋起源于中國,兩個選手在矩形格子上交換下黑子和白子,目標是在比賽結束時比對方占領更多的地盤。正是源于圍棋巨大的搜索空間,很難估計局面和下子,讓圍棋被視作人工智能領域“難以搞定”的標志性項目。迄今最成功的圍棋計算機程序,能達到業余人類選手的程度,但還不能和專業選手在不讓子的情況下一較高下。
此次,位于英國倫敦的谷歌旗下DeepMind公司的戴維·西爾弗、艾佳·黃和杰米斯·哈薩比斯與他們的團隊,開發了一個叫“AlphaGo”的程序,利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。訓練這些深度神經網絡的,是對人類專業棋局的監督學習以及讓它和自己對弈的增強學習。
“AlphaGo”程序在和其他圍棋程序的對抗中獲得了99.8%的勝率,并且在一項競賽中以5比0的成績戰勝了歐洲圍棋冠軍。計算機程序能在不讓子的情況下,在完整的圍棋游戲中擊敗專業選手,這還是第一次。原本人們認為,要到10年后人工智能才能達到這一成就。