“圍棋上帝”AlphaGo 人類棋手難有勝算
人工智能的研發經過多年的低谷期後,在一九九七年出現了大反轉,當年IBM的超級電腦“深藍”(Deep Blue) 在國際象棋比賽中擊敗了世界國際象棋冠軍卡斯帕羅夫,標誌着電腦在複雜的思維任務中取得突破性進展。
在一九五○年代的所謂“狹義人工智能時代”,專家和研究者通過手工編程將大量知識和規則嵌入計算機,以進行對特定領域問題解決和推理。在這個時期電腦的“智能”理論上是無法超越其製作程式和輸入知識的專家,但它的長處是可以快速地、準確地處理大量資料和數據,節省大量的人力工作。
深度學習獲巨大突破
廿一世紀初至今,AI被認為進入機器學習(Machine Learning) 時代。在一九八○年代末至一九九○年代,機器學習已開始受到廣泛關注。支持向量機(SVM) 和決策樹等算法出現,為模式識別和預測性分析提供了強大工具。深度學習(Deep Learning) 隨後更取得巨大突破,例如卷積神經網絡(CNN)和循環神經網絡(RNN)等模仿人類的結構,在圖像識別、語音識別、自然語言處理等領域實現了驚人表現。
強化學習(Reinforcement Learning) 是機器學習中的一個子領域,在近10年也取得重大進展。它主要是研發如何使一個智能體(Agent)在與環境互動過程中,通過試錯來優化其行動策略,從而使智能體自動調整出最佳策略,以實現在特定任務中的最佳表現。通過強化學習,智能體只要不斷地收到信息,電腦就可以廿四小時全天候自我優化學習,因此在“智能”上超越人類就成為可能,起碼在某些特定領域方面。
阿法狗智力壓倒人類
二○一六年三月,韓國職業九段圍棋手李世石與谷歌開發的電腦圍棋軟件AlphaGo(阿法狗) 舉行比賽。圍棋是一個高度複雜的策略遊戲,規則雖然簡單,但每一步卻可能引發不同的連鎖反應,要求玩家必須具備深刻的直覺、戰略思維,並同時考慮對手的反應,因此賽前不少評論員認為電腦勝算不大。AlphaGo最後以四比一戰勝李世石,賽後韓國棋院並授予AlphaGo為榮譽九段。
二○一七年五月,中國棋王、當年世界圍棋排名第一的柯潔再出戰AlphaGo,結果以○比三完敗,代表人類所創造的機器可以在智力上壓倒人類。當時年僅19歲的柯潔,在賽後的發佈會上一度說到哽咽,認為AlphaGo的表現已經像他理解的“圍棋上帝”,再三強調對手的完美,自言輸到沒有脾氣。
事實上,AlphaGo不僅完勝柯潔,其下棋所需要“考慮”的時間只是柯潔的1/3。圍棋棋盤由19×19個交叉點組成,玩法組合的數目非常驚人,高達10"170次方,其數字幾乎超過宇宙中粒子的數量,傳統方法無法計算窮盡,電腦雖然仍無法計算出全部可能的組合,但顯然比人類具有更多的優勢。
AlphaGo的設計主要基於在蒙特卡洛樹(Monte Carlo Tree) 上進行優化。據說AlphaGo被輸入了三千萬個人類對弈的棋譜,然後通過統計,大概能知道每個棋局狀態中走哪一步勝算更高。根據得到的統計概率結果,AlphaGo再繼續不停下局,優先選擇統計出來勝算高的下法,通過試錯而進行自我糾正。隨着下的局數越來越多,統計結果越來越接近真實,棋藝自然越來越高。
AI技術實現三大要求
蒙特卡洛樹(Monte Carlo Tree) 是一種以概率統計理論為指導的傳統數值計算方法,早在一九四○年代就提出。但直至二○一二年,它才能夠為深度學習(Deep Learning) 有效運用並實現突破性發展,AI技術實現了三大要求:一、必須有大量資料可供輸入;二、計算機具備強大和高速運算能力;三、簡單好用的軟體。“深藍”和“阿法狗”只是機器學習時代一個成功的強化學習案例,如今AI的發展和突破已進入人類生活的各方面。
容永剛