雨楓軒原創文學網 - 純凈的綠色文學家園 !

雨楓軒

AlphaGo是怎么學會下圍棋的

時間:2020-06-25來源:網友提供 作者:安德魯·麥卡菲 點擊:
AlphaGo是怎么學會下圍棋的

 
  由Google的子公司Deep Mind創建的人工智能系統AlphaGo,不久前在一場圍棋比賽中以4:1的成績戰勝了人類冠軍李世石。此事有何重大意義?畢竟,在1997年,IBM“深藍”擊敗加里·卡斯帕羅夫后,電腦已經在國際象棋上超越了人類。人們為什么要對AlphaGo的勝利大驚小怪呢?
 
  和國際象棋一樣,圍棋也是一種高度復雜的策略性游戲,不可能靠巧合和運氣取勝。兩名棋手輪番將黑色或白色的棋子落在縱橫19道線的網格棋盤上,一旦棋子的四面被另一色棋子包圍,就要被從棋盤上提走,最終在棋盤上留下棋子多的那一方獲勝。
 
  然而和國際象棋不一樣的是,沒有人能解釋頂尖水平的圍棋棋手是怎么下棋的。我們發現,頂級棋手本人也無法解釋他們為什么下得那么好。人類的許多能力中存在這樣的不自知,從在車流中駕駛汽車,到辨識一張面孔。對于這一怪象,哲學家、科學家邁克爾·波蘭尼有精彩的概括,他說:“我們知道的,比我們可言說的多。”這種現象后來就被稱為“波蘭尼悖論”。
 
  波蘭尼悖論并沒有阻止我們用電腦完成一些復雜的工作,比如處理工資單、優化航班安排、轉送電話信號和計算稅單。然而,任何一個寫過傳統電腦程序的人都會告訴你,要想將這些事務自動化,必須極度縝密地向電腦解釋人類要它做什么。
 
  這樣的電腦編程方式是有很大局限的,在很多領域無法應用,比如我們知道但不可言說的圍棋,或者對照片中尋常物品的識別、人類語言間的轉譯和疾病的診斷等——多年來,基于規則的編程方法在這些事務上幾無建樹。
 
  圍棋的可能走法比宇宙間的原子總數還多,即使最快的電腦也只能模擬微不足道的一小部分。更糟的是,我們甚至說不清該從哪一步入手進行探索。
 
  這次有什么不同?AlphaGo的勝利清晰地呈現了一種新方法的威力,這種方法并不是將聰明的策略編入電腦中,而是建造了一個能學習制勝策略的系統,這種系統在幾乎完全自主的情況下,通過觀看勝負實例來學習。
 
  由于這種系統并不依賴人類對這項工作的已有知識,故而即使我們知道的比可言說的更多,也不會對它構成限制.
頂一下
(0)
0%
踩一下
(0)
0%
------分隔線----------------------------
欄目列表
加拿大28工人计划