黑白子演算法規律

發布時間: 2025-02-06 04:05:57

A. 王小川斷言AlphaGo將完勝李世石他會被打臉嗎

王小川知乎全文：

AlphaGo的發布，是一個偉大的里程碑，又一次讓我興奮地需要說一說。

先說我的斷言一：AlphaGo在兩個月後，將會完勝李世石。

留個關子，本文最後再說斷言二。

從中學開始，我就著迷用演算法來解決游戲的博弈問題，用搜索方法創新性完成過一些題目。這幾年深度學習出現後，就感覺有機會能夠突破圍棋，和清華的聯合實驗室做過幾次探討，都認為這個方向可行，可惜限於氣懲能力不足，沒能組織進行這方面的投入。

而此次出手的，是Google旗下的DeepMind團隊，在深度學習方面是最頂尖的，資源、能力、氣場都沒有問題，突破性的技術是基於深度學習進行估值和走棋。

看知乎里好多討論，是從之前AlphaGo完成的棋局來判斷其下棋風格，倒推這個演算法的威力，有點刻舟求劍的感覺。我們核心還是要回到對這次AlphaGo用到的技術的深刻理解。為了便於討論，我們對比以搜索剪枝為核心的深藍下國際象棋，和以搜索剪枝+深度學習為核心的AlphaGo的三個區別：

1. 圍棋相對象棋，最大的區別是棋局的評價函數極難定義。象棋可以找到各種「特徵」來計分，比如丟一個馬扣多少分，兵往前拱到離底線近了加多少分，而圍棋做不到，密密麻麻的黑白子挨著，互相之前又有關聯，變化多，規律難以總結。這也是傳統演算法相對人最弱的幾個問題之一。就像是我們人做人臉識別，看一眼就知道是張三李四，而機器演算法難以下手。這個問題恰恰是最近幾年深度學習最大的突破之處，深度學習不需要人來設計演算法「找特徵」，通過大量原始數據和標簽的對於，機器就能夠自動找特徵，並且並不比人差。在幾年前還有很多人認為機器在圖像處理方面舉步維艱，怎麼定義和抽象鼻子？耳朵？眼睛？可就在這一兩年深度學習突飛猛進，一舉超過了人類。就在2015年，人臉識別方面，機器的識別能力已經超過了人了，這可是人進化了數千萬年的核心能力之一呀。一個圍棋棋局，可以理解為一張19*19的圖片，其他的走棋規則和非常簡單(很容易翻譯成計算機規則)，正好落入了深度學習擅長的事情。搜索+深度學習，這個演算法完全可以覆蓋圍棋的規則，人下棋的思維過程和模式，只是AlphaGo的一個子集。這就決定了這個演算法沒有天花板，有機會在圍棋領域「打通關」。

2. 深藍相對AlphaGo，AlphaGo最大的優勢是「學習能力」。深藍的開局更多依靠資料庫棋譜的建立，但沒有泛化能力(不懂得舉一反三)，對於沒有見過的走棋方法就可能犯傻。而之後的核心能力是計算力，通過暴力的搜索(當然也有最優秀的剪枝，但還是暴力)，力圖走出10-20步棋來選擇最優的路徑。這個復雜度是指數級的，變成一個NP問題，受限於計算力。這個系統的演算法是寫死的，固定的參數下，就會有固定的表現。而調整參數和改變演算法，都是工程師的事情。這個系統的天花板是計算機有多強，以及工程師有多聰明。而AlphaGo更多是數據驅動的，喂給他更多的棋局數據，他就能夠優化「神經元網路」，同樣的運算資源下變得更聰明，並且具有舉一反三的能力，這一點非常接近於人(或者說本身就是模擬人的方式來設計的)。而且我們知道，機器處理數據的能力足夠地快，以及沒有情緒不會出錯，這就決定了這個系統如果把今天互聯網上能收集到的棋局都學一遍，就成為頂尖高手了。

3. 最最最可怕的還不只是前面這兩點，對於下棋博弈問題，AlphaGo還不只是從互聯網上去收集數據進行學習，更可以自己和自己下，實現「自學習」。看過電影「超驗駭客」沒有？人工智慧可以做到隨著時間的推移就能更加聰明。金庸小說中老頑童讓自己左手和右手打架「左右互搏」，成為天下無敵的武功，那個只是故事，在下棋這個領域，而AlphaGo有這樣的設計，讓這種武功成真了！往下還有兩個月的時間，AlphaGo這樣一台演算法上沒有天花板的機器，很有機會在「左右互搏」下登峰造極，成為不可超越的圍棋高手。

AlphaGo的技術問題講完了。怎麼來看Google背後的完整動作呢？有人覺得是過度解讀了，實際系統挺糙的 -- 選的都是「歐洲冠軍」 -- 說明系統並不行，這是一種錯誤的理解。更有可能的原因是Google和Facebook在競爭下圍棋，Facebook的員工缺心眼提前放了好多消息出來泄密了，結果Google就趕緊把Nature的文章發了搶了個先，然後賣個期貨兩個月後和人類對決，那會兒系統就足夠好了，這是在競爭環境下合適的做法。

事實上Google和Facebook兩家都認識到了AI的重要性，以及就在最近幾年會有大的突破。Google 4億美金收購了DeepMind，當時只有20人，現在已經突破200人了，並且是不計代價的瘋狂投入。下圍棋只是體現人工智慧進步絕佳的宣傳點和切入點，從公開的文獻可以看到，DeepMind做圍棋研發是基於通用的技術進行，領域無關的(Domain independent)。這樣的技術未來可以用到合適的其他領域里去。深度學習的魅力在於，只要一個領域里能夠建模，能夠有充足的數據，就能夠在這個領域里做到超越人、取代人，短時間能從0分做到99分。如果我們依然是老觀念，用漸進的方式來理解機器智能，比如之前某位大佬宣傳他家的XX大腦做到了X歲的智力，這是很誤(che)導(dan)的。我們同樣也會錯誤地估計下圍棋方面機器的能力，按照人類的理解1D-9D來評價它。一句話，不要用評價人的方法來評價機器的人工智慧的能力，完全是不同的模式。

老羅曾經評價過人工智慧的一句話：「人工智慧就像一列火車，它臨近時你聽到了轟隆隆的聲音，你在不斷期待著它的到來。他終於到了，一閃而過，隨後便遠遠地把你拋在身後」。

如果給這句話打上一個補丁，把人工智慧的應用局限到一個一個的具體的封閉領域，這是一個很貼切的描述。我們不要過度自大，例如我們容易在自我優越感的驅使下，說動物不如人，比如人會直立行走、會說話、會實用工具，以區別於其他動物。事實證明，動物也會。面對機器也一樣，就在幾個月前還有人叫囂機器十年內不能夠玩轉圍棋，理由也都是人一眼就能看明白，機器只會計算。這些自大會讓我們誤判。也不用過於自卑，覺得圍棋上機器上勝利了人類整個智力就被碾壓了，到今天機器還是有很多領域完全無能，只能在局部領域。

到結尾，再說斷言二：除了圍棋，人工智慧在其他博弈類的封閉游戲里，也會橫掃一切，完勝人類。

雖然王小川的論點過於武斷，不過AlphaGo贏的可能性其實也並不低，它的真實圍棋水平可能遠遠不止現在所呈現的。首先，AlphaGo與樊麾的對弈其實發生在去年10月，只不過最近才被曝光，在這之後的幾個月中，AlphaGo有多大的提高，我們不得而知。其次，此事被報道後，在高手雲集的弈城圍棋網上，出現了疑似AlphaGo的身影，而且從它的對戰數量和戰績上看，它已經和人類進行了大量的交手。甚至，最好的成績達到過9D(段)。由此可見，AlphaGo一直在掩蓋其鋒芒，就像王小川所言，谷歌選擇在這個時候讓AlphaGo挑戰李世石，一定是建立在足夠的自信上的。

當然，AlphaGo是否能在下個月底的比賽中贏得勝利，現在來說都為時過早。不過，這絕對不會是一場壓倒性的比賽，而是高手與高手之間的巔峰對決。
比賽結束，alphago四比一完勝李世石，從結果來看，他是對的。

閱讀全文

熱點內容

勞動法生病不讓請假發布：2025-04-16 17:02:18 瀏覽：702

經濟合作社議事規章制度發布：2025-04-16 16:39:07 瀏覽：563

番禺冼律師發布：2025-04-16 16:29:30 瀏覽：638

葯學職業道德培訓發布：2025-04-16 16:24:37 瀏覽：369

生物反饋室規章制度發布：2025-04-16 16:23:27 瀏覽：749

杭州華碩司法鑒定發布：2025-04-16 16:13:32 瀏覽：919

治安聯防隊規章制度發布：2025-04-16 16:13:20 瀏覽：505

合同法第十五條第二款發布：2025-04-16 16:11:57 瀏覽：406

法院一區五城發布：2025-04-16 16:11:49 瀏覽：705

慈善法和社會區別發布：2025-04-16 15:59:02 瀏覽：454

黑白子演算法規律

與黑白子演算法規律相關的資訊