漫畫畫廊谷歌阿爾法圍棋AlphaGo背景資料照片 兩個大腦介紹(圖)

  • 时间:
  • 浏览:20
  • 来源:校园春色蔡老师_欧美色图天天谢_日本毛片免费韩国

  昨天,李世石【李世石資料】比賽輸瞭,人工智能逆襲瞭?人類真的敗給人工智能瞭嗎?

  接下來,就讓我們瞭解一下,這個逆天的谷歌人工智能AlphaGo【背後團隊Deepmind有多牛】到底是為何物?

  1936年,艾倫·圖靈提出瞭一種可以輔助數學研究的機器(後來被稱為“圖靈機”),80年過去瞭,人類在人工智能領域已經取得突飛猛進的發展。上世紀90年代,IBM超級計算機“深藍”擊敗國際象棋世界冠軍三級免費在線,引發瞭“電腦是否超越人腦”的熱議。然而,圍棋因其變化莫測的招式成為瞭AI(ArtificialIntelligence,人工智能)難以攻克的“禁地”。當然,這個世界總有“不信邪”的人。DeepMind開發的AI程序AlphaGo,擊敗瞭歐洲圍棋冠軍樊麾。

AlphaGo是什麼來歷?

  起初,DeepMind是英國的一傢小型人工智能公司,專精於深度學習和分析建百度地圖模領域,在2014年被谷歌收購。這傢公司的創始人名叫德米斯·哈薩比斯(Demis Hassabis),他擁有劍橋大學和倫敦大學學院的計算機科學和認知神經科學學位,還是一位國際象棋大師。從外表上來看,“學生氣”的哈薩比斯很普通,但是其對AI的見解和願景改變瞭很多的看法,其中就包括著名物理學傢史蒂芬·霍金。一直以來,霍金總是傾向於“AI威脅論”,認為智能機器終有一天會威脅人類的安全。不過在與哈薩比斯長談瞭4個小時之後,霍金似乎轉變瞭態度。

  介紹完DeepMind的負責人,我們把目光轉回到AlphaGo。事實上,AlphaGo成名已久,曾經先後與Crazy Stone和Zen(兩款知名圍棋程序)進行瞭500局對弈,僅武磊面臨暫時失業新聞有一局失利。此外,其也優於Facebook的圍棋程序Dark Forest,後者得到瞭馬克·紮克伯格的支持。AlphaGo具備策略網絡(Policy Network)和估值網絡(Value Network)能力,前者分析局面、預測對手招式,後者負責判斷勝率,可以在2微秒內走出一步棋,而Dark Forest僅具備第一種能力,並且走棋所花費的時間也要更慢。

  當然,真正讓AlphaGo成名的還是戰勝歐洲圍棋冠軍樊麾,這在當時引起瞭軒然大波,甚至推升瞭谷歌的股價,畢竟這是電腦對人腦的一次勝利。更重要的是,站在計算機的角度來看,與象棋相比,圍棋的難度要大很多,每個步數的潛在組合非常復雜,曾有專傢說AI十年內都無法掌握圍棋。

  阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位於英國倫敦的谷歌(Google)起亞k旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團隊怪王別傳開發,這個程序利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業二段選手樊麾;2016年3月對戰世界圍棋冠軍、職業九段選手李世石,李世石輸瞭。

  阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。這個程序利用“價值網絡”去計算局面,用“策略網絡”去選擇下子。

深度學習

  阿爾法圍棋(AlphaGo)的主要工作原理是“深度學習”。“深鄭業成度學習”是指多層的人工神經網絡和訓練它的方法。一層神經網絡會把大量矩陣數字作為輸入,通過非線性激活方法取權重,再產生另一個數據集合作為輸出。這就像生物神經大腦的工作機理一樣,通過合適的矩陣數量,多層組織鏈接一起,形成神經網絡“大腦”進行精準復雜的處理,就像人們識別物體標註圖片一樣。

兩個大腦

  阿爾法圍棋(AlphaGo)是通過兩個不同神經網絡“大腦”合作來改進下棋。這些大腦是多層神經網絡跟那些Google圖片搜索引擎識別圖片在結構上是相似的。它們從多層啟發式二維過濾器開始,去處理圍棋棋盤的定位,就像圖片分類器網絡處愛情的開關理圖片一樣。經過過濾,13個完全連接的神經網絡層產生對它們看到的局面判斷。這些層能夠做分類和邏輯推理。

  這些網絡通過反復訓練來檢查結果,再去校對調整參數,去讓下次執行更好。這個處理器有大量的隨機性元素,所以人們是不可能精確知道網絡是如何“思考”的,但更多的訓練後能讓它進化到更好。

第一大腦:落子選擇器 (Move Picker)

  阿爾法圍棋(AlphaGo)的第一個神經網絡大腦是“監督學習的策略網絡(Policy Network)” ,觀察棋盤佈局企圖找到最佳的下一步。事實上,它預測每一個合法下一步的最佳概率,那麼最前面猜測的就是那個概率最高的。這可以理解成“落子選擇器”。

第二大腦:棋局評估器 (Position Evaluator)

  阿爾法圍棋黃色應用下載(AlphaGo)的第二個大腦相對於落子選擇器是回答另一個問題。不是去猜測具體下一步,它預測每一個棋手贏棋的可能,在給定棋子位置情況下。這“局面評估器”就是“價值網絡(Value Network)”,通過整體局面判斷來輔助落子選擇器。這個判斷僅僅是大概的,但對於閱讀速度提高很有幫助。通過分類潛在的未來局面的“好”與“壞”,AlphaGo能夠決定是否通過特殊變種去深入閱讀。如果局面評估器說這個特殊變種不行,那麼AI就跳過閱讀在這一條線上的任何更多落子。

延伸閱讀:

  • AlphaGo創始人:希望下個阿爾法圍棋對手是中國柯潔
  • 柯潔資料照片(柯潔為什麼叫特務+現在的水平有多高)