霍金一直傾向于人工智能威脅論,認為智能機器有一天會威脅人類安全。 但在與哈薩比斯進行了四個小時的交談后,霍金似乎改變了態(tài)度。 介紹完負責(zé)人后,我們又把注意力轉(zhuǎn)了回來。 事實上,他已經(jīng)出名很久了。 他曾經(jīng)用Zen和Zen(兩個著名的圍棋程序)對弈了500場,只輸了一場。 它還優(yōu)于由馬克·扎克伯格支持的流行圍棋程序 Dark。 它具有策略網(wǎng)絡(luò)( )和估值網(wǎng)絡(luò)( )的能力。 前者分析局勢,預(yù)測對手的走法,后者則負責(zé)判斷勝率,可以在2微秒內(nèi)出棋。 黑暗只有第一個能力和所有招式。 花費的時間也比較慢。 當(dāng)然,真正讓他成名的是他戰(zhàn)勝了歐洲圍棋冠軍樊麾,這在當(dāng)時引起了軒然大波,甚至還推高了谷歌的股價。 畢竟,這是計算機對人腦的勝利。 更重要的是,從計算機的角度來看,圍棋比國際象棋困難得多谷歌人工智能李世石,每一步棋的潛在組合都非常復(fù)雜。 有專家曾表示,十年之內(nèi)人工智能不可能掌握圍棋。 Go () 是一個圍棋人工智能程序,由英國倫敦 () 的 、 和 及其團隊開發(fā)。 該程序使用價值網(wǎng)絡(luò)來計算情況谷歌人工智能李世石,使用策略網(wǎng)絡(luò)來選擇下一步行動。
2015年10月,阿爾法圍棋5:0擊敗歐洲圍棋冠軍、職業(yè)二段棋手樊麾; 2016年3月,對陣世界圍棋冠軍、職業(yè)九段棋手李世石,李世石落敗。 ()是一個圍棋人工智能程序。 該程序使用價值網(wǎng)絡(luò)來計算形勢,并使用策略網(wǎng)絡(luò)來選擇動作。 Deep Go()的主要工作原理是深度學(xué)習(xí)。 深度學(xué)習(xí)是指多層人工神經(jīng)網(wǎng)絡(luò)及其訓(xùn)練方法。 一層神經(jīng)網(wǎng)絡(luò)以大量矩陣數(shù)作為輸入,通過非線性激活方法選擇權(quán)重,然后產(chǎn)生另一個數(shù)據(jù)集作為輸出。 這就像生物神經(jīng)腦的工作機制一樣。 通過適當(dāng)數(shù)量的矩陣,將多層組織連接在一起,形成神經(jīng)網(wǎng)絡(luò)大腦,進行精確而復(fù)雜的處理,就像人們識別物體和注釋圖片一樣。 兩個大腦 Go(圍棋)通過具有不同神經(jīng)網(wǎng)絡(luò)的兩個大腦之間的協(xié)同工作來提高國際象棋水平。 這些大腦是多層神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)類似于圖像搜索引擎用于識別圖像的神經(jīng)網(wǎng)絡(luò)。 他們從多層啟發(fā)式 2D 過濾器開始處理圍棋棋盤的定位,就像圖片分類器網(wǎng)絡(luò)處理圖像一樣。 經(jīng)過過濾后,13 個完全連接的神經(jīng)網(wǎng)絡(luò)層會對它們看到的位置做出判斷。 這些層能夠進行分類和邏輯推理。 這些網(wǎng)絡(luò)通過反復(fù)訓(xùn)練來檢查結(jié)果,然后校對和調(diào)整參數(shù),使下一次執(zhí)行得更好。
這個處理器具有很大的隨機性,因此不可能準確地知道網(wǎng)絡(luò)是如何思考的,但更多的訓(xùn)練將讓它進化得更好。 第一個大腦:走棋選擇器(Move) Go的第一個神經(jīng)網(wǎng)絡(luò)大腦()是監(jiān)督學(xué)習(xí)策略網(wǎng)絡(luò)(),它觀察棋盤布局并試圖找到最佳的下一步棋。 事實上,它預(yù)測每個合法下一步的最佳概率,因此第一個猜測是概率最高的。 這可以理解為移動選擇器。 第二大腦:()的第二大腦是回答與著法選擇器相關(guān)的另一個問題。 它不是猜測具體的下一步行動,而是在給定棋子的位置的情況下預(yù)測每個玩家獲勝的概率。 這個態(tài)勢評估器就是價值網(wǎng)絡(luò)( ),它通過全局判斷來輔助走法選擇器。 這個判斷只是大概的,但是對于提高閱讀速度很有幫助。 通過將未來潛在的情況分類為好或壞,您可以決定是否更深入地閱讀特定的變體。 如果位置評估器說這個特定的變體是不可能的,那么人工智能就會跳過讀取沿著這條線的任何進一步的移動。
186信息網(wǎng)原創(chuàng)文章,轉(zhuǎn)載請注明本文來自:www.2wfjd54.cn