谷歌AlphaGo,靠什么擊敗人類棋手
發(fā)布時間:2025-10-02 | 來源:互聯(lián)網(wǎng)轉(zhuǎn)載和整理
靠深度學(xué)習(xí),
這是目前人工智能領(lǐng)域中最熱門的科目,它能完成筆跡識別、面部識別、駕駛自動汽車、自然語言處理、識別聲音、分析生物信息數(shù)據(jù)等非常復(fù)雜的任務(wù)。
AlphaGo的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò):“策略網(wǎng)絡(luò)”和“值網(wǎng)絡(luò)”。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍里,本質(zhì)上和人類棋手所做的一樣。
其中,“值網(wǎng)絡(luò)”負責減少搜索的深度——人工智能會一邊推算一邊判斷局面,局面明顯劣勢的時候,就直接拋棄某些路線,不用一條道算到黑;而“策略網(wǎng)絡(luò)”負責減少搜索的寬度——面對眼前的一盤棋,有些棋步是明顯不該走的,比如不該隨便送子給別人吃。將這些信息放入一個概率函數(shù),人工智能就不用給每一步以同樣的重視程度,而可以重點分析那些有戲的棋著。
AlphaGo利用這兩個工具來分析局面,判斷每種下子策略的優(yōu)劣,就像人類棋手會判斷當前局面以及推斷未來的局面一樣。這樣AlphaGo在分析了比如未來20步的情況下,就能判斷在哪里下子贏的概率會高。
下一篇:新gre考試分數(shù)多少