對33歲的韓國棋手李世乭而言,,過去二十多年的圍棋職業(yè)生涯中積累的人氣和關(guān)注度,恐怕都沒有3月9日到15日一周的時間高——如果將視線擴展至全球范圍,這一周內(nèi),全世界有過億的人關(guān)注了這場人機大戰(zhàn)——一方是過去10年人類圍棋的最強者李世乭,,一方是谷歌開發(fā)的圍棋AI(人工智能)翹楚AlphaGo。
這場五局制的比賽最終以李世乭1比4落敗而告終,,事實上,,前三盤AlphaGo即直落三局宣告了比賽勝利,只是根據(jù)雙方事前商議,,必須下完五局,。
真正的明星是AlphaGo。它的表現(xiàn)讓職業(yè)圍棋選手大跌眼鏡,,賽前圍棋圈內(nèi)普遍對李世乭獲勝抱有信心,,其中多數(shù)人都堅信李將以5比0的比分零封AlphaGo。
“AlphaGo是個實用主義者”
圍棋起源于中國,,是一項充滿魅力的智力游戲,,規(guī)則簡單,棋子之間沒有等級關(guān)系,,平和之下的戰(zhàn)爭,靜默之下的殺機,,精確與模糊,,虛無縹緲與錙銖必較,普遍認為,,這是一項充滿著東方智慧的游戲,,非常倚重直覺與模糊思維?!爸袊私?jīng)常講條條大路通羅馬,,西方人考慮哪條最近,你別跟我講條條通羅馬,?!痹谠袊逶涸洪L王汝南看來,圍棋有很多模糊的東西,,很多是憑一種直覺,,確實是東方文化的產(chǎn)物,,“西方人干什么都有個定性定量的思想,一定要找到最好的一手,?!?/p>
1997年,IBM的人工智能深藍就曾打敗國際象棋世界冠軍卡斯帕羅夫,,在大多數(shù)用來考察人類智慧的游戲中,,如國際象棋、拼字游戲,、奧賽羅棋等,,機器都能毫不費力地擊敗人類。唯獨圍棋,,能讓人類保持最后一點驕傲,。
這是因為圍棋比國際象棋要復(fù)雜得多,即使是最強大的超級計算機,,也缺乏在合理的時間內(nèi)分析出每種走法可能的結(jié)果的能力,。國內(nèi)電腦圍棋頂級高手“本手”的設(shè)計者、北京郵電大學(xué)的劉知青教授曾說,,“相比而言,,象棋的復(fù)雜度是1048,而圍棋的19路盤比象棋復(fù)雜10122倍,。這是個什么概念呢,?圍棋相對于象棋比整個太陽系相對于單個原子核更復(fù)雜!”
更重要的是,,圍棋在對弈過程中,,有厚薄、味道,、形狀等各種概念,,換句話說,高手常常要依靠直覺來判斷這些很難量化的東西,。而直覺這類模糊判斷一直是人工智能發(fā)展的難點,。
正是由于這個原因,近二三十年,,人工智能在多個智力游戲領(lǐng)域一項一項地將人類選手拉下馬,,卻始終無法在圍棋項目上攻克人類。1990年代,,曾有日本棋手宣稱計算機要在圍棋上戰(zhàn)勝人類,,至少要用一百年。事實上,,多年來,,哪怕面對業(yè)余高手,,圍棋人工智能都難求一勝。
但谷歌下屬的DeepMind公司開發(fā)的這款圍棋人工智能AlphaGo,,進展之大出人意料,,其思考更接近人類, 真正實現(xiàn)了從“計算”到“智能”的超越,。
嚴格地說,,顛覆性的測試結(jié)果至去年10月才出現(xiàn),生于中國的歐洲圍棋冠軍樊麾職業(yè)二段,,在5局較量中被AlphaGo零封,,只不過,當時還是這款圍棋人工智能的內(nèi)部測試,。
各國職業(yè)選手都高度關(guān)注這場人機大戰(zhàn),,中國的常昊九段也不例外?!癆lphaGo的平衡感非常好,,曾經(jīng)以為不易量化的判斷是其弱點,但實際上并非如此,,它的大局觀非常好,。”
棋圣聶衛(wèi)平九段賽前曾預(yù)測李世乭5比0勝,,但第一局的結(jié)果就讓他非常震驚,。幾局下來,他對AlphaGo的評價是,,“布局有職業(yè)六七段水平,,而中盤有十三段的水平?!?/p>
棋評,、文字與棋力俱佳的李喆六段稱,“對于我而言,,這一場人機之戰(zhàn)給我最大的震撼來自于棋譜。AlphaGo下出了許多完全在人類棋手經(jīng)驗之外的著法,,這些著法在目前尚不能得到人類棋手統(tǒng)一的理解,。”
“但是,,我隱隱讀到了這些著法背后壯美的天地,,這壯美天地當然不是AlphaGo所創(chuàng)造,而是有四千多年歷史的圍棋本身所自有的豐富與遼闊,。AlphaGo并不是解開了圍棋之謎,,它離窮盡圍棋還有非常遠的距離,,它只是向我們展開了這樣一個新世界。我們需要用多久才能理解,?或許一年,、五年、十年……但我相信,,人類一定能夠用理性的方式去不斷地理解這些數(shù)據(jù)給出的信息,,AlphaGo的出現(xiàn)恰恰證明了人類理性的重要價值?!?/p>
“AlphaGo是個實用主義者,,”柯潔九段說。這位19歲的中國棋手目前排名世界第一,,在與李世乭的10次正式比賽中8勝2負,。李喆進一步說明,AlphaGo追求的不是最優(yōu)的下法,,而是追求在它看來勝率最高的下法,。AlphaGo的算法運用了神經(jīng)網(wǎng)絡(luò)加蒙特卡洛算法,蒙特卡洛算法給出搜索之后的勝率評估,,然后智能會根據(jù)這個勝率來選擇落子點,。這就是它在對局中有一些在職業(yè)棋手甚至業(yè)余棋手看來明顯失誤的著法的原因。在它看來,,或許這根本不是失誤,。
留住尊嚴
AlphaGo前三局零封李世乭后,頂尖高手們對其棋力的判斷已經(jīng)普遍達成一致:超越了所有的人類,。大家都絕望地認為,,一盤比一盤強的AlphaGo將不會再給李世乭機會?!按蠹抑皇歉星樯舷M@位勇敢的勝負師贏下一盤,,留住一點自己的尊嚴?!敝鯂暹_人高飛龍說,。
李世乭沒有讓人們失望。沒有勝負包袱的他為榮譽而戰(zhàn),,終于迎來了“人機大戰(zhàn)”的首次勝利,。與前幾局相比,李世乭此局更多次陷入了長時間思考,,導(dǎo)致耗時過多,。在比賽進行到兩個半小時后,他僅剩下17分鐘,比AlphaGo剩余時間足足少了一個小時,。但隨后,,他祭出白78“挖”妙手,一場“逆襲”之戰(zhàn)也由此開始,。AlphaGo被李世乭的“神之一手”下得陷入混亂,,走出了黑93一步常理上的廢棋,導(dǎo)致棋盤右側(cè)一大片黑子“全死”,。此后,,AlphaGo判斷局面對自己不利,每步耗時明顯增長,,更首次被李世乭拖入讀秒,。最終,李世乭冷靜收官鎖定勝局,。
最后一局,,李世乭雖然也告敗,但在行棋內(nèi)容上并非完敗,,而是讓AlphaGo也暴露出諸多問題手,。這兩局,可謂打破AI神話的兩局,,AlphaGo有弱點,,并非無懈可擊。
綜觀這五局棋,,常昊九段認為李世乭并沒有發(fā)揮出自己的優(yōu)勢,,而且這位33歲的韓國棋手也過了自己的黃金時期。這次全球矚目的人機大戰(zhàn),,給了他巨大壓力,。但無論如何,李世乭都讓人尊重,,這次對局對職業(yè)棋手乃至人類認識AI圍棋具有重要意義,。放在幾百年的時間段來看,這次人機對弈都是具有里程碑意義的重大事件,。
“李世乭面對AlphaGo,,并未因5個月之前的棋譜而有絲毫輕視,他做了非常充分的準備,。他拋開人類的偏見和自負,,試圖理解AlphaGo運算的機理,并找出其中可能存在的弱點,。”李喆說,,在比賽伊始,,他就對AlphaGo可能存在的弱點進行了直指要害的攻擊,,并且在失敗后迅速調(diào)整,繼而展開了第二次,、第三次針對性攻擊,。正是他的策略針對性,使人們更好地理解了AlphaGo的強度和特點,,以及不同于人類的決策模式,。他在第二局中就已經(jīng)找到了足以在中盤接近甚至抗衡AlphaGo的布局策略,使人類第一次見識到AlphaGo夢幻般的后半盤,?!?/p>
在俞斌九段看來,如果AlphaGo改進成一個可以裝在筆記本電腦中的軟件的話,,對圍棋的學(xué)習(xí),、培訓(xùn)、職業(yè)化的路徑都會有巨大影響,,因為提高圍棋水平的最重要手段就是同高手多下棋,。
今后,圍棋AI說不定可以加入人類職業(yè)比賽的體系中來,,或者自已建立一個比賽體系,,這些都很有想象空間。
常昊一方面表達了某種擔(dān)憂——即人類頂尖高手負于計算機后人們對這項智力運動的“祛魅”,。另一方面,,他又說,圍棋不僅是勝負的游戲,,圍棋也是一種文化,、一種修為。這五盤棋對圍棋的推廣普及非常有幫助,,特別是在歐美地區(qū)的傳播,,人們在領(lǐng)教科技魅力的同時,也領(lǐng)會了圍棋的魅力,。