【IT時(shí)代網(wǎng)編者按】這段時(shí)間以來(lái),大家都在關(guān)注李世石和谷歌人工智能的圍棋比賽,人們紛紛猜測(cè)究竟誰(shuí)會(huì)成為贏家。撥開(kāi)紛紛擾擾的論斷,我們冷靜地思考,其實(shí)這場(chǎng)決賽,無(wú)論誰(shuí)嬴誰(shuí)輸,我們都不必過(guò)于驚喜或者失望,即便李世石贏了,他也抵擋不住科技的進(jìn)步,今天也許會(huì)贏,人工智能的勝利注定在我們開(kāi)不到的未來(lái)。

決戰(zhàn)之日即將到來(lái)。
下周,韓國(guó)九段頂尖中國(guó)圍棋高手李世石(LeeSe-dol)將與谷歌人工智能項(xiàng)目AlphaGo在首爾四季酒店展開(kāi)對(duì)決,整個(gè)比賽分五輪進(jìn)行(這是你要了解的第一件事)。
賽程:3月9日、3月10日、3月12日、3月13日、3月15日。
規(guī)則:貼目7.5目(向后下棋的選手貼目7.5目)。每位棋手各有兩個(gè)小時(shí)的布局時(shí)間,3次60秒的讀秒。
獎(jiǎng)金:100萬(wàn)美元;谷歌已經(jīng)表示,如果AlphaGo獲勝,獎(jiǎng)金將捐贈(zèng)給聯(lián)合國(guó)兒童基金會(huì)(UNICEF)、STEM教育及圍棋慈善機(jī)構(gòu)(GoCharity)。
P.S.貼目是圍棋術(shù)語(yǔ)。指黑方由于先手,在布局上占有一定的優(yōu)勢(shì),為了公平起見(jiàn),在最后計(jì)算雙方所占地的多少時(shí),黑棋必須扣減一定的目數(shù)或子數(shù)。中國(guó)采用的是7.5目的大貼目規(guī)則,日本、韓國(guó)則為6.5目。
▎雙方都撂狠話:我們必勝!
第二件事是,到目前為止,雙方都深信自己將贏得勝利。
2月22日,李世石在首爾韓國(guó)棋院接受賽前采訪時(shí)說(shuō):“老實(shí)講,PanHui和AlphaGo的比賽水準(zhǔn)沒(méi)有達(dá)到我與AlphaGo比賽的水平。我聽(tīng)說(shuō)AlphaGo一直在升級(jí),就在我們談話時(shí)它還在繼續(xù)進(jìn)步,所以說(shuō),相比于10月的比賽,我所面臨的挑戰(zhàn)會(huì)更大。盡管如此,我占據(jù)優(yōu)勢(shì)的事實(shí)是不會(huì)改變的。對(duì)我而言勝利是一定的,現(xiàn)在只剩下贏得完美不完美的問(wèn)題了?!?/p>

谷歌DeepMind卻表示,人工智能程序有自動(dòng)學(xué)習(xí)的能力。
DeepMind工程總裁DemisHassabis在2月初曾表示:“實(shí)際上整個(gè)比賽就是我們的DeepBlue時(shí)刻。”Hassabis還說(shuō),大多的圍棋玩家都認(rèn)為李世石將戰(zhàn)勝AlphaGo,Hassabis補(bǔ)充道:“他們認(rèn)為我們獲勝的機(jī)率只有5%……但我們的系統(tǒng)進(jìn)步很快,這點(diǎn)是他們沒(méi)有意識(shí)到的。就在我們談話時(shí),它正在進(jìn)步。”

對(duì)于Hassabis而言,AlphaGo項(xiàng)目的意義并不僅僅只是打敗世界級(jí)的圍棋選手。開(kāi)發(fā)AlphaGo程序的方法可以應(yīng)用在其它人工智能項(xiàng)目中,包括無(wú)人駕駛汽車(chē)、類(lèi)人虛擬助手?!拔覀冋J(rèn)為人工智能正在為這些問(wèn)題提前解決一個(gè)元問(wèn)題?!盚assabis說(shuō)。
▎AlphaGo怎么運(yùn)行的?
這是第三件事。
許多人很好奇,到底是什么讓AlphaGo變得如此成功?難道其它人工智能就失敗了嗎?
“傳統(tǒng)搜索樹(shù)會(huì)考慮所有可能性,但它用在圍棋上行不通?!盚assabis說(shuō)。正因如此,谷歌DeepMind團(tuán)隊(duì)才用兩套神經(jīng)網(wǎng)絡(luò)為AlphaGo開(kāi)發(fā)了一個(gè)全新的系統(tǒng)。我們可以將圍棋視為一個(gè)包涵所有可能性的樹(shù),它能夠無(wú)限延伸。AlphaGo要做的就是利用兩套神經(jīng)網(wǎng)絡(luò)來(lái)縮小可能性。它會(huì)利用策略網(wǎng)絡(luò)來(lái)判斷什么行為可能性最高,系統(tǒng)應(yīng)該考慮怎么走好下一步。AlphaGo會(huì)將搜索樹(shù)的寬度變窄。還有一個(gè)就是價(jià)值網(wǎng)絡(luò),它告訴AlphaGo怎么移動(dòng)對(duì)白子和黑子都更好,這樣就可以降低可能性的深度。
在行動(dòng)之前,DeepBlue超級(jí)電腦要考慮大約200萬(wàn)步,AlphaGo卻只需要考慮10萬(wàn)步。機(jī)器比人類(lèi)專(zhuān)業(yè)選手考慮得遠(yuǎn),人類(lèi)只能向前看1000步。DeepMind分別對(duì)兩套神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
策略網(wǎng)絡(luò)可以模仿職業(yè)圍棋選手下棋,然后讓電腦下棋1300萬(wàn)次來(lái)改進(jìn)系統(tǒng)。最終。DeepMind會(huì)從每一個(gè)集合中挑選黑子或者白子的一邊,從而組建一個(gè)新的數(shù)據(jù)集。接下來(lái)價(jià)值網(wǎng)絡(luò)上場(chǎng),DeepMind會(huì)利用好數(shù)據(jù)集,讓它來(lái)決定棋局中每一個(gè)位置上誰(shuí)會(huì)獲勝。由此開(kāi)始,DeepMind團(tuán)隊(duì)會(huì)將兩個(gè)網(wǎng)絡(luò)結(jié)合,用MonteCarlo樹(shù)搜索來(lái)搭建最終的AlphaGo?!癆lphaGo就是一個(gè)系統(tǒng),它可以自己學(xué)習(xí),然后將學(xué)到的東西寫(xiě)成算法。事實(shí)上,它跟人類(lèi)學(xué)習(xí)和下圍棋很接近?!盚assabis解釋說(shuō)。

有些高深莫測(cè)?其實(shí),你可以認(rèn)為AlphaGo就是一個(gè)實(shí)驗(yàn),它不是編程程序,事實(shí)上連AlphaGo和它的自己創(chuàng)造者都無(wú)法解釋其是如何下棋的,但它卻是擁有了這種能力——或許這是一種直覺(jué),通過(guò)不自覺(jué)的推理得到知識(shí)——到現(xiàn)在為止,我們普遍認(rèn)為這是屬于人類(lèi)的特權(quán),就如牛頓在其《自然哲學(xué)的數(shù)學(xué)原理》第二版中序言中所寫(xiě)到,“我不做假設(shè),我只是知道?!?/p>
P.P.S.關(guān)于AlphaGo的演示視頻我們沒(méi)找到,但我們找到了一個(gè)Facebook類(lèi)似項(xiàng)目的。盡管沒(méi)有谷歌的NB,但憑借11萬(wàn)次的運(yùn)算,其在著名的覆蓋全球的網(wǎng)絡(luò)圍棋社區(qū)KGS的年度比賽中拿到了第三名。
▎是博弈也是試驗(yàn)
我們需要思考的更多一些,這是第四件事情。
人工智能是否能夠戰(zhàn)勝人類(lèi)大腦?這個(gè)問(wèn)題已經(jīng)爭(zhēng)論很久了,不論圍棋大戰(zhàn)誰(shuí)勝誰(shuí)負(fù),它都將為問(wèn)題的答案奠定基礎(chǔ)。
如果李世石獲勝,某些人可以輕松地長(zhǎng)舒一口氣了,因?yàn)樗麄冎霸鴵?dān)心人工智能會(huì)入侵到人類(lèi)占據(jù)統(tǒng)治地位的一些領(lǐng)域中去。如果AlphaGo獲勝會(huì)怎么樣呢?它可能會(huì)向我們描繪出一個(gè)反烏托邦的未來(lái),在那里人類(lèi)可憐無(wú)助,像牽線木偶一樣被機(jī)器人大腦控制著,正如科幻電影《機(jī)械公敵》描述的一樣。
開(kāi)發(fā)AlphaGo的是谷歌DeepMind,它原本是一家英國(guó)公司,2014年時(shí)被谷歌收購(gòu)。DeepMind認(rèn)為電腦會(huì)進(jìn)入到一些需要進(jìn)行創(chuàng)造性思考的領(lǐng)域,這預(yù)示著未來(lái)人類(lèi)和人工智能的關(guān)系會(huì)變得更緊張。
許多專(zhuān)家認(rèn)為要想知道人工智能是否真的具有創(chuàng)造性思維,圍棋是最好的測(cè)試工具,因?yàn)樗蕾?lài)直覺(jué)、非常復(fù)雜。在其它領(lǐng)域人工智能已經(jīng)超過(guò)了人類(lèi),包括國(guó)際象棋——1997年,IBM的超級(jí)計(jì)算機(jī)“深藍(lán)”便打敗了當(dāng)時(shí)國(guó)際象棋的世界冠軍卡斯帕羅夫。但在圍棋中,棋子可能的位置數(shù)比宇宙中的原子數(shù)還要多,并且遠(yuǎn)遠(yuǎn)超過(guò)國(guó)際象棋棋子可能的位置數(shù)——這一領(lǐng)域,仍然被人類(lèi)所支配著。

最后一件事情是,你這回可以親自見(jiàn)證這個(gè)歷史時(shí)刻。
據(jù)悉,這次谷歌AlphaGo與李世石的對(duì)決將通過(guò)YouTube進(jìn)行直播(在DeepMind的官方頻道,其已經(jīng)上傳了與歐洲圍棋冠軍PanHui的比賽視頻),據(jù)傳在國(guó)內(nèi)也會(huì)通過(guò)視頻網(wǎng)站和電視進(jìn)行直播。英語(yǔ)解說(shuō)將由邁克爾·雷德蒙(MichaelRedmond)來(lái)?yè)?dān)當(dāng),其是西方世界唯一一位達(dá)到最高級(jí)別專(zhuān)業(yè)9段的圍棋選手。而韓語(yǔ)解說(shuō)則為張赫宇(Chang-hyeokYu),目前其是韓國(guó)圍棋國(guó)家隊(duì)的主教練?!矩?zé)任編輯/荊玉珍】
來(lái)源:智東西
IT時(shí)代網(wǎng)(關(guān)注微信公眾號(hào)ITtime2000,定時(shí)推送,互動(dòng)有福利驚喜)所有原創(chuàng)文章版權(quán)所有,未經(jīng)授權(quán),轉(zhuǎn)載必究。
創(chuàng)客100創(chuàng)投基金成立于2015年,直通硅谷,專(zhuān)注于TMT領(lǐng)域早期項(xiàng)目投資。LP均來(lái)自政府、互聯(lián)網(wǎng)IT、傳媒知名企業(yè)和個(gè)人。創(chuàng)客100創(chuàng)投基金對(duì)IT、通信、互聯(lián)網(wǎng)、IP等有著自己獨(dú)特眼光和豐富的資源。決策快、投資快是創(chuàng)客100基金最顯著的特點(diǎn)。
小何
來(lái)自: 美國(guó)如此忌憚華為 顯示出對(duì)中國(guó)崛起的深層憂慮--IT時(shí)代網(wǎng)
小何
來(lái)自: 彭博社:六大中國(guó)手機(jī)品牌在全球挑戰(zhàn)三星蘋(píng)果霸主地位--IT時(shí)代網(wǎng)
小何
小何
來(lái)自: 少年頭條對(duì)壘中年騰訊:解局兩代互聯(lián)網(wǎng)公司商業(yè)之戰(zhàn)--IT時(shí)代網(wǎng)