AlphaGo2.0來到中國(guó), “人機(jī)大戰(zhàn)第二季”激戰(zhàn)正酣。
但事實(shí)上,AlphaGo已經(jīng)是圍棋人工智能的第三代。在開發(fā)圍棋人工智能的道路上,人類已經(jīng)艱難地探索了將近五十年。
第一代圍棋人工智能是中國(guó)教授發(fā)明
圍棋的英譯名Go是日語的發(fā)音譯來的,圍棋在日語里寫成“碁”(即Go的發(fā)音),把圍棋譯成Go或者The game of go大概是最蹩腳的翻譯了,尤其是在互聯(lián)網(wǎng)時(shí)代,把圍棋譯成Go非常不利于圍棋的推廣,但AlphaGo的出現(xiàn)或能改變這個(gè)事實(shí)。
棋類游戲是對(duì)人類智能的挑戰(zhàn),自然也成了人工智能的標(biāo)志之一。而圍棋一直被認(rèn)為是人工智能領(lǐng)域里的非常困難的挑戰(zhàn)。二戰(zhàn)還沒結(jié)束,圖靈就研究計(jì)算機(jī)下棋,他于1947年編了第一個(gè)國(guó)際象棋下棋程序,但直到1968年,最早的電腦圍棋程序才被編寫出來。它是由阿爾伯特·索伯特開發(fā)的,引入了一個(gè)評(píng)估函數(shù)對(duì)棋局進(jìn)行分析,來估算雙方占空的大小。然而,在相當(dāng)長(zhǎng)的一段時(shí)間里,業(yè)界的普遍觀點(diǎn)是電腦圍棋只能達(dá)到業(yè)余棋手的水準(zhǔn)。
真正意義上的第一代圍棋AI(人工智能)——“手談”,是由已故中山大學(xué)化學(xué)系教授陳志行研發(fā)的圍棋程序,從1993年到2002年共10次獲得電腦圍棋世界冠軍,而“手談”這個(gè)名字也是圍棋除“弈”之外的別稱。
陳志行教授原本研究的是量子化學(xué),但同時(shí)也是圍棋業(yè)余高手。在1991年退休后,他才開始潛心研發(fā)電腦圍棋軟件,雖然當(dāng)時(shí)的電腦軟件技術(shù)水平還非常低,而圍棋棋盤大(19 19,一共有361點(diǎn)),空間狀態(tài)多,打劫、終局規(guī)則復(fù)雜,一般程序員至少需要設(shè)計(jì)一兩年才可能讓電腦學(xué)會(huì)下圍棋。但量子化學(xué)專業(yè)出身的陳志行,使用速度快但不太常用的匯編程序語言搭建圍棋框架和編寫圍棋對(duì)弈引擎,他潛心編寫的“Alpha-Beta搜索引擎”速度非???,在當(dāng)時(shí)領(lǐng)先其他同行幾個(gè)數(shù)量級(jí),達(dá)到了13層搜索深度,也就是說“手談”可以算清后面的13步棋,而其他程序通常只能算七八步。陳志行編寫的“模式識(shí)別”專家系統(tǒng)在當(dāng)時(shí)也是無人能及。
陳志行潛心研發(fā)“手談”3年后,終于在世界比賽中斬獲首個(gè)圍棋人工智能世界冠軍。當(dāng)時(shí)的“手談”以戰(zhàn)斗力超強(qiáng)著稱,智能水平遙遙領(lǐng)先國(guó)際同行。之后“手談”對(duì)弈水平不斷進(jìn)步,在國(guó)際性的電腦圍棋對(duì)弈比賽上連續(xù)奪冠,奪得了該時(shí)期大部分世界比賽的冠軍。
當(dāng)時(shí)個(gè)人電腦系統(tǒng)剛在世界范圍內(nèi)普及,許多圍棋愛好者還專門購(gòu)買電腦安裝“手談”軟件,用作學(xué)習(xí)圍棋和訓(xùn)練的工具,“手談”軟件在世界范圍內(nèi)銷售量排名第一??梢哉f,“手談”軟件的成功在國(guó)內(nèi)掀起了一波圍棋人工智能研究的熱潮。
“蒙特卡洛樹”算法開啟二代圍棋人工智能
當(dāng)如IBM深藍(lán)那樣的超級(jí)電腦,已經(jīng)能夠擊敗世界上最好的國(guó)際象棋棋手時(shí),圍棋軟件卻仍然無法擊敗業(yè)余圍棋高手。
但是,從2006年開始,隨著應(yīng)用蒙特卡洛方法的樹搜索即蒙特卡洛樹搜索和機(jī)器學(xué)習(xí)在圍棋上的應(yīng)用,電腦圍棋水平有了突飛猛進(jìn)的增長(zhǎng),棋力普遍提升到業(yè)余高段的水準(zhǔn)。
圍棋的棋子多,組合可能性也多。蒙特卡洛算法是一種基于“隨機(jī)數(shù)”的計(jì)算方法,這一方法源于美國(guó)在二戰(zhàn)中研制原子彈的“曼哈頓計(jì)劃”。頻率決定概率,圍棋對(duì)弈軟件將最常見的對(duì)弈定式及棋形輸入其中,從而達(dá)到較短時(shí)間提高棋力的功效。用通俗的語言解釋這種算法:“簡(jiǎn)單來說,人腦下圍棋靠的是邏輯思維,而蒙特卡洛算法就是一個(gè)抽樣調(diào)查的方法。其實(shí)就是一個(gè)賭博概率式的方法,如果電腦下100盤棋,用這種下法贏了60盤,用另一種下法只贏了50盤,那么,它就會(huì)認(rèn)定第一種下法,而淘汰另一種下法?!?/p>
蒙特卡洛樹搜索算法的出現(xiàn),可以看作是人工智能取得突破性進(jìn)展的標(biāo)志:計(jì)算機(jī)的思考方式,已經(jīng)有點(diǎn)接近人類的思維方式了。目前使用蒙特卡洛樹搜索的圍棋對(duì)弈軟件有瘋石圍棋(CrazyStone)、銀星圍棋(SilverStar)、天頂圍棋(ZEN)等,都取得了不錯(cuò)的成績(jī)。
2011年8月歐洲圍棋大會(huì),電腦圍棋軟件ZEN在19路盤上被讓五子擊敗日本職業(yè)棋手林耕三六段。2012年3月,ZEN被讓四子擊敗了日本超一流棋手武宮正樹九段,這是圍棋程序首次在被讓四子的情況下戰(zhàn)勝第一流職業(yè)選手。2013年,CrazyStone被讓四子擊敗日本石田芳夫九段,2014年,CrazyStone被讓四子擊敗日本依田紀(jì)基九段??梢妵遘浖M(jìn)步迅速,至少比起十年前對(duì)弈水平已經(jīng)提高一大截,受讓四子優(yōu)勢(shì)明顯。
2015年10月,同樣基于蒙特卡洛樹搜索的Google旗下人工智能公司DeepMind開發(fā)的AlphaGo,在沒有任何讓子的情況下,以五戰(zhàn)全勝的成績(jī)擊敗了歐洲圍棋冠軍、職業(yè)圍棋二段樊麾,這也是電腦圍棋程序首次擊敗圍棋職業(yè)棋手,當(dāng)然也意味著圍棋AI新時(shí)代的來臨。
AlphaGo、絕藝以及人機(jī)協(xié)作
圍棋AI之難,難在這項(xiàng)運(yùn)動(dòng)本身的多重復(fù)雜性——“最簡(jiǎn)單的規(guī)則,最復(fù)雜的變化”。在AlphaGo及其開發(fā)團(tuán)隊(duì)DeepMind出現(xiàn)之前,幾乎所有研究者都認(rèn)為在十年內(nèi)人工智能戰(zhàn)勝圍棋大師的機(jī)會(huì)是渺茫的。而在它出現(xiàn)以后,幾乎所有人都在驚呼人工智能已破解了圍棋這一歷史難題,甚至在極短的時(shí)間內(nèi)兩次讓研究成果上了《自然》雜志的封面。
據(jù)AlphaGo官方介紹,AlphaGo采用了一種更加“通用”的人工智能方法,即采用將改進(jìn)的蒙特卡洛決策樹算法與深度神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的方法構(gòu)建最終的學(xué)習(xí)系統(tǒng)。其包括兩個(gè)部分:策略網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò)。策略網(wǎng)絡(luò)在當(dāng)前給定的棋局中,負(fù)責(zé)預(yù)測(cè)下一步的走棋,并對(duì)下一步走棋的好壞進(jìn)行打分,策略網(wǎng)絡(luò)的作用好比“模仿”人類棋手的各種走法,以達(dá)到預(yù)測(cè)的效果。然而僅憑模仿無法擊敗最頂級(jí)的人類高手,AlphaGo又增加了價(jià)值網(wǎng)絡(luò)來判斷當(dāng)前的局面到底對(duì)哪一方有利,但圍棋程序的局勢(shì)評(píng)估相當(dāng)困難,只能通過深度學(xué)習(xí)網(wǎng)絡(luò)之間自我訓(xùn)練的方法來達(dá)到良好的效果。
2016年3月,AlphaGo以4:1戰(zhàn)勝世界圍棋名將李世石,AlphaGo的實(shí)力首次被世人真正認(rèn)可。AlphaGo 2.0版本的升級(jí)亮點(diǎn)是——摒棄人類棋譜,即僅通過監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí),再度進(jìn)化出新的“圍棋機(jī)器人”。
事實(shí)上,除了AlphaGo,現(xiàn)在還有其他圍棋AI程序也已被證明達(dá)到甚至超過了人類棋手的一流水平,比如騰訊AI Lab(騰訊人工智能實(shí)驗(yàn)室)研發(fā)的圍棋人工智能程序“絕藝”(Fine Art),它在今年首次參加UEC杯計(jì)算機(jī)圍棋大賽,就以11連勝奪得了本屆UEC杯冠軍,在隨后的人機(jī)大戰(zhàn)中完勝日本先鋒棋手一力遼。
AI作為工具,被人類棋手“喂招”不斷進(jìn)化后,它也能“反哺”人類,棋手使用圍棋AI開展人機(jī)協(xié)同,AI為人類棋手“蓄力”,1+1>2的進(jìn)化成為了新看點(diǎn)。隨著數(shù)據(jù)量的高速增長(zhǎng),AI可以分析總結(jié)、自我學(xué)習(xí),人則可以通過善用AI、人機(jī)協(xié)作,開啟智慧時(shí)代,改變現(xiàn)在以及未來的一切。(作者為《機(jī)器人產(chǎn)業(yè)》雜志副總編)
實(shí)戰(zhàn)雙方形成一場(chǎng)轉(zhuǎn)換,其結(jié)果依然是黑棋明顯優(yōu)勢(shì),白棋斷這個(gè)是勝負(fù)手這個(gè)局部顯然是白棋最后的機(jī)會(huì)。白棋斷時(shí)黑棋已經(jīng)無法阻止白棋在空中出棋了,而此時(shí)或許AI才剛剛意識(shí)到前面的失誤。
奧多姆仍處于病危狀態(tài),包括艾弗森在內(nèi)的多位NBA退役以及現(xiàn)役球星為奧多姆祈福,“魔術(shù)師”約翰遜回憶往事,稱贊奧多姆心地善良待人友善。
廣西有一件命案15年沒破,人工智能卻幫警察抓住了嫌疑人。盡管不方便詳細(xì)透露案情,但王海波仍然向《科技日?qǐng)?bào)》介紹了機(jī)器福爾摩斯近期破獲廣西一起15年懸疑命案的大致套路。
近日美國(guó)名嘴采訪機(jī)器人被調(diào)戲了,看來AI比我們想象的要厲害得多啊。Hanson表示,他以全民女神奧黛麗赫本和他妻子為原型打造了Sophia,而目前他的公司Hanson Robotics已經(jīng)打造了20個(gè)機(jī)器人。
而艾弗森作為NBA歷史上最矮小的得分王,的確如杜蘭特所說,在同等身材的球員出類拔萃。值得一提的是,雖然艾弗森身高只有1.83米,杜蘭特的實(shí)際身高接近2.10米,但兩個(gè)人都是NBA歷史上數(shù)得著的砍分大王。
北京時(shí)間3月12日,本月初,費(fèi)城76人隊(duì)的傳奇球星阿倫-艾弗森的3號(hào)球衣正式退役?!薄 〗衲?月2日,艾弗森的球衣退役儀式在費(fèi)城76人隊(duì)的主場(chǎng)富國(guó)銀行中心球館隆重舉行,2萬多名觀眾來到現(xiàn)場(chǎng)見證這一偉大的時(shí)刻。
北京時(shí)間11月7日,據(jù)《菲律賓星報(bào)》報(bào)道,NBA傳奇球星阿倫-艾弗森日前正在菲律賓出席籃球慈善賽,在接受當(dāng)?shù)孛襟w的采訪時(shí),他特別談到了昔日賽場(chǎng)上的老對(duì)手科比-布萊恩特。
北京時(shí)間10月31日(費(fèi)城時(shí)間10月30日)消息,阿倫-艾弗森今天在76人主場(chǎng)富國(guó)銀行中心正式宣布退役?!薄 “ド瓕?duì)于自己的成就非常驕傲,他直言,“我就是費(fèi)城,當(dāng)你想起費(fèi)城籃球,你想起阿倫-艾弗森,這是我努力贏得的。
北京時(shí)間7月4日消息,據(jù)美國(guó)《丹佛郵報(bào)》報(bào)道,在國(guó)王隊(duì)撤回5600萬美元的報(bào)價(jià)合同后不久,安德烈-伊戈達(dá)拉和丹佛掘金重新回到談判桌,雙方將會(huì)就一份長(zhǎng)期的合同進(jìn)行談判。本來國(guó)王想要給伊戈達(dá)拉提供一份高達(dá)5600萬美元的合同,但是不久前國(guó)王宣布撤回這份報(bào)價(jià),這樣伊戈達(dá)拉仍然是自由球員。
近日,他的前妻塔瓦娜聲稱艾弗森涉嫌誘拐了他們的孩子,現(xiàn)在她請(qǐng)求法院讓前夫把孩子們歸還給她。作為孩子們的唯一法定監(jiān)護(hù)人,塔瓦娜相信艾弗森當(dāng)時(shí)并沒有帶著孩子們?nèi)ハ穆逄?,而是把他們留在了佐治亞州的一家喜來登酒店?/p>
網(wǎng)站簡(jiǎn)介 | 版權(quán)聲明 | 廣告服務(wù) | 聯(lián)系方式 | 網(wǎng)站地圖
Copyright © 2012 hnr.cn Corporation,All Rights Reserved
映象網(wǎng)絡(luò) 版權(quán)所有