揭秘AlphaGo背后團(tuán)隊:人工智能的下一個目標(biāo)是什么?
來源: 一財網(wǎng)作者: 一財網(wǎng)
攻克圍棋,僅僅是AlphaGo背后Deepmind團(tuán)隊的第一步。
近日,Deepmind創(chuàng)始人Demis Hassabis在接受The Verge采訪時透露, AlphaGo僅僅是谷歌人工智能項目的一個分支。在未來,Deepmind主要目的是“用人工智能解決一切問題”,并將進(jìn)一步探索人工智能在醫(yī)療、機(jī)器人以及手機(jī)等多個領(lǐng)域的應(yīng)用。
回溯Demis Hassabis的成功之路,從一個獲得過5次智力奧林匹克冠軍的國際象棋神童,到兩科優(yōu)等成績獲得劍橋大學(xué)計算機(jī)科學(xué)學(xué)位的青少年,再到創(chuàng)造了第一款包含人工智能的視頻游戲《主題公園》并創(chuàng)立了開創(chuàng)性的視頻游戲公司Elixir1,之后離開游戲產(chǎn)業(yè)深造神經(jīng)科學(xué)的PhD學(xué)位后于2010年創(chuàng)立Deepmind團(tuán)隊,你會發(fā)現(xiàn)他的經(jīng)歷十分與眾不同。
Hassabis接受The Verge采訪時正值AlphaGo首勝李世石九段的次日清早,如果說這個時候他把來自媒體的追問拋到九霄云外似乎也無可厚非。然而他卻依舊熱情友好,當(dāng)Google方面的代表告訴Hassabis一夕之間有超過3300篇韓國媒體關(guān)于他的采訪時,Hassabis表示出了明顯的詫異:“這真是難以置信,不過看到一個高深莫測的東西在短時間內(nèi)變得如此受歡迎,還是一件有趣的事情。”
圍棋將是永恒的圣杯
據(jù)Hassabis稱:“圍棋一直位于完美信息游戲的頂峰之處,在可能性方面圍棋比國際象棋復(fù)雜得多,所以,尤其是在深藍(lán)之后,圍棋對于人工智能來說意味著可望而不可及的圣杯。盡管我們做出了很多的努力,但仍舊沒有特別深入的領(lǐng)悟圍棋。蒙特卡羅樹搜索可以說是十年前的一項重大革新,但是我認(rèn)為對于AlphaGo的研發(fā)更為重要的部分在于我們引入了深度神經(jīng)網(wǎng)使得人工智能擁有了所謂的直覺方面的判斷力。可以說好的直覺是令頂尖棋手出類拔萃的關(guān)鍵原因,在昨天的比賽的實時解說中,當(dāng)我看到麥克雷蒙九段在計算結(jié)果方面表示很難判斷的時候,再次感到寫出一套圍棋價值判斷的程序極其困難。
此外,對于AlphaGo在實戰(zhàn)過程中下出的一些出其不意的招數(shù),Hassabis表示十分震驚:“我相信李世石也會是同樣的感覺,從他的面部表情上面可以觀察出來,當(dāng)AlphaGo向左進(jìn)擊李世石的領(lǐng)域時,我承認(rèn)這的確出人意料。”同時他也認(rèn)為,AlphaGo的下法極具進(jìn)攻性,在某種程度上來說,AlphaGo在用李世石的長項來進(jìn)行對抗。Hassabis說:“李世石以奇招頻出和善于把控局勢聞名,可以說AlphaGo在第一場比賽中下出了我們想要看到的局面,在開始的時候,它只是在整個棋盤上進(jìn)行布局并沒有實質(zhì)地占領(lǐng)某塊區(qū)域。傳統(tǒng)的圍棋程序之所以具有明顯的短板,是因為它們精于計算卻缺乏一種大局觀。”
為何AlphaGo的勝利意義重大
舉辦這場比賽的初衷在于評估AlphaGo 的能力,談及從AlphaGo的勝利中學(xué)到了什么以及未來它的發(fā)展方向,Hassabis表示:“通過比賽我們意識到我們目前所處的環(huán)節(jié)比之前預(yù)計的更加先進(jìn)。對于完美信息游戲,圍棋一直位于金字塔尖,還有許多頂級的圍棋高手等待對決。此外,還有很多其他的游戲,比如說無限制撲克,因為是不完美信息游戲,因此多人游戲也是一個挑戰(zhàn)。顯而易見所有人類比機(jī)器玩兒的好的電子游戲也可以被考慮其中,比如說《星際爭霸》在韓國也是非常受歡迎的。在信息不完美世界里,策略游戲?qū)Q策能力有極高的要求,因為能夠被看到的僅僅是全局的一部分。而在圍棋之中全盤情況都是可視的,這點對于電腦來說會使游戲略微容易一些。”
盡管用人工智能進(jìn)行游戲?qū)?zhàn)刺激有趣,但是Deepmind團(tuán)隊還是希望將人工智能用于更多主流的項目當(dāng)中。Hassabis表示他本人對游戲十分感興趣,也許是曾經(jīng)寫過游戲,但是目前來說,游戲僅僅是提供測試平臺用來測試我們的算法并且評估它們的等級的一個行之有效的辦法。而Deepmind的終極目標(biāo)在于用人工智能解決真實世界中的棘手問題。
談及自己過去從事游戲行業(yè)的經(jīng)歷對現(xiàn)在有何影響時,Hassabis說:“可以說創(chuàng)立Deepmind一直以來是我的最終目的,我用了近20年籌劃這個事情,如果你從一個最終我將要從事人工智能研究的角度審視我的經(jīng)歷,你會發(fā)現(xiàn)我的每一步選擇都是朝向人工智能的,熟悉我的Bullfrog員工都知道,我寫的所有游戲的核心都是與人工智能相關(guān)的。在16歲的時候?qū)憽吨黝}公園》游戲的時候我第一次意識到如果我們?nèi)σ愿斑M(jìn)行研究,人工智能的前景不可估量。這款游戲十分暢銷,說明玩家享受其中,因為人工智能十分貼合玩家的心意。因此我繼續(xù)在游戲領(lǐng)域進(jìn)行拓展,然而在2000年的時候我感覺到我們已經(jīng)在’從后門偷偷逼近‘人工智能研究的路上走到了盡頭,因為不管怎么樣你的最終目標(biāo)都只是做出一款游戲,所以我轉(zhuǎn)而去學(xué)習(xí)神經(jīng)科學(xué),以期在人工智能領(lǐng)域有所進(jìn)展。”
Hassabis認(rèn)為人工智能在90年代最直觀的應(yīng)用即是體現(xiàn)在游戲行業(yè),那時,學(xué)術(shù)界的研究沒有什么動靜,一些諸如增強(qiáng)學(xué)習(xí)、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等新技術(shù)都沒有得到應(yīng)用與推廣,所以游戲成為人工智能最好的應(yīng)用領(lǐng)域,當(dāng)然那時的人工智能與現(xiàn)在大相徑庭,當(dāng)時的人工智能更像是較為復(fù)雜的有限狀態(tài)機(jī)(FSM),游戲Black &White中應(yīng)用到了增強(qiáng)學(xué)習(xí)技術(shù),到目前為止我仍舊認(rèn)為這是在游戲中應(yīng)用最復(fù)雜的案例。然而到了2004年左右,游戲行業(yè)發(fā)生了很大的變化,不再像90年代那樣只要你有一個不錯的點子就可以做一款游戲,游戲行業(yè)變得更加注重畫面感,并且官方授權(quán)也變得十分重要,像FIFA系列游戲就是一個很好的例子。所以我認(rèn)為做游戲不再像以前那樣有趣了,并且我已經(jīng)在游戲領(lǐng)域積蓄了創(chuàng)立Deepmind所需的信息與經(jīng)驗,這個時候神經(jīng)科學(xué)引起了我的興趣,我很想從明白大腦解決問題的過程中獲得靈感,所以讀一個神經(jīng)科學(xué)的PhD再合適不過了。”
人工智能如何改變醫(yī)療領(lǐng)
人工智能的主要應(yīng)用將會在醫(yī)療、智能手機(jī)助手、機(jī)器人科學(xué)領(lǐng)域,在醫(yī)療方面,目前認(rèn)知計算系統(tǒng)IBM Watson已經(jīng)著手進(jìn)行癌癥診斷的項目,據(jù)此,Deepmind表示幾周之前已經(jīng)開始了和NHS(英國國家醫(yī)療服務(wù)體系)的合作,構(gòu)建一個可以應(yīng)用機(jī)器學(xué)習(xí)智能的平臺。Hassabis認(rèn)為IBM Watson所做的工作與Deepmind團(tuán)隊的工作有所區(qū)別,癌癥篩查更像是一個專家系統(tǒng),是另一種形式的人工智能,這類人工智能所能做到的是進(jìn)行圖像方面的醫(yī)學(xué)診斷,自我量化然后進(jìn)行重要特征的橫向比對以及大量的篩查,從而指導(dǎo)人們擁有更健康的生活方式,我認(rèn)為把增強(qiáng)學(xué)習(xí)技術(shù)用于這個領(lǐng)域較為適宜。
對于與NHS的合作,Deepmind推出了一款并未有用到AI或是機(jī)器學(xué)習(xí)的應(yīng)用程序,原因在于NHS軟件自身來看較為落后,它們并不是移動端的,完全不適用于目前消費(fèi)者的使用習(xí)慣,并且對于醫(yī)生和護(hù)士來說這個軟件十分低效。所以Deepmind首先會改善可視化與基礎(chǔ)化信息,借此看清真正的需求,繼而將更加熟練的機(jī)器運(yùn)用其中。
未來核心應(yīng)用領(lǐng)域
在第一天發(fā)布會的演講中,Hassabis使用了電影《她》中的海報作為講解的背景,對此他解釋道:“關(guān)于智能手機(jī)助手的樣子,《她》是較為盛行的主流觀點,我的看法是應(yīng)該讓智能手機(jī)助手變得更加‘人性化’,使它能夠?qū)δ愕男枨笥懈由羁痰睦斫狻6壳按蟛糠诌@樣的系統(tǒng)都極為脆弱,一旦偏離了預(yù)先編程輸入的模版,它們就會變得毫無用處。”
正如Hassabis所言,目前基本所有的智能手機(jī)助手都屬于特殊案例和預(yù)編程的,這意味著它們很脆弱,只能做預(yù)編程寫好的事。然而真實的世界非常混亂,用戶們也會在你無法提前知曉的情況下,做著不可預(yù)知的事情。所以DeepMind 的信念是:通往人工智能的唯一道路,是從地基開始打起,而且變得通用。這也是最根本的原則之一。
針對這點該如何改進(jìn),Hassabis的看法是:”由于智能手機(jī)的輸入十分多變,所以或許得輸入有’上萬噸’的數(shù)據(jù),才可以從中學(xué)習(xí)到很多東西。根據(jù)AlphaGo 的算法,我們打算在未來幾個月嘗試的是,擺脫監(jiān)督式學(xué)習(xí)的出發(fā)點,讓它完全自我發(fā)揮,從一無所有的狀態(tài)開始。它會需要更長的時間,因為當(dāng)你采用隨機(jī)方法的時候,其中的審查和錯誤會需要更多的時間訓(xùn)練,也許是幾個月。但是,我們認(rèn)為有這個可能性,讓它從純粹的學(xué)習(xí)中起步。“對于何時才能看到人工智能給市場帶來顯著性差異,Hassabis給出的答案是:”我認(rèn)為在未來的兩到三年會開始看到改善。我的意思是,這些改善在開始的時候是非常微小的,只有很小的部分會工作的更好。也許在未來的4 到5 年,甚至5 年更多,你可以看到智能手機(jī)在功能上大的變化。“
為何選擇Google ?
事實上,AlphaGo 在比賽中并沒有使用那么多硬件,然而Deepmind團(tuán)隊需要大量的硬件來訓(xùn)練它,做各種不同的版本,并讓他們在云端互相比賽。這需要相當(dāng)多的硬件才能高效完成,所以如果沒有這些資源,在這段時間內(nèi)根本無法完成。這也是Deepmind選擇與Google合作的原因之一。
關(guān)于是否期待被納入Google商業(yè)模式與產(chǎn)品路線圖中,Hassabis認(rèn)為:“在如何最優(yōu)化研究進(jìn)展方面,我們有很強(qiáng)的主導(dǎo)權(quán)。這是我們的使命,也是為什么我們加入了Google,這樣我們可以給研究進(jìn)行渦輪增壓。這是發(fā)生在過去幾年的事情。當(dāng)然,我們實際上也致力于很多Google 內(nèi)部的產(chǎn)品,但是他們是非常早期的階段,所以還沒準(zhǔn)備好公布。當(dāng)然我認(rèn)為智能手機(jī)助手是非常核心的,我認(rèn)為Sundar Pichai 已經(jīng)對此談了很多,這是Google 未來的核心。”
對于與Google Brain是否有合作,Hassabis表示:“其實我們是非常互補(bǔ)的。我們每周都有交談。Google Brain 主要致力于深度學(xué)習(xí),他們也有非常卓越的工程師Jeff Dean,所以他們已經(jīng)鋪開到公司的各個角落,這也是為什么我們發(fā)明出了令人驚喜的Google 圖片搜索。他們正在做著現(xiàn)象級的工作。另外,他們的團(tuán)隊在山景城,所以他們離產(chǎn)品團(tuán)隊更近,他們的研究周期也更像12 到18 個月。而我們有更多算法開發(fā)的工作,我們傾向于為需要兩三年研究的事情做研究,而且不需要在開始的時候就有直接的產(chǎn)品焦點。”
關(guān)注未來科學(xué)
關(guān)于機(jī)器人科學(xué)目前的發(fā)展?fàn)顩r,Hassabis認(rèn)為它們或許有漂亮的軀干,但是依然缺乏智慧的“大腦”,與智能手機(jī)助手目前的狀況相似,機(jī)器人目前似乎只能對預(yù)先進(jìn)行編程的情況作出反應(yīng),一旦處于狀況之外,機(jī)器人無疑會無所適從。因此如何通過機(jī)器學(xué)習(xí)強(qiáng)化機(jī)器人的能力十分重要。
對于科學(xué)習(xí)的機(jī)器人,Hassabis舉出了一些直接使用的案例:“顯然,自動駕駛汽車是一種機(jī)器人,但目前來說還是狹義的人工智能,雖然他們使用了計算機(jī)視覺里面一些可學(xué)習(xí)的人工智能——特斯拉采用了一種基于深度學(xué)習(xí)的標(biāo)準(zhǔn)、現(xiàn)場的計算機(jī)視覺方案。我相信日本在老年護(hù)理機(jī)器人、家庭清潔機(jī)器人上面有很多思考,我認(rèn)為這對社會會非常有用。特別是在一個人口老齡化的社會里,我認(rèn)為是一個非常緊迫的問題。“
對人類、機(jī)器人和人工智能在未來的交互,Hassabis的期望是:“我自己對機(jī)器人沒多少思考。我自己對人工智能的使用感到興奮的領(lǐng)域是科學(xué),能夠推動它更快的發(fā)展。我想看到人工智能未來能夠輔助科學(xué),如果有一個人工智能研究助手,它可以做很多乏味的工作,閱讀有趣的論文,從海量的數(shù)據(jù)中找到結(jié)構(gòu),并把它們呈現(xiàn)到人類專家和科學(xué)家面前,以實現(xiàn)更快的技術(shù)突破。我?guī)讉€月前在歐洲核子研究中心做演講,很顯然它們創(chuàng)造出比地球上任何地方都多的數(shù)據(jù),我們都知道在它們海量的硬盤中,可能會有某個新的粒子發(fā)現(xiàn),但沒有人能抽出時間做這件事情,因為這里的數(shù)據(jù)量的確太過龐大。所以我覺得,如果有一天人工智能參與尋找到一個新的粒子,那么是一件非常酷的事。”