【新智元導(dǎo)讀】5月23日起,有AlphaGo之父之稱的哈薩比斯將率領(lǐng)DeepMind的數(shù)位大將,與谷歌大腦的精英團(tuán)隊一起,在中國烏鎮(zhèn)參加圍棋人機(jī)終極對決,其中最受關(guān)注的自然是與柯潔的三場大戰(zhàn)。本文綜合《衛(wèi)報》、BI、Wired 等媒體的報道,試圖還原“超級英雄”哈薩比斯前半生的傳奇經(jīng)歷:其母親有中國血統(tǒng),從少年時期哈薩比斯就被贊為“神童”,在數(shù)學(xué)和棋類游戲上頗有造詣。他的理想,是通用人工智能。
40 歲的著名人工智能(AI)實驗室 DeepMind 的聯(lián)合創(chuàng)始人戴密斯·哈薩比斯,被世界公認(rèn)為他所在領(lǐng)域最聰明的思想家之一。
哈薩比斯被《衛(wèi)報》形容為“人工智能超級英雄”,曾經(jīng)是劍橋和倫敦大學(xué)學(xué)院計算機(jī)科學(xué)和認(rèn)知神經(jīng)科學(xué)的神童。
哈薩比斯在17歲的時候就和別人共同制作了電子游戲“Theme Park”,接著他成立了自己的電子游戲公司,并最終于2010 年成立了DeepMind。
2014年1月,哈薩比斯將DeepMind 以4億英鎊的價格出售給了Google,這是迄今為止歐洲范圍內(nèi)最大的一筆收購。這家公司的 AlphaGo 去年擊敗了圍棋世界冠軍,創(chuàng)造了歷史?,F(xiàn)在,DeepMind 正在將注意力轉(zhuǎn)向?qū)⑺惴☉?yīng)用于可以使人類受益的領(lǐng)域,包括醫(yī)療保健和氣候變化等。
從小就表現(xiàn)出棋類游戲的天賦,特別是國際象棋
哈薩比斯1976 年7 月27 日出生,父親是塞浦路斯希臘族,母親是新加坡華人。
哈薩比斯是三個兄弟姐妹中最年長的,他的父母是老師。據(jù)《衛(wèi)報》報道,他的妹妹是一名鋼琴家和作曲家,而他的弟弟則在學(xué)習(xí)創(chuàng)意寫作。
“我的父母不是技術(shù)人員,”他在接受衛(wèi)報采訪時說。“他們真的不喜歡計算機(jī),他們有點文藝范,我的妹妹和弟弟都走了藝術(shù)路線,沒有人進(jìn)入數(shù)學(xué)或科學(xué)領(lǐng)域...這很奇怪,我不太清楚所有這一切都來自于什么。”
哈薩比斯現(xiàn)在有兩個兒子。
哈薩比斯從小就表現(xiàn)出棋類游戲的天賦,特別是國際象棋。
據(jù)Wired 報道,哈薩比斯四歲時就看他父親和叔叔下國際象棋,展現(xiàn)出了濃厚興趣。兩個星期后,哈薩比斯就在比賽中擊敗了大人。
左下角的孩子是哈薩比斯
五歲以前,他在全國各地比賽,六歲時贏得了倫敦八歲以下組別的冠軍。他九歲時已經(jīng)成為了英格蘭11歲以下國際象棋隊的隊長。
8 歲買了第一臺計算機(jī),16歲被劍橋錄取
八歲時,哈薩比斯買了人生中第一臺計算機(jī)——ZX Spectrum。
哈薩比斯用他從國際象棋比賽中贏的200 英鎊買了這臺機(jī)器。
“那時計算機(jī)的驚人之處在于你可以對其進(jìn)行編程,”哈薩比斯告訴Wired,“我爸會帶我去Foyles(倫敦最大的書店),坐在計算機(jī)編程類書籍的區(qū)域,學(xué)習(xí)如何在游戲中無限續(xù)命,我從直覺上感到這是一個神奇的設(shè)備,你可以釋放你的創(chuàng)造力。”
13歲時,哈薩比斯成為了國際象棋大師。當(dāng)時他在14 歲以下組別世界排名第二。
14歲時,他完成了GCSE (類似于中國的中學(xué)會考),這比同班同學(xué)提前了兩年。十五歲時,他達(dá)到了數(shù)學(xué) A level,16歲時則達(dá)到了高等數(shù)學(xué)、物理學(xué)和化學(xué)的 A level。
他向劍橋大學(xué)提出了申請,拿到了一個入學(xué)名額,但劍橋沒讓他真正開始,因為他當(dāng)時只有16歲,于是他休息了一年。
他的事業(yè)起步于英國Bullfrog Productions 工作室的電子游戲。當(dāng)時他 15 歲,還在Amiga Power雜志贏得了一份工作。在Bullfrog,他共同設(shè)計并領(lǐng)導(dǎo)了“主題公園(Theme Park)”的編程,游戲挑戰(zhàn)玩家建立一個成功的主題公園。
哈薩比斯在去年七月告訴PCGamesN :“我從游戲中得到的最大樂趣來自90年代初的職業(yè)經(jīng)歷。特別是在 Bullfrog,我當(dāng)時很幸運地處在英國游戲行業(yè)的黃金期,游戲一個接一個地被創(chuàng)造出來。”
Peter Molyneux
那段時間,他曾在傳奇游戲設(shè)計師 Peter Molyneux 手下工作,Molyneux 是 Bullfrog Productions 的創(chuàng)始人。
“我想我們彼此影響很大,”哈薩比斯告訴PCGamesN,“多年來我們合作密切——很難說誰影響了誰,但這是我生活中非常重要的一部分。”
“主題公園”于 1994 年發(fā)行,當(dāng)時哈薩比斯17歲,游戲賣了數(shù)百萬份。
哈薩比斯于1994 年離開了Bullfrog Productions,到劍橋?qū)W習(xí)計算機(jī)科學(xué)。
據(jù)“金融時報”報道,劍橋大學(xué)本科生主要學(xué)習(xí)的內(nèi)容是“狹義AI ”,狹義 AI 能夠?qū)W習(xí)如何執(zhí)行具體任務(wù),但哈薩比斯對開發(fā)“通用 AI ”更感興趣。
1997年,20歲的哈薩比斯從劍橋皇后學(xué)院畢業(yè),他獲得了雙重一級榮譽(yù)學(xué)位(a double first-class honours degree)。
“沉迷”于游戲,從游戲公司開始創(chuàng)業(yè)
1997年畢業(yè)后,哈薩比斯再次在Molyneux 手下工作,工作室是 Lionhead。
在Lionhead,哈薩比斯為標(biāo)志性的上帝視角游戲“黑與白”開發(fā)了早期的AI 原型版本。
一年后,他離開了Lionhead,成立了自己的電子游戲公司。
1998年,哈薩比斯創(chuàng)立了Elixir Studios,為全球發(fā)型商如Vivendi Universal 和Microsoft 創(chuàng)造了一批屢獲殊榮的游戲。
在高峰期Elixir 雇用了大約60人,制作了AI 模擬游戲如“共和國:革命”和“邪惡天才”,這些都是獲BAFTA 提名的。
據(jù)“金融時報”報道,哈薩比斯將Elixir 的5%股權(quán)出售給了創(chuàng)建了Lara Croft“古墓麗影”系列的Eidos。股權(quán)售價為60 萬英鎊,公司估值為1200 萬英鎊。
神經(jīng)科學(xué)博士:尋求在人類大腦中尋找新的AI 算法靈感
在電子游戲初創(chuàng)公司里工作了十年之后,哈薩比斯于2005 年回到了倫敦大學(xué)學(xué)院(UCL),在那里他完成了四年的認(rèn)知神經(jīng)科學(xué)博士學(xué)位。
在他讀博期間,他開始尋求在人類大腦中尋找新的AI 算法靈感。
他關(guān)于記憶與想象力的研究被列入 2007 年十大科學(xué)突破之列。
2009 年,哈薩比斯獲得了Henry Wellcome 博士后研究獎學(xué)金,繼續(xù)在 UCL 進(jìn)行研究。他還在波士頓、哈佛和 MIT 度過了一段研究時光。
創(chuàng)建DeepMind,走上巔峰
2010年,哈薩比斯成立了自己迄今為止最大的公司:DeepMind。
DeepMind 是一家位于倫敦的創(chuàng)業(yè)公司,希望“解決智能”,并用它來“使世界變得更美好”。
該公司正在開發(fā)復(fù)雜的自學(xué)習(xí)算法,可以在給定數(shù)據(jù)集面前自我學(xué)習(xí),勝任特定任務(wù)。這些算法的創(chuàng)建混合了來自神經(jīng)科學(xué)和機(jī)器學(xué)習(xí)的研究和專業(yè)知識。
到目前為止,這些算法已經(jīng)擊敗了圍棋中的世界冠軍,幫助Google 削減了巨額的電費。DeepMind 還將其算法應(yīng)用于許多NHS 項目。
哈薩比斯和童年好友 Mustafa Suleyman 共同創(chuàng)立了 DeepMind。
Suleyman 是 DeepMind 應(yīng)用AI 的負(fù)責(zé)人,也是 DeepMind Health 部門的負(fù)責(zé)人,該部門正在與NHS在許多項目上展開合作。
Suleyman 也很聰明,在牛津大學(xué)學(xué)習(xí)哲學(xué)和神學(xué),但他第二年就退學(xué)了,當(dāng)時他19歲,創(chuàng)立了穆斯林青年幫助熱線。Suleyman 后來擔(dān)任了倫敦市長KenLivingstone 的政策官。此后,他創(chuàng)立了“變革實驗室(Change Labs)”,旨在提供解決復(fù)雜問題的咨詢服務(wù)。
另一個創(chuàng)始人是 Shane Legg,新西蘭人,他也是 UCL 蓋茨比計算神經(jīng)科學(xué)組的博士后。
Legg 是 DeepMind 首席科學(xué)家。他在瑞士 Dalle Molle人工智能研究所(IDSIA)獲得博士學(xué)位,師從超智能機(jī)器理論模型專家 Marcus Hutter 教授。
現(xiàn)年43歲的 Legg 與哈薩比斯共同領(lǐng)導(dǎo) DeepMind 的研究工作。Legg 大部分時間花在招聘人才上,以及對 DeepMind 下一步應(yīng)該重點關(guān)注什么進(jìn)行決策。更重要的是,Legg 還領(lǐng)導(dǎo) DeepMind 在 AI 安全方面的工作,包括開發(fā)一個巨大的“紅色按鈕”以在機(jī)器失控時按下按鈕,中斷機(jī)器。
與 DeepMind 的其他共同創(chuàng)始人相比,Legg 顯得更加低調(diào),接受媒體的采訪更少。除了少有的曾在去年12月接受彭博社采訪外,你很難在有關(guān) DeepMind 的無數(shù)報道中找到 Legg 的只言片語。
哈薩比斯的早期投資者包括特斯拉億萬富翁 Elon Musk,以及 Skype 聯(lián)合創(chuàng)始人 Jaan Tallinn。
馬斯克今年早些時候接受《名利場》采訪時這樣評價 DeepMind:
“它讓我對事情發(fā)展的速度有了更清晰的了解,而且我覺得它們發(fā)展的速度正在加快,遠(yuǎn)遠(yuǎn)快于人們能夠意識到的。主要是因為人們在日常生活中不會看到機(jī)器人在到處走,也許你加的 Roomba 或其他什么會走動,但 Roomba 不會接管世界。”
但 DeepMind 也不是所有項目都很有名。在被 Google 收購之前,DeepMind 做過一個利用 AI 的時尚網(wǎng)站 KITSEE。
KITSEE 使用 AI 技術(shù)向用戶推薦衣服,然后用戶可以繼續(xù)瀏覽和購買。這個網(wǎng)站還提供了一系列由 DeepMind 的作家團(tuán)隊操刀的時尚博文。
但當(dāng) DeepMind 被 Google 收購時,KITSEE 似乎已經(jīng)被放棄了,Google 這位搜索巨頭可能對它不感興趣。
2013年12月,DeepMind 宣布機(jī)器在玩 Atari 游戲上超過了人類水平,通過使用屏幕上的原始像素作為輸入訓(xùn)練軟件。這是 DeepMind 取得的一項突破。
DeepMind被谷歌收購,金額4億英鎊,當(dāng)時只有50名員工
DeepMind 于 2014年被 Google 收購,據(jù)報道收購金額是 4億 英鎊,當(dāng)時 DeepMind 有約50名員工。
如今,DeepMind 屬于 Google 母公司 Alphabet 旗下,公司位于倫敦國王十字車展附近,擁有約400名員工。DeepMind 還在加州山景城的 Google 總部有一個小團(tuán)隊,該團(tuán)隊致力于將 DeepMind 的技術(shù)應(yīng)用到 Google 的產(chǎn)品。但它仍然是一個獨立的組織。
作為 Google 收購協(xié)議的一部分,哈薩比斯以及其他聯(lián)合創(chuàng)始人與 Google 成立了 AI 倫理委員會。不過誰是這個委員會的頭,從來沒有公開。
2015年,DeepMind 發(fā)表有關(guān)學(xué)習(xí)掌握 Atari 游戲的算法的論文,登上了 Nature 雜志的封面——這是許多科學(xué)家夢寐以求的。
挑戰(zhàn)圍棋,聞名全球
搞定 Atari 游戲之后,哈薩比斯和他的迅速擴(kuò)大的團(tuán)隊開始把注意力轉(zhuǎn)移到古老的中國游戲,圍棋——一個被廣泛認(rèn)為是 AI 領(lǐng)域的圣杯的游戲。
圍棋有著3000多年的歷史,是一個雙人棋盤游戲,玩法表面看起來很簡單——每個玩家輪流落一子,目的是用自己的子圍住對方的棋子。
然而,任何一個落子的動作都意味著很多可能的動作,圍棋實際上是人類開發(fā)的最復(fù)雜的游戲之一,AI 科學(xué)家們研究了幾十年一直無法突破。
AlphaGo 通過玩無數(shù)遍游戲,逐漸從錯誤中學(xué)習(xí)。
2016年3月,DeepMind 讓它的圍棋算法 “AlphaGo” 和圍棋世界冠軍李世乭進(jìn)行了一場比賽。
這是在韓國首爾的五星級四季酒店舉行的,一共五局的比賽。DeepMind 在五局棋中贏了4局,最終取得勝利。
李世乭可能受到了沖擊,但自那以后他還沒有輸過一場比賽。自從輸給 AlphaGo 之后,他一直通過與 AlphaGo 算法交手來提高自己的棋藝。
寫 AlphaGo 算法的程序員主要是 David Silver,他和哈薩比斯同是在劍橋大學(xué)念本科。
Silver 和哈薩比斯在 DeepMind 創(chuàng)立之前曾一起在 Elixir 工作。
哈薩比斯在2016年2月接受《衛(wèi)報》采訪時說:“Dave 和我是多年的老友,我們曾夢想一生都在這個領(lǐng)域工作,所以可以對19歲時的我們說放心了,我們做到了。”
DeepMind 在2016年1月第二次登上 Nature 封面,內(nèi)容是有關(guān) AlphaGo 算法的研究論文。
AlphaGo 現(xiàn)在正在前往中國,即將與發(fā)明圍棋的這個國家的最厲害的棋手們對弈。
許多 AI 專家,包括牛津大學(xué)教授 Nick Bostrom 在內(nèi),認(rèn)為 DeepMind 將在這場 AI 競賽中贏得頭籌,領(lǐng)先于 Facebook 和 Amazon 等公司。
Nick Bostrom 和哈薩比斯
哈薩比斯已經(jīng)獲得許多榮譽(yù),包括今年5月份獲得“亞洲獎”年度科技最佳貢獻(xiàn)獎。
2014年,哈薩比斯獲得了英國皇家學(xué)會頒發(fā)的“穆拉德獎”(Mullard Award),然后2016年,他被 Nature 雜志評為“年度十大人物”。
2017年,哈薩比斯被《時代》提名為全球最具影響力100人之一。
超級英雄到來,AlphaGo的中國之行即將啟幕
圍棋被看成是一個計算機(jī)很難攻克的游戲,因為它嚴(yán)重地依賴于直覺、策略思考,需要在棋盤上贏下多場戰(zhàn)役。僅僅是記住所有的棋子位置組合、評估棋局、構(gòu)造和執(zhí)行贏棋的策略,對于單臺計算機(jī)來說,是非常有難度的。
但是這些都沒能阻止DeepMind 的AlphaGo,它戰(zhàn)勝了這一切。AlphaGo的深度神經(jīng)網(wǎng)絡(luò)讓它能自己學(xué)會下棋。程序員們設(shè)置了關(guān)于圍棋的基礎(chǔ)啟發(fā)式(heuristics),給AlphaGo一個數(shù)據(jù)庫,從160,000個現(xiàn)實生活中的圍棋對弈游戲中抽取出3000萬個棋局, 來進(jìn)行分析,分解其核心思想,然后,計算機(jī)能數(shù)百萬次地重復(fù)游戲,在這一過程中進(jìn)行學(xué)習(xí)。
這個策略已經(jīng)有所回報。 2015年10月,AlphaGo以5:0 的比分戰(zhàn)勝歐洲冠軍樊麾,這是歷史上第一次,電腦在一個全面的19x19棋盤上擊敗了一名專業(yè)人士。 2016年3月,它擊敗了韓國的世界冠軍李世石,比分是4比1,而從2016年底到2017年初,AlphaGo(偽裝成“Magister”和“Master”)秘密地打了51場在線比賽,對手都是世界上的頂級玩家。
現(xiàn)在,最后的對決即將到來:5月23日,AlphaGo和世界排名第一圍棋手柯潔將在中國烏鎮(zhèn)進(jìn)行顛覆對決。
在圍棋上的成就使得AlphaGo成為了聚光燈的焦點,但是,DeepMind 的這一程序還有另外一些東西,也就是智力(Mind)。DeepMind的聯(lián)合創(chuàng)始人Demis Hassabis表示:“總而言之,我們的工作說明了利用生物學(xué)啟發(fā)機(jī)制結(jié)合最先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)來創(chuàng)建能夠?qū)W習(xí)和掌握各種挑戰(zhàn)性任務(wù)的代理人的能力。”
而且,如果不斷地輸給一個近乎完美的機(jī)器人對手,這對人類來說也并不是什么有趣的事。AlphaGo的粉絲它在圍棋上的統(tǒng)治力是一種解放。人類可以從中進(jìn)行學(xué)習(xí)。正如哈薩比斯所指出的那樣,完美都希望與更強(qiáng)的對手競賽,這一才能提升自己。
“阿爾法的游戲使我們感到解放,也就是說,沒有什么下法是不可能的”,專業(yè)的圍棋手周瑞羊說。 “現(xiàn)在每個人都試圖以一種以前沒有嘗試過的風(fēng)格來下棋。”
但是,AlphaGo的勝利并不完美。正如李世石曾經(jīng)說過的那樣,“機(jī)器人將永遠(yuǎn)不會像人類一樣體會到圍棋之美。”
他可能是正確。至少目前來看是,人類所感知的世界與機(jī)器所“看”到的世界是截然不同的。
不過,當(dāng)我們的目標(biāo)只是贏得比賽或者解決問題,上面的這些還重要嗎?拿無人車來說,也許有人會喜歡駕駛的愉悅,這種心情,機(jī)器肯定體會不到。但是,這是否意味著機(jī)器就不能更高效地運送乘客、減少交通擁堵、避免事故,消除路怒,甚至在不需要救護(hù)車的情況下把病人直接送到醫(yī)院?
并且,如果這件事確實如此重要的話,那么大師李世石所提到的“美”,也確實在AlphaGo中得到了體現(xiàn)。
樊麾就曾對AlphaGo與李世石比賽中第二盤的“第37步”念念不忘,“這不是人類會下出來的棋”,樊麾說,“我從來沒看到過有人走出這樣的棋,太美了。”
DeepMind 宣布的烏鎮(zhèn)圍棋人機(jī)對戰(zhàn)時間表:
第一天,5月23日,開幕式、柯潔與DeepMind比賽第一場、媒體會;
第二天,5月24日,未來AI論壇;
第三天,5月25日,柯潔比賽第二場,媒體會;
第四天,5月26日,組合對戰(zhàn),團(tuán)隊比賽,媒體會;
第五天,5月27日,柯潔比賽第三場,閉幕式。