人民網(wǎng)上海8月30日電 今天,“2017全球(上海)人工智能創(chuàng)新峰會(huì)”在上海徐匯西岸藝術(shù)中心舉行。中國科學(xué)院深圳先進(jìn)技術(shù)研究院副院長、香港中文大學(xué)教授湯曉鷗作了題為《人工智能的中國式文藝復(fù)興》的主題演講。
中國科學(xué)院深圳先進(jìn)技術(shù)研究院副院長、香港中文大學(xué)教授湯曉鷗(張瑋 攝)
演講全文實(shí)錄:
感謝組委會(huì)的邀請,我也非常榮幸有機(jī)會(huì)和我的老師Eric 同臺(tái)做報(bào)告。今天我要講的,其實(shí)和Eric一樣,想強(qiáng)調(diào)的是原創(chuàng)。原創(chuàng),需要長期的積累、大量的投入,而不是一夜之間突然我們就可以原創(chuàng)了。
說到原創(chuàng),可能大家都在看一部電影《戰(zhàn)狼2》,我沒有看,很難評價(jià)它好還是一般。但大家知道,它的票房已經(jīng)是53億,超過了《蜘蛛俠》《變形金剛》等等。這在幾十年前完全不可以想象,而且排行榜當(dāng)中很多的電影都是全球的票房收入,而《戰(zhàn)狼2》是靠中國一個(gè)國家的票房收入就做到了這點(diǎn)??梢宰龅竭@點(diǎn)有很多的原因,我不評價(jià),因?yàn)闆]有看過。但有一個(gè)必要的原因,就是二字——原創(chuàng)。
這個(gè)電影十多年前是否會(huì)發(fā)生這樣的情況?不會(huì)。那時(shí)候我們每人花不到1美元,可以在大街上買到任何的好萊塢大片,不會(huì)花十幾美元去電影院看這個(gè)電影,那時(shí)候不會(huì)有原創(chuàng)。所以長期以來,我們沒有自己的頂級電影創(chuàng)作。最近這些年,大家對原創(chuàng)技術(shù),對IP的尊重,對法律的維護(hù),我們才會(huì)有《戰(zhàn)狼2》這樣的電影。
說到電影,中國的電影發(fā)源地就是上海。像二三十年代的時(shí)候,上海的電影發(fā)展并不落后于全球。當(dāng)時(shí)我們在文藝創(chuàng)作上,很多導(dǎo)演都是非常非常有名。我也無法講他們?yōu)槭裁磿?huì)做得這么好,大概還是對原創(chuàng)、對IP的尊重,所以當(dāng)時(shí)才會(huì)發(fā)展得這么好。很高興,今天又恢復(fù)到那樣的時(shí)代,我們的電影又重新崛起了。
上海,肯定不僅是電影文化的發(fā)源地,也是現(xiàn)代文化的發(fā)源地。不僅是電影,比如中國的商務(wù)印書館,100多年前就創(chuàng)建了,也是標(biāo)志著上海的現(xiàn)代文化開始。這里面有很多原創(chuàng)的東西,我們知道大作家包括魯迅等非常有名的學(xué)者,他們寫了很多的文章、小說,那時(shí)候如果他們沒有版權(quán),相信他們也活不下去。原創(chuàng)也很重要。
今天我為什么要講文藝復(fù)興,14到17世紀(jì)它真正的起來,有政治的原因、宗教的原因,各種各樣的原因,但有一個(gè)必要條件,也是對原創(chuàng)的尊重。因?yàn)橛辛诉@些,才有了但丁、達(dá)芬奇、米開朗基羅、拉斐爾、莎士比亞等一系列非常優(yōu)美的藝術(shù)品。最后這個(gè)作品大家可能會(huì)有一些疑問,說文藝復(fù)興時(shí)候好像沒有見過這個(gè)作品,這是我非常尊敬的現(xiàn)代藝術(shù)家的現(xiàn)代藝術(shù)作品,這個(gè)作品叫紙上談兵,是藝術(shù)家彈琴,坐在一卷手紙上,非常原創(chuàng)。我實(shí)在編不下去了,其實(shí)這是我兒子的作品,主要還是想強(qiáng)調(diào)原創(chuàng)的價(jià)值。
今天的人工智能,我們總是聽到Google的聲音,聽到AlphaGo、自動(dòng)駕駛等方面的事情,為什么總是聽到Google的聲音?Google前幾年,一年的研發(fā)投入是120億美金,這是燒掉的,不是整個(gè)公司的日常運(yùn)營花費(fèi),正因?yàn)檫@樣,才會(huì)有AlphaGo、自動(dòng)駕駛等技術(shù)。2014年就愿意付6.6億美金買初創(chuàng)的公司,這個(gè)公司只有6個(gè)人,沒有任何的產(chǎn)品落地,就是用深度學(xué)習(xí)在玩游戲、下棋。他們會(huì)花這么高的價(jià)格來買這樣的一家公司。如果在我們中國的商業(yè)環(huán)境下,我們花100萬美金挖人,這樣肯定經(jīng)濟(jì)效益更好。但是,就不會(huì)有后來的AlphaGo了。他們愿意投入,就是對原創(chuàng)技術(shù)、對人才的尊重,才會(huì)有后面的AlphaGo。Facebook也是2013年左右,深度學(xué)習(xí)剛剛起來沒多久,大量投入深度學(xué)習(xí)實(shí)驗(yàn)室。
Eric提到了Mobileye,英特爾愿意花150億美金收購這樣的公司,其實(shí)沒有什么,就是一伙人,一個(gè)教授帶一群學(xué)生做研究。他們花錢收購,而不是挖人。
非常熟悉AlphaGo,在AlphaGo之前我和大家講深度學(xué)習(xí),沒有人會(huì)聽,也沒有投資人關(guān)心。但是這盤棋下完之后,投資人回過頭和我講什么叫深度學(xué)習(xí)。這在全球引起了巨大的轟動(dòng),因?yàn)閲暹@件事,是腦力勞動(dòng)非常強(qiáng)的活動(dòng),機(jī)器可以戰(zhàn)勝人類,并不是說機(jī)器無比聰明。為什么機(jī)器可以下棋?是我們定義的任務(wù),我們讓它做下棋這件事。它所做的訓(xùn)練都是基于棋譜,所以它不會(huì)想控制人類這件事,它的任務(wù)是人類定義的。所以,短期我們不用擔(dān)心,長期也不用擔(dān)心機(jī)器人控制人類這件事。真正轟動(dòng)的效果是它的創(chuàng)新和深度學(xué)習(xí)的算法巨大的進(jìn)步,在全球引起了大量的報(bào)道。
緊接著在中國做了一個(gè)AlphaGo2,和柯潔下了一盤棋,也下得非常精彩,值得大家關(guān)注,也會(huì)有一些新的技術(shù)出來。那周,媒體鋪天蓋地都是報(bào)道。但你看雅虎、國外的網(wǎng)站,會(huì)有一些報(bào)道,但報(bào)道一下就可以了,不是大家都靠這個(gè)活著。為什么?因?yàn)檫@是AlphaGo2。做原創(chuàng),第一個(gè)做這件事的最重要。等窗戶紙捅破了,捅第二下不那么重要了,你已經(jīng)知道房間里面發(fā)生什么事情了。
再看一個(gè)地圖,Deep learning的搜索次數(shù),顏色深代表搜索的次數(shù)多,淺的代表搜索次數(shù)少。中國對這個(gè)詞的搜索量最大。這是谷歌的搜索結(jié)果,谷歌在中國,老百姓是搜不了的,你要翻墻,這大概只有做技術(shù)的人才知道怎么做。翻墻的搜索量比全球的搜索量高很多了,可以想像這在中國有多熱。但是為什么這么熱?因?yàn)槲覀儾欢?,我們這么多年沒有做原創(chuàng)技術(shù)。中國有句成語“不明覺厲”,因?yàn)槟悴恢涝趺椿厥虏庞X得厲害。知道,還有一句話是“文人相輕”,你是文人,你知道他的水平和深度,互相之間會(huì)不服氣。
前段時(shí)間Amamzon、IBM、谷歌、微軟等組成了人工智能的聯(lián)盟,當(dāng)時(shí)我們覺得國外人工智能的發(fā)展已經(jīng)非常非常超前了。這么熱,我們?nèi)绾胃偁??Eric剛才講了人工智能,這應(yīng)該是全球的合作,是共贏。合作是雙方都要做事情的,是雙方平等的合作,不是說別人做了,你把它拿過來用,然后賺錢,這不是合作,叫盜版。
人工智能,我們是否落得很遠(yuǎn)?我從我們公司做的事情來講一下,我們現(xiàn)在處于什么階段。人工智能的發(fā)展歷史我就不講了,幾起幾落,前面的學(xué)者已經(jīng)總結(jié)過了。真正的落實(shí)是2011年,深度學(xué)習(xí)算法在語音識別方面取得重大突破。后來才有了2013年谷歌、Facebook的大量投入,到現(xiàn)在的直線上升。
2011年我們開始做深度學(xué)習(xí),當(dāng)時(shí)應(yīng)該是最大的華人團(tuán)隊(duì)。2011到2013年全球最頂級的三次相關(guān)會(huì)議,29篇文章涉及到深度學(xué)習(xí),14篇由我們一個(gè)實(shí)驗(yàn)室做的,做了全球的一半。
最近兩年,谷歌、Facebook開源了AI平臺(tái),相當(dāng)于AI的操作系統(tǒng)。我們最早的時(shí)候沒有Torch等,我們經(jīng)過多年的研究,做出Parrots系統(tǒng),我們把幾百塊的CPU連接起來。訓(xùn)練了1207層的深度學(xué)習(xí)網(wǎng)絡(luò),林教授領(lǐng)銜在做,他是Eric三年前畢業(yè)的博士生。
我們和Facebook、Google競爭的例子,就是人臉識別。2014年Facebook發(fā)表了文章,我們同一時(shí)間發(fā)表了另外一篇文章,搶在Facebook之前,第一個(gè)用計(jì)算機(jī)做人臉識別超過人的眼睛。這其實(shí)和AlphaGo一樣的事情,在人類定義的一項(xiàng)任務(wù)上,機(jī)器超過了人類。我們當(dāng)時(shí)用了20萬的人臉數(shù)據(jù)做的。平時(shí)做研究,一兩萬的人臉數(shù)據(jù)就很了不起了。用了20萬的人臉數(shù)據(jù),我們覺得我們會(huì)碾壓所有的人。還沒有開始碾壓,發(fā)現(xiàn)Facebook用了750萬的數(shù)據(jù),數(shù)據(jù)量上把我們碾壓了。但是計(jì)算的結(jié)果,我們超過了他們,連做了3、4個(gè)算法,最后做到了99.5%,戰(zhàn)勝Facebook。在中國,就會(huì)出現(xiàn)大批的公司重現(xiàn)實(shí)現(xiàn)一下算法,開始落地。
Imagenet,2012年有很大的突破。2014年是最大的一次比賽,38個(gè)團(tuán)隊(duì),包括Google、伯克利、牛津等實(shí)驗(yàn)室都參加,我們?nèi)〉昧巳虻诙?,輸給了Google。當(dāng)然,Google也是競賽的組織者,我們贏他也比較難。
2015到2016年,ICCV、CVPR、ECCV三個(gè)頂級世界會(huì)議上發(fā)表的文章數(shù)量。微軟124篇,商湯和我們實(shí)驗(yàn)室一起76篇,我們是整個(gè)亞洲唯一前20名的團(tuán)隊(duì)。
最后三位是百度、阿里、騰訊,三家的估值超過了9000億美金。三家公司加起來的文章數(shù)是13篇。你想用AI作為你的未來,要投入,要做原創(chuàng),而不是拿來的。我們?nèi)〉玫倪@些成績,也得到了國際上的承認(rèn)。
我們非常榮幸,和MIT、伯克利、谷歌等實(shí)驗(yàn)室,被評為前十大人工智能實(shí)驗(yàn)室,我們是整個(gè)亞洲唯一的代表。我講的這些是學(xué)術(shù)上的研究和成績。如果只有這些,其實(shí)我們沒有數(shù)據(jù),沒有應(yīng)用,我們的人也很少。一開始,會(huì)搶跑一下,領(lǐng)先一下,長時(shí)間的競爭我們無法戰(zhàn)勝Google這樣高投入的公司。我們也要落地,很幸運(yùn),通過積累,我們現(xiàn)在有120位深度學(xué)習(xí)的博士,核心人員體量和Facebook、Google差不多,我們是唯一一個(gè)深度學(xué)習(xí)平臺(tái)公司。非常榮幸,這次《華爾街日報(bào)》報(bào)道我們單輪融資取得最大一筆AI的創(chuàng)業(yè)公司融資,4.1億美金。以前是我們幾千萬美金,打一場看起來沒有希望的戰(zhàn)爭,現(xiàn)在我們補(bǔ)充進(jìn)了彈藥。到今天有400多家頂級的大型客戶,包括中國移動(dòng),包括銀聯(lián),包括華為等巨型公司。400家公司意味著過去一年半的時(shí)間,每天簽約一家公司。我們用人臉識別在做芯片、醫(yī)療、自動(dòng)駕駛、金融等14個(gè)行業(yè)的研發(fā),和14個(gè)行業(yè)的合作伙伴合作,我們會(huì)反饋回來大量的應(yīng)用需求,形成完整的閉環(huán)、正循環(huán)。很高興,得到了國家的承認(rèn)。去年的雙創(chuàng)活動(dòng)中,很榮幸和百度被選為代表中國人工智能的企業(yè),參加北京地區(qū)的展覽。
最后還是用一部電影來結(jié)束演講。我這個(gè)年齡,對《上甘嶺》是很了解的,當(dāng)時(shí)打的最后一場戰(zhàn)斗,也就是一個(gè)連。我們120個(gè)博士,也差不多就是這樣的人數(shù)。如果我們再守不住“上甘嶺”,人工智能的“三八線”也就基本結(jié)束,謝謝大家!