7月9日,全球人工智能與機器人峰會(CCF-GAIR)在深圳舉辦。商湯科技執行研發總監林倞出席峰會CV+專場,并發表題為“深度驅動的人工智能:從學術創新到產業落地”的演講。林倞在演講中表示,深度學習將帶來將各項人工智能技術的突破,新一輪的科技革命蓄勢待發,而商湯科技希望通過原創技術,用AI推動產業升級。
商湯科技執行研發總監林倞
同時,林倞進一步表示,技術研發應走出實驗室,在產品落地的實踐中發現問題、定義問題、解決問題,例如商湯科技兩年前在業內率先推出的106點位原創技術,該技術能夠讓人臉面部輪廓及各個部位的定位更加精確。同時,商湯科技迅速將技術轉化為產品解決方案,驅動了人臉識別在娛樂、拍照、商業等多場景中的大范圍應用,進而推動該技術成為業內標準。另一方面,技術在行業的落地,能夠帶來大量的數據反哺,令算法突破與應用場景循環打通形成閉環,通過不斷實踐實現技術演進。
深度學習三大核心要素打造關鍵性技術創新
林倞介紹,商湯科技一直以來都在圍繞算法研究、高性能計算和大數據三個深度學習的核心要素進行關鍵性技術創新,專注打造深度學習平臺,進而構建人工智能、大數據分析行業解決方案。
在高性能算法層面,商湯科技提出高效、可拓展、靈活性的框架,覆蓋從算法、硬件平臺到軟件框架的設計能力;同時商湯科技還建設大規模GPU計算集群,“我們的超算能力來自于超過 2600 塊NVIDIA GPU的計算芯片,是國內新銳AI公司規模最大的。”林倞介紹道。
此外,商湯科技極為強調深度學習能力,為此自主研發的深度學習庫PPL,在X86、ARM或者CUDA等不同的處理器架構上,相比第三方開源平臺庫都有較明顯的優勢。
大數據如今已經成為現代科技的基礎設施,“我們在大數據方面有著深厚的積累,為技術創新提供了基礎保障”,林倞表示,“判斷一家企業是否為真正的人工智能企業,需要看其是否有專門的團隊進行數據標注,而商湯科技在這方面擁有超過300人的全職數據結構化標注團隊。”
基于以上高性能算法和深厚的大數據能力,商湯科技在新一代深度學習、人物關鍵點定位算法、文字檢測與識別、視頻標注與內容理解、幾何與深度估計、強化學習與機器人等幾個方面取得了算法研究的突破性進展。
林倞還特別提到,在人臉識別領域,標注點的數量是數據質量的一個關鍵指標。“一般來說,數據中的特征點越多,識別率越準確。”林倞表示,通過106人臉關鍵點,可以獲取細微的面部結構信息,并在復雜的交互場景中供面部特效和美顏等功能調用,106點的識別準度到達99%,目前已被認為是行業標準方案。
人工智能產業化落地 促進成熟產業效率提升
經濟學家曾指出,幾十年來,依靠資源投入的數量型增長,受資本邊際收益遞減規律的作用,已現乏力;依靠技術投入的效率型增長,才是經濟可持續發展的保障。未來中國經濟的大發展必將依賴于科學技術與成熟產業疊加所帶來的效率提升。
在技術與產業結合方面,林倞介紹,目前商湯科技人工智能各項技術的觸角延伸至智慧安防、智慧金融、智慧商業、智慧家居、機器人以及無人駕駛、虛擬增強現實等領域,正在逐步加快推動學術與產業的結合。
在安防-智慧城市領域,商湯科技實現了在監控環境下對精細化的人車屬性、層次結構、運動信息的分析并且進行結構化存儲,讓大量的視頻數據和圖像數據能夠有效檢索查詢。林倞認為,安防行業也將對交通行業產生廣泛深刻的影響,將會推動下一個變革。
以商湯科技的SenseFace系統為例,它能夠通過預測跟蹤可疑目標,實現“人臉天網”。商湯科技的SenseVideo,能夠在視頻監控以及輔助駕駛場景中,準確找出行人和車輛并分析其屬性。
在金融領域,商湯科技主要針對金融行業實名認證的難點進行了布局,通過精確的算法,實現智能、自動化認證。以中國移動為例,接入商湯團隊的人臉識別技術后,為數億人提供了實名認證服務。
在移動互聯網領域,通過人臉關鍵點定位、SLAM等技術的應用,商湯科技實現增強現實和3D增強現實、雙攝拍照增強,提高了產品實用性及娛樂性。當前非常流行的Faceu應用,就是源于商湯自主研發的增強現實感引擎,實現了易用、精準的面部特效,并在發布后取得了AppStore免費榜第一名的好成績。
身為商湯科技執行研發總監,林倞最希望看到的就是通過人工智能技術研發創新與產品落地,不斷推動產業升級,為人們的生活與社會進步帶來更多的價值,而這也是商湯科技一直以來努力的方向。業內人士認為,正是這樣的理念,驅動著商湯科技在人工智能領域飛速馳騁,快速成長為機器視覺領域的標桿企業。