圖為 百度云數(shù)據(jù)和媒體云總經(jīng)理連林江
ABC Inspire——質(zhì)到智的變革
連林江開場談到:“百度智能云2016年在業(yè)界首次提出了ABC三位一體戰(zhàn)略的云發(fā)展理念。在今天的百度云來看,云計算模式已經(jīng)進入Cloud 2.0時代,Cloud2.0的三大特征是:物理世界全面數(shù)字化、AI as Service、新型的體系架構(gòu)(IoT、邊緣計算、區(qū)塊鏈等)。技術(shù)在快速演進,像CDN技術(shù)從最早做簡單的傳輸加速,到動態(tài)加速,已經(jīng)再到今天融合邊緣計算的計算加速。當(dāng)前已經(jīng)進入視頻時代。百度智能云一直在做的就是整合好ABC核心技術(shù)能力,通過服務(wù)化、智能化和場景化提供CDN在內(nèi)的綜合視頻云平臺為這個時代賦能,從服務(wù)更多的流量和計算走向服務(wù)更好的效率和理解,希望能夠在新體驗、新用戶、新入口、新業(yè)態(tài)等方面幫助實現(xiàn)從質(zhì)到智的變革。今天互聯(lián)網(wǎng)視頻行業(yè)還在劇烈的整合變化中, 18年短視頻DAU已經(jīng)超過長視頻,直播行業(yè)在不斷洗牌;從各行各業(yè)中都可以看到視頻在不斷滲透,電商也好,教育也好,包括安防交通和傳統(tǒng)制造,這個變革正當(dāng)時。”
集合ABC能力的智能視頻平臺
百度智能云的智能視頻平臺是一個集合ABC能力,整合了內(nèi)容分發(fā)、核心編解碼、流媒體技術(shù)、視頻結(jié)構(gòu)化、視頻分析、視頻理解等核心技術(shù),涵蓋制作、再生產(chǎn)、上傳、存儲、分析、審核、轉(zhuǎn)碼、分發(fā)、播放全流程的一站式視頻平臺并具有較為完善的場景和行業(yè)解決方案。
圖為結(jié)合ABC能力的智能視頻平臺
智能視頻平臺首先依托于強大的百度ABC能力。云方面,強大的分布式存儲、計算、網(wǎng)絡(luò)基礎(chǔ)設(shè)施, 數(shù)十萬臺服務(wù)器、10G/25G的通用計算網(wǎng)絡(luò)接入;大數(shù)據(jù)方面,集采集、傳輸、清洗、分析、查詢、搜索、管理、治理為一體的大數(shù)據(jù)分析平臺,日處理百P。AI方面,158項AI通用能力,涵蓋語音、圖像、文字、場景、人體識別等多個場景。
可靠、高效的視頻基礎(chǔ)能力
連林江介紹到:“視頻基礎(chǔ)能力主要體現(xiàn)在視頻存儲、內(nèi)容分發(fā)、視頻處理三個方面。百度智能云的對象存儲具有萬億Object、EB級數(shù)據(jù)的大規(guī)模存儲能力,基于國內(nèi)首個自研的跨AZ冗余的EC編碼架構(gòu)技術(shù)達到服務(wù)的高可靠、高可用、高性能;在CDN產(chǎn)品上,百度智能云已經(jīng)擁有遍布海內(nèi)外的800+節(jié)點,百T帶寬儲備,能夠高質(zhì)量的服務(wù)于網(wǎng)頁、圖片、下載、點播、直播等多種加速場景;在視頻轉(zhuǎn)碼上,百度智能云支持倍速轉(zhuǎn)碼、多格式多協(xié)議,日處理媒資千萬以上。通過這些視頻基礎(chǔ)能力能夠?qū)崿F(xiàn)視頻高可靠存儲、高質(zhì)量處理、高體驗分發(fā)。”
“也通過這些核心能力,百度智能云也在今年春節(jié)幫助百度業(yè)務(wù)平穩(wěn)順滑地支撐了春晚紅包活動,成功通過了208億互動、100倍峰值的考驗。百度也成為首個春晚不宕機的互聯(lián)網(wǎng)公司”連林江特別強調(diào)。
講到很熱的邊緣計算,連林江表示:“邊緣計算從云架構(gòu)角度來說是算力的自然衍生。今天我們認為邊緣計算會對計算架構(gòu)產(chǎn)生非常大的影響,邊緣分成了物邊緣、移動邊緣、云邊緣。
在物邊緣和移動邊緣,2018年百度智能云在國內(nèi)首個開源了自研的邊緣計算平臺OpenEdge,并進入了Linux基金會,在Github好評全球第一。OpenEdge主要是為了貼合工業(yè)互聯(lián)網(wǎng)應(yīng)用,將計算能力拓展至用戶現(xiàn)場,提供臨時離線、低延時的計算服務(wù),包括消息路由、函數(shù)計算、AI推斷等。OpenEdge和云端管理套件配合使用,可達到云端管理和應(yīng)用下發(fā),邊緣設(shè)備上運行應(yīng)用的效果,滿足各種邊緣計算場景。
CDN作為云的邊緣,是算力強大的計算平臺,并且相對成熟。連林江表示:“我們在這方面其實已經(jīng)做了很多探索,也做了很多落地實踐。在技術(shù)和產(chǎn)品角度,首先把它虛擬化,容器化。在應(yīng)用場景上,我們在百度內(nèi)部已經(jīng)做了非常多的實踐,典型場景如百度網(wǎng)盤在邊緣進行文件實時加密處理,還有像AI/AR博物館、云游戲渲染、無人車車路協(xié)同進行邊緣計算、超高清安防監(jiān)控的邊緣視頻AI處理等等。這其中有很多場景是結(jié)合著5G,今天在百度有一個5G實驗床,像8K直播類應(yīng)用都在它上面跑。
視頻生產(chǎn)和處理核心能力
在視頻平臺的生產(chǎn)和處理方面,連林江介紹了兩項比較關(guān)鍵的核心技術(shù)。
“隨著視頻場景不斷深化、不斷創(chuàng)新,核心的一項技術(shù)是AR拍攝互動,背后是基于我們對人臉、肢體、空間識別的AI技術(shù)。”
這套技術(shù)已經(jīng)應(yīng)用在百度的視頻應(yīng)用上了,連林江表示:“今天我們已經(jīng)開放出來給大家使用,為視頻帶來更強的趣味性和互動性,增加視頻點擊率。像3D頭像、肢體游戲、指尖作畫可以實現(xiàn)更有趣的玩法;通過人臉、肢體、空間識別等AI能力可以實現(xiàn)更智能的特效;通過提供百款濾鏡、40多種動態(tài)貼紙以及合作伙伴構(gòu)成的素材生產(chǎn)生態(tài)鏈提供更全面的支持”
還有一項更重要的技術(shù)是智感超清。智感超清是百度智能云提供的一個集合了智能編碼、感官增強、超分辨率、高清畫質(zhì)支持等多種技術(shù)綜合的視頻處理產(chǎn)品。傳統(tǒng)編解碼和AI相結(jié)合,比如通過根據(jù)視頻復(fù)雜度學(xué)習(xí)出編碼參數(shù),實現(xiàn)智能自適應(yīng)編碼;通過深度學(xué)習(xí)分離出用戶更加感興趣的區(qū)域,實現(xiàn)基于ROI的碼率控制,這些能力在降低20%以上碼率的同時使得視頻更加清晰。在畫質(zhì)增強上,通過邊緣銳化和增強,色彩增強、人臉美顏等技術(shù)。使得人的主管觀影滿意度有了大幅提升。
百度也用這個技術(shù)攜手我國國家級電影檔案館——中國電影資料館共同修復(fù)紀錄片《解放了的中國》,并利用百度的流量優(yōu)勢幫助優(yōu)秀的經(jīng)典內(nèi)容更多呈現(xiàn)在大眾面前。
視頻AI核心技術(shù)和產(chǎn)品能力
接著連林江介紹了視頻AI的核心產(chǎn)品,他表示:“在視頻AI領(lǐng)域,百度一直是做的最全、能力最強、應(yīng)用最深的。比如我們在視頻理解領(lǐng)域大賽ActivityNet,人臉檢測和對比FDDB FLW大賽上都獲得過世界冠軍。在場景識別上能夠支持5000種分類,在物體識別上支持40000種,并能提取多大4000多種特征,這是百度智能云最核心的能力。”
在視頻審核方面通過對圖像、語音、文本等多模數(shù)據(jù)分析,能夠?qū)ι嬲?、涉黃、暴恐、違禁、廣告等多方面進行審核;借助視頻DNA和黑庫技術(shù),支持去重和侵權(quán)的檢測、促進視頻內(nèi)容健康分發(fā)。
從AI技術(shù)的應(yīng)用和實踐來說,今天我們也應(yīng)該認識到, AI還無法完全做到的普適通用化。這是為什么?連林江解釋道:“今天AI還是強關(guān)聯(lián)于場景和數(shù)據(jù),所以在很多細分場景中,我們還是需要基于特定的數(shù)據(jù)集進行AI模型的迭代和優(yōu)化。那么我們新提供給大家一個全流程的視頻AI生產(chǎn)工具平臺VideoMind,提供從數(shù)據(jù)標(biāo)注開始,到模型訓(xùn)練、模型評估、模型自動部署的全流程工具平臺,并可廣泛應(yīng)用于互娛、廣電、政企、銀行、安防、城管等行業(yè)。”
四大視頻解決方案
最后,連林江為大家介紹了4個重要的視頻智能解決方案。
首先是短視頻端到端解決方案,連林江表示:“今天做一個短視頻APP,除了后面的運營之外,你還要做大量的設(shè)計、服務(wù)端/客戶端的研發(fā)、音視頻編解碼等各項工作。我們希望能幫助你解決的問題是什么呢,是能夠最小化開發(fā)一個短視頻或者小視頻APP的工程和人力成本。通過我們提供的解決方案,只需要三步:1. 購買百度智能云BCC服務(wù)器,實施鏡像部署,2. 設(shè)置服務(wù)端配置文件并啟動程序;3. 設(shè)置客戶端配置文件,并啟動客戶端,即可完成一個短視頻APP。我們的目標(biāo)是5分鐘完成短視頻APP創(chuàng)建,敬請大家期待4月底我們官網(wǎng)的智能小視頻源代碼發(fā)布。”
其次是視頻智能生產(chǎn)解決方案,連林江表示:“基于百度十多項通用和專用的AI能力,結(jié)合非線編技術(shù),我們提供更簡單、更智能、更高效的全流程智能視頻生產(chǎn)解決方案。對于視頻編輯和再生產(chǎn)這樣的場景中,可以有效地幫助像新聞媒體、視頻網(wǎng)站、自媒體、品牌主這樣的客戶群體,提升視頻生產(chǎn)的效率。”
接著是視頻版權(quán)保護解決方案,連林江表示:“百度智能云今天推出的視頻版權(quán)保護解決方案基于4大優(yōu)勢,最大最全的監(jiān)測爬蟲庫、司法有效的的電子證據(jù)、絕對領(lǐng)先的超級鏈架構(gòu)、高準(zhǔn)召的媒體指紋技術(shù)?;谶@些優(yōu)勢實現(xiàn)原創(chuàng)視頻內(nèi)容的有效保護,該項的方案可以用版權(quán)存證、版權(quán)追溯、版權(quán)交易、版權(quán)檢測等多個方面。”
最后是視頻營銷解決方案,連林江表示:“大家知道營銷技術(shù)是百度最擅長的,這些技術(shù)加上廣告內(nèi)容的視頻AI,結(jié)合大數(shù)據(jù)技術(shù)實現(xiàn)內(nèi)容和人的更深理解和更好的匹配,實現(xiàn)最優(yōu)的營銷效果,希望通過這樣一套完整創(chuàng)新的視頻營銷解決方案解決視頻客戶在變現(xiàn)上的困難并提升變現(xiàn)效率”
“智”變未來
綜合以上,百度智能云的視頻云平臺具備全面、智能、創(chuàng)新的特點,為大家提供全場景一站式,不僅僅服務(wù)于百度內(nèi)部的視頻全矩陣產(chǎn)品,也服務(wù)于市場的數(shù)十萬的B端客戶。受益于廣大客戶和伙伴對我們的信任和支持,我們的視頻云持續(xù)取得了年收入環(huán)比增長3倍以上,流量增長4倍以上,CDN資源規(guī)模增長5倍以上的成績。廣泛服務(wù)于長視頻、短視頻、傳統(tǒng)媒體以及安防交通等廣大行業(yè)客戶。
今天,隨著5G時代的加速到來,可以看到和預(yù)想的是,新一輪技術(shù)和應(yīng)用的創(chuàng)新和變革正在不斷醞釀和發(fā)生,百度智能云希望能用自己對于行業(yè)和技術(shù)的理解和沉淀,為市場和用戶創(chuàng)造更多更大更新的價值。