8月22日,以“融合創新 面向未來”為主題的第三十屆北京國際廣播電影電視展覽會(BIRTV2023))——主題報告會成功舉行,中國工程院院士丁文華會上做了關于《數字創意技術發展》的主題報告。
2016年,國務院發布了《“十三五”國家戰略性新興產業發展規劃》,其中就新增了“數字創意”的內容,涉及到了有數字文化創意技術裝備創新提升工程、數字內容創新發展工程、創新設計發展工程。在2018年國家統計局發布的《戰略性新興產業分類(2018)》中,又確定了統計涉及有數字創意的口徑和產品服務。
根據統計數據,2022年全國規模以上文化及相關產業企業營業收入達12.18萬億元,按可比口徑計算,比上年增長0.9%。數字創意產業所涉及的學科包括有計算機科學與技術、信息與通信工程、電子科學與技術、光學工程、控制科學與工程、網絡空間安全、人工智能等等,包含了數字內容的生產、傳播和呈現端到端全部環節的核心技術,數字創意技術也是實現超高清、元宇宙等典型媒體應用的重要支撐。
LLM具備文本邏輯推理、上下文理解、多輪對話能力,使得AI產生了通用性的文本創作能力,已超過原有的搜索(知識問答),標志著AGI的誕生。而AGI大模型可基于一個模型適配多業務場景,模型參數大,能學習海量數據知識,泛化能力強,可實現基于人類反饋的強化學習。AIGC正在改變數字內容的生成方式,特別是當前AI作畫、AI創作視頻的持續發展應用,但AI Hyper Connection才是未來的目標。
當前,數字人的構建也相當火爆,傳統的數字人構建方法中,需要基于全身的3D掃描,其建模數據量是巨大的,MC驅動也要依靠真人的“動作+表情”以實現捕捉,還有著正向渲染、弱交互能力等缺陷。而面向未來基于AI的數字人構建方法中,其可以實現多角度照片替代全身掃描,通過“已有建模模型+AI”可逼近真人效果,驅動則是基于“表情基+指定動作基”可實現,支持逆向渲染+正向渲染+交互的多種方式,基于大模型的具身交互能力。
在計算機視覺效果引擎及平臺技術方面,當前主要依托于像Epic的Unreal Engine平臺及英偉達的Omniverse平臺等,因此,需要面向高效高質的數字環境、數字人、數字物件構建屬于我們的數字對象的技術支撐平臺,需要構建基于虛擬世界“互聯互通+相互融合”的支撐技術。
專用視頻編解碼技術當前已經極為成熟了,未來更需要面向內容和對象的視頻編碼,例如能提供AR遠程交互會議模式,也需要元宇宙中的語義編碼,如能涉及到矢量化全集傳輸+終端的按需局部呈現等,另外也要有下一代的圖像編碼,涉及有光場、全息編碼技術,以及多模態協同編碼等。
在XR近眼顯示技術方面,當前的VR顯示已可達到4K的量級,像今年蘋果公司新發布的Apple Vision Pro,其單眼顯示為3644*3144(也就是4K),交互性方面已能支持眼動追蹤、手勢追蹤、聲音控制,圖像處理方面具備Foveated Renderer,支持孿生數字人實時交互能力。
面向未來的話,AR眼睛將成為大眾型的入口終端,可以基于AR眼鏡透視(See Through)能力打造“前端多媒體信息增強+后臺智能化云端處理”。也就是說,在前端“眼鏡呈現+手機算力”能否提供豐富增強信息體驗,而后臺云平臺則能結合AI大模型解決跨模態信息即時生成的過程。
車載領域,工信部方面有提到,要啟動智能網聯汽車準入和上路通行試點,組織開展城市級“車路云一體化”示范應用,支持有條件的L3及更高級別的自動駕駛功能商業化應用。因此,未來自動駕駛也有望向“L3+”方向發展。而智能座艙則可打造為“第三空間”,其中涉及的車載信息娛樂系統、基于車聯網的娛樂信息分發、數據廣播、駕駛員感知等方面,也將是未來的信息通信及廣電傳媒等都將能涉及的領域。
最后,丁文華表示,數字創意與人工智能、元宇宙等前沿技術緊密結合,具備廣闊的產業應用前景。數字創意也具有顯著的學科交融特性,僅靠單一學科是無法滿足發展要求的,需要形成跨學科聯動研究。此外,數字創意的研究方向覆蓋廣泛,應抓住時間盡早布局共性關鍵技術研究,推動產業向前發展。