中國工程院院士丁文華：數字創意技術發展方向與未來產業的機會

5G寬帶張曉寶 2023-08-30 10:44 閱讀 10,077 來源：DVBCN 　

8月22日，以“融合創新面向未來”為主題的第三十屆北京國際廣播電影電視展覽會(BIRTV2023)）——主題報告會成功舉行，中國工程院院士丁文華會上做了關于《數字創意技術發展》的主題報告。

中國工程院院士丁文華：數字創意技術發展方向與未來產業的機會-DVBCN

2016年，國務院發布了《“十三五”國家戰略性新興產業發展規劃》，其中就新增了“數字創意”的內容，涉及到了有數字文化創意技術裝備創新提升工程、數字內容創新發展工程、創新設計發展工程。在2018年國家統計局發布的《戰略性新興產業分類（2018）》中，又確定了統計涉及有數字創意的口徑和產品服務。

根據統計數據，2022年全國規模以上文化及相關產業企業營業收入達12.18萬億元，按可比口徑計算，比上年增長0.9%。數字創意產業所涉及的學科包括有計算機科學與技術、信息與通信工程、電子科學與技術、光學工程、控制科學與工程、網絡空間安全、人工智能等等，包含了數字內容的生產、傳播和呈現端到端全部環節的核心技術，數字創意技術也是實現超高清、元宇宙等典型媒體應用的重要支撐。

LLM具備文本邏輯推理、上下文理解、多輪對話能力，使得AI產生了通用性的文本創作能力，已超過原有的搜索(知識問答)，標志著AGI的誕生。而AGI大模型可基于一個模型適配多業務場景，模型參數大，能學習海量數據知識，泛化能力強，可實現基于人類反饋的強化學習。AIGC正在改變數字內容的生成方式，特別是當前AI作畫、AI創作視頻的持續發展應用，但AI Hyper Connection才是未來的目標。

當前，數字人的構建也相當火爆，傳統的數字人構建方法中，需要基于全身的3D掃描，其建模數據量是巨大的，MC驅動也要依靠真人的“動作+表情”以實現捕捉，還有著正向渲染、弱交互能力等缺陷。而面向未來基于AI的數字人構建方法中，其可以實現多角度照片替代全身掃描，通過“已有建模模型+AI”可逼近真人效果，驅動則是基于“表情基+指定動作基”可實現，支持逆向渲染+正向渲染+交互的多種方式，基于大模型的具身交互能力。

中國工程院院士丁文華：數字創意技術發展方向與未來產業的機會-DVBCN

在計算機視覺效果引擎及平臺技術方面，當前主要依托于像Epic的Unreal Engine平臺及英偉達的Omniverse平臺等，因此，需要面向高效高質的數字環境、數字人、數字物件構建屬于我們的數字對象的技術支撐平臺，需要構建基于虛擬世界“互聯互通+相互融合”的支撐技術。

專用視頻編解碼技術當前已經極為成熟了，未來更需要面向內容和對象的視頻編碼，例如能提供AR遠程交互會議模式，也需要元宇宙中的語義編碼，如能涉及到矢量化全集傳輸+終端的按需局部呈現等，另外也要有下一代的圖像編碼，涉及有光場、全息編碼技術，以及多模態協同編碼等。

在XR近眼顯示技術方面，當前的VR顯示已可達到4K的量級，像今年蘋果公司新發布的Apple Vision Pro，其單眼顯示為3644*3144（也就是4K），交互性方面已能支持眼動追蹤、手勢追蹤、聲音控制，圖像處理方面具備Foveated Renderer，支持孿生數字人實時交互能力。

面向未來的話，AR眼睛將成為大眾型的入口終端，可以基于AR眼鏡透視（See Through）能力打造“前端多媒體信息增強+后臺智能化云端處理”。也就是說，在前端“眼鏡呈現+手機算力”能否提供豐富增強信息體驗，而后臺云平臺則能結合AI大模型解決跨模態信息即時生成的過程。

車載領域，工信部方面有提到，要啟動智能網聯汽車準入和上路通行試點，組織開展城市級“車路云一體化”示范應用，支持有條件的L3及更高級別的自動駕駛功能商業化應用。因此，未來自動駕駛也有望向“L3+”方向發展。而智能座艙則可打造為“第三空間”，其中涉及的車載信息娛樂系統、基于車聯網的娛樂信息分發、數據廣播、駕駛員感知等方面，也將是未來的信息通信及廣電傳媒等都將能涉及的領域。

最后，丁文華表示，數字創意與人工智能、元宇宙等前沿技術緊密結合，具備廣闊的產業應用前景。數字創意也具有顯著的學科交融特性，僅靠單一學科是無法滿足發展要求的，需要形成跨學科聯動研究。此外，數字創意的研究方向覆蓋廣泛，應抓住時間盡早布局共性關鍵技術研究，推動產業向前發展。