圖為 上海創(chuàng)旗天下科技股份有限公司婁智超
一、數(shù)據爆發(fā)式增長帶來的機遇和挑戰(zhàn)
當前互聯(lián)網絡和流量爆發(fā)式增長,網絡視頻與直播用戶據統(tǒng)計超過5億或4億。隨著大流量內容的產生和企業(yè)管理成本的提高,互聯(lián)網產生的圖片和視頻內容都可能成為不良信息的載體。一旦得到傳播,將會造成非常嚴重的后果,甚至威脅到國家安全。
隨著政府對不良信息監(jiān)管力度的加強,每個網站和平臺都嚴肅的對待和處理這些危險因素,傳統(tǒng)人力審核的方式處理網絡上每天新增的圖片和視頻變成了不可能完成的任務。這里列舉兩方面:第一方面,對一些合法合規(guī)的有利于帶來流量的優(yōu)秀作品需要我們快速審核和推薦;另一方面,對侵權和違規(guī)需要盡快處置。圍繞這兩方面內容管控,內容管控能力已經成為企業(yè)快速發(fā)展的瓶頸,建設高效、可控的內容管控系統(tǒng)意義重大。
隨著網絡安全法以及相關法律條款的發(fā)布與實施,國家將加大對內容監(jiān)控的重視。現(xiàn)在我們看到的畫面是統(tǒng)計部分省份對比信息的處置情況,比如:山東網信辦依照法律條款規(guī)定,關閉了128家涉及到賭博類型的網站;黑龍江網信辦依法審批違規(guī)網站和帳號;河北開展網絡生態(tài)治理專項行動,依法依規(guī)查處35家違法違規(guī)網站;安徽省網信辦依法關閉41家違法違規(guī)網站。這只是列舉其中個別省份。
如今,內容安全面臨著嚴重的挑戰(zhàn),我這里主要總結了四點:第一,審計效率低下。采用人員審核的周期比較長、用戶體驗比較差。第二,人力成本提高。審核人員的招募、場地等費用的支出。第三,違規(guī)內容對企業(yè)的形象以及對企業(yè)正常經營的影響。第四,審查標準滯后。最新的審核標準如果不第一時間在審核團隊完全同步,那就會帶來違規(guī)內容的披露,造成不良影響。
二、當前內容審計現(xiàn)狀
網絡信息內容審計指的是針對信息管理系統(tǒng)進行審查,從中找出網絡信息內容存在的問題,并提出有效的問題解決方案。當前,增值電信企業(yè)審查的現(xiàn)狀,主要還是靠人力為主,機器為輔。
這個圖片截取了來自網絡上今日頭條、快手關于這方面人員招募的情況。比如,今日頭條招募審核人員,每天要審核1000條內容,快收招募3000團隊去審核相關的違規(guī)信息。
三、內容數(shù)據審計關鍵技術
面對嚴峻的挑戰(zhàn),上海創(chuàng)旗天下婁智超認為,在內容審計方面具有以下四大關鍵技術:
1、模式匹配算法
模式匹配主要是在審計系統(tǒng)利用多模式精準匹配和多模式相似匹配的算法,搜索出數(shù)據包中是否存在敏感模式串,并統(tǒng)計模式串出現(xiàn)的頻率,為后續(xù)的文本內容分析提供支持。
2、文本內容分析技術
文本內容分析在內容審計中有深度識別的可疑文本,同時發(fā)現(xiàn)當前信息流中熱點信息,當前文本內容分析技術大多數(shù)主要以詞語為基礎元素,構建文本模式,分析文本相似度,并采用類似等方法進行屬性的劃分。
3、不良圖像內容識別
現(xiàn)在不良圖片的主要信息多為色情信息的主要載體之一。圖片的識別屬于內容圖像過濾范疇,但又具有一定的獨特性,很難用簡單的模型把分析圖片的所有特征表現(xiàn)出來。但具體的圖像也有比較明確的特點,比如膚色裸露,簡單來說,不良圖片包括膚色檢測以及敏感特征提取技術。
4、流媒體視頻內容審計
網絡視頻內容豐富、感官性強等特點,已經成為不良信息在互聯(lián)網上傳播的主要方式之一。如果及時、準確的識別類似視頻流量,并采取有效的監(jiān)管措施,已經成為十分緊迫的信息。
審計內容需要對不良信息流量進行實時的監(jiān)測與阻斷,截止到目前沒有一個很好的有效審計的測試方法。現(xiàn)有的檢測方法主要是提取視頻完整的視頻文件幀圖像,然后采用不良圖片內容識別的方法進行檢測。
四、創(chuàng)旗內容管控解決方案
上海創(chuàng)旗天下婁智超在演講的現(xiàn)場,帶來了創(chuàng)旗的內容管控方案的違法和不良信息管控系統(tǒng):
1、智能備案監(jiān)管
域名/IP的備案監(jiān)測和管理。
2、AI多媒體識別
快速識別出多媒體中違規(guī)信息,并且對違規(guī)信息進行證據留存。
3、AI文本分析
識別出疑似的違規(guī)圖像、違規(guī)網頁,進行證據留存,增值電信企業(yè)可以在后續(xù)應用過程中問責,把網站違規(guī)存儲圖像存儲到設備的本地端,即使網站的主辦者第一時間把違規(guī)信息清除掉,但是違規(guī)信息存儲在我們的監(jiān)管設備,對我們后期取證提供了很好的保障。
同時,通過研發(fā)人員的調試優(yōu)化,創(chuàng)旗天下這套違法和不良信息管控系統(tǒng)可以做到以下幾個特點:
1、低成本
在考慮到企業(yè)成本的情況下,把企業(yè)支持硬件的利舊,降低投入成本50-80%,維護工時縮短70%-90%。
2、高性能
未備案發(fā)現(xiàn)率100%,封堵的準確率為99.99%
3、高準確性
比如文本、圖片、視頻,通過我們的調優(yōu),可以做到90%或者95%以上。
4、部署靈活
部署方式主要是采取旁路式部署,不改變業(yè)務狀況,支持彈性擴容,業(yè)務功能支持動態(tài)擴容。
創(chuàng)旗希望和各位多交流、合作,為建設綠色安全的網絡環(huán)境做出我們應有的義務。