上海創(chuàng)旗天下婁智超:內(nèi)容管控能力成為增值電信企業(yè)新競(jìng)爭(zhēng)力

圖為 上海創(chuàng)旗天下科技股份有限公司婁智超
一、數(shù)據(jù)爆發(fā)式增長(zhǎng)帶來(lái)的機(jī)遇和挑戰(zhàn)
當(dāng)前互聯(lián)網(wǎng)絡(luò)和流量爆發(fā)式增長(zhǎng),網(wǎng)絡(luò)視頻與直播用戶據(jù)統(tǒng)計(jì)超過(guò)5億或4億。隨著大流量?jī)?nèi)容的產(chǎn)生和企業(yè)管理成本的提高,互聯(lián)網(wǎng)產(chǎn)生的圖片和視頻內(nèi)容都可能成為不良信息的載體。一旦得到傳播,將會(huì)造成非常嚴(yán)重的后果,甚至威脅到國(guó)家安全。
隨著政府對(duì)不良信息監(jiān)管力度的加強(qiáng),每個(gè)網(wǎng)站和平臺(tái)都嚴(yán)肅的對(duì)待和處理這些危險(xiǎn)因素,傳統(tǒng)人力審核的方式處理網(wǎng)絡(luò)上每天新增的圖片和視頻變成了不可能完成的任務(wù)。這里列舉兩方面:第一方面,對(duì)一些合法合規(guī)的有利于帶來(lái)流量的優(yōu)秀作品需要我們快速審核和推薦;另一方面,對(duì)侵權(quán)和違規(guī)需要盡快處置。圍繞這兩方面內(nèi)容管控,內(nèi)容管控能力已經(jīng)成為企業(yè)快速發(fā)展的瓶頸,建設(shè)高效、可控的內(nèi)容管控系統(tǒng)意義重大。
隨著網(wǎng)絡(luò)安全法以及相關(guān)法律條款的發(fā)布與實(shí)施,國(guó)家將加大對(duì)內(nèi)容監(jiān)控的重視。現(xiàn)在我們看到的畫(huà)面是統(tǒng)計(jì)部分省份對(duì)比信息的處置情況,比如:山東網(wǎng)信辦依照法律條款規(guī)定,關(guān)閉了128家涉及到賭博類型的網(wǎng)站;黑龍江網(wǎng)信辦依法審批違規(guī)網(wǎng)站和帳號(hào);河北開(kāi)展網(wǎng)絡(luò)生態(tài)治理專項(xiàng)行動(dòng),依法依規(guī)查處35家違法違規(guī)網(wǎng)站;安徽省網(wǎng)信辦依法關(guān)閉41家違法違規(guī)網(wǎng)站。這只是列舉其中個(gè)別省份。
如今,內(nèi)容安全面臨著嚴(yán)重的挑戰(zhàn),我這里主要總結(jié)了四點(diǎn):第一,審計(jì)效率低下。采用人員審核的周期比較長(zhǎng)、用戶體驗(yàn)比較差。第二,人力成本提高。審核人員的招募、場(chǎng)地等費(fèi)用的支出。第三,違規(guī)內(nèi)容對(duì)企業(yè)的形象以及對(duì)企業(yè)正常經(jīng)營(yíng)的影響。第四,審查標(biāo)準(zhǔn)滯后。最新的審核標(biāo)準(zhǔn)如果不第一時(shí)間在審核團(tuán)隊(duì)完全同步,那就會(huì)帶來(lái)違規(guī)內(nèi)容的披露,造成不良影響。
二、當(dāng)前內(nèi)容審計(jì)現(xiàn)狀
網(wǎng)絡(luò)信息內(nèi)容審計(jì)指的是針對(duì)信息管理系統(tǒng)進(jìn)行審查,從中找出網(wǎng)絡(luò)信息內(nèi)容存在的問(wèn)題,并提出有效的問(wèn)題解決方案。當(dāng)前,增值電信企業(yè)審查的現(xiàn)狀,主要還是靠人力為主,機(jī)器為輔。
這個(gè)圖片截取了來(lái)自網(wǎng)絡(luò)上今日頭條、快手關(guān)于這方面人員招募的情況。比如,今日頭條招募審核人員,每天要審核1000條內(nèi)容,快收招募3000團(tuán)隊(duì)去審核相關(guān)的違規(guī)信息。
三、內(nèi)容數(shù)據(jù)審計(jì)關(guān)鍵技術(shù)
面對(duì)嚴(yán)峻的挑戰(zhàn),上海創(chuàng)旗天下婁智超認(rèn)為,在內(nèi)容審計(jì)方面具有以下四大關(guān)鍵技術(shù):
1、模式匹配算法
模式匹配主要是在審計(jì)系統(tǒng)利用多模式精準(zhǔn)匹配和多模式相似匹配的算法,搜索出數(shù)據(jù)包中是否存在敏感模式串,并統(tǒng)計(jì)模式串出現(xiàn)的頻率,為后續(xù)的文本內(nèi)容分析提供支持。
2、文本內(nèi)容分析技術(shù)
文本內(nèi)容分析在內(nèi)容審計(jì)中有深度識(shí)別的可疑文本,同時(shí)發(fā)現(xiàn)當(dāng)前信息流中熱點(diǎn)信息,當(dāng)前文本內(nèi)容分析技術(shù)大多數(shù)主要以詞語(yǔ)為基礎(chǔ)元素,構(gòu)建文本模式,分析文本相似度,并采用類似等方法進(jìn)行屬性的劃分。
3、不良圖像內(nèi)容識(shí)別
現(xiàn)在不良圖片的主要信息多為色情信息的主要載體之一。圖片的識(shí)別屬于內(nèi)容圖像過(guò)濾范疇,但又具有一定的獨(dú)特性,很難用簡(jiǎn)單的模型把分析圖片的所有特征表現(xiàn)出來(lái)。但具體的圖像也有比較明確的特點(diǎn),比如膚色裸露,簡(jiǎn)單來(lái)說(shuō),不良圖片包括膚色檢測(cè)以及敏感特征提取技術(shù)。
4、流媒體視頻內(nèi)容審計(jì)
網(wǎng)絡(luò)視頻內(nèi)容豐富、感官性強(qiáng)等特點(diǎn),已經(jīng)成為不良信息在互聯(lián)網(wǎng)上傳播的主要方式之一。如果及時(shí)、準(zhǔn)確的識(shí)別類似視頻流量,并采取有效的監(jiān)管措施,已經(jīng)成為十分緊迫的信息。
審計(jì)內(nèi)容需要對(duì)不良信息流量進(jìn)行實(shí)時(shí)的監(jiān)測(cè)與阻斷,截止到目前沒(méi)有一個(gè)很好的有效審計(jì)的測(cè)試方法。現(xiàn)有的檢測(cè)方法主要是提取視頻完整的視頻文件幀圖像,然后采用不良圖片內(nèi)容識(shí)別的方法進(jìn)行檢測(cè)。
四、創(chuàng)旗內(nèi)容管控解決方案
上海創(chuàng)旗天下婁智超在演講的現(xiàn)場(chǎng),帶來(lái)了創(chuàng)旗的內(nèi)容管控方案的違法和不良信息管控系統(tǒng):
1、智能備案監(jiān)管
域名/IP的備案監(jiān)測(cè)和管理。
2、AI多媒體識(shí)別
快速識(shí)別出多媒體中違規(guī)信息,并且對(duì)違規(guī)信息進(jìn)行證據(jù)留存。
3、AI文本分析
識(shí)別出疑似的違規(guī)圖像、違規(guī)網(wǎng)頁(yè),進(jìn)行證據(jù)留存,增值電信企業(yè)可以在后續(xù)應(yīng)用過(guò)程中問(wèn)責(zé),把網(wǎng)站違規(guī)存儲(chǔ)圖像存儲(chǔ)到設(shè)備的本地端,即使網(wǎng)站的主辦者第一時(shí)間把違規(guī)信息清除掉,但是違規(guī)信息存儲(chǔ)在我們的監(jiān)管設(shè)備,對(duì)我們后期取證提供了很好的保障。
同時(shí),通過(guò)研發(fā)人員的調(diào)試優(yōu)化,創(chuàng)旗天下這套違法和不良信息管控系統(tǒng)可以做到以下幾個(gè)特點(diǎn):
1、低成本
在考慮到企業(yè)成本的情況下,把企業(yè)支持硬件的利舊,降低投入成本50-80%,維護(hù)工時(shí)縮短70%-90%。
2、高性能
未備案發(fā)現(xiàn)率100%,封堵的準(zhǔn)確率為99.99%
3、高準(zhǔn)確性
比如文本、圖片、視頻,通過(guò)我們的調(diào)優(yōu),可以做到90%或者95%以上。
4、部署靈活
部署方式主要是采取旁路式部署,不改變業(yè)務(wù)狀況,支持彈性擴(kuò)容,業(yè)務(wù)功能支持動(dòng)態(tài)擴(kuò)容。
創(chuàng)旗希望和各位多交流、合作,為建設(shè)綠色安全的網(wǎng)絡(luò)環(huán)境做出我們應(yīng)有的義務(wù)。