時至8月,四年一屆的亞運會即將在印度尼西亞首都雅加達舉辦。這屆亞洲體育盛會包含40項比賽項目,從8月18日到9月2日這半個月的時間里,每天上演的亞運獎牌爭奪戰(zhàn)將吸引無數(shù)人的目光。央視網(wǎng)是本屆亞運會移動端直播的重要平臺,將在亞運會期間密集直播各項賽事。金山云作為央視網(wǎng)的合作伙伴,將為客戶提供直播保障,帶給觀眾身臨其境的視聽體驗。
今年以來的各項重大事件和活動的直播,例如央視春晚、全國兩會、世界杯等活動和體育賽事,都有著來自于金山云的保障,保證了海量用戶的觀看需求。歷經(jīng)直播重保實戰(zhàn)考驗的金山云,可以說在直播保障方面,有著領先的技術和豐富的經(jīng)驗。其中,創(chuàng)造了高層次觀看體驗的世界杯直播保障,就是一個非常典型的例子。
一組金山云在保障期間創(chuàng)造的數(shù)字,證明了世界杯直播保障工作的成功:峰值帶寬3個T、流量命中率99.65%、卡頓率小于1%、主要質(zhì)量指標優(yōu)于客戶要求50%以上、整體保障質(zhì)量名列前茅。
央視網(wǎng)對金山云的保障工作給予了高度肯定。在世界杯服務感謝信中,央視網(wǎng)寫道,“貴公司作為央視網(wǎng)的視頻CDN供應商,在此次世界杯的轉(zhuǎn)播報道中鼎力支持,特別是在帶寬儲備資源、駐場重保支持上為我司保駕護航”。
央視網(wǎng)給金山云的感謝信
由于娛樂屬性強,又有著傳播快、受眾廣泛的特點,世界杯直播顯得相對特殊,保障工作相對難度較大。與其它項目不同,為世界杯做直播保障,時間長、任務重,這表現(xiàn)在多個方面。例如,賽事直播首先要為用戶帶來優(yōu)質(zhì)視聽體驗,如何避免高并發(fā)產(chǎn)生的卡頓、丟包情況出現(xiàn)?如何能夠提前對直播所需的帶寬進行準確評估,針對直播覆蓋的區(qū)域進行帶寬調(diào)整,最大程度上避免流量緊張?如何對直播形成的峰值帶寬壓力形成穩(wěn)定支撐?對于世界杯這樣的賽事,應該為客戶提供怎樣的服務,才能保證直播的安全和高效?設備故障的應急處理應該如何實現(xiàn)?
對于這些問題,金山云的直播保障團隊,用三招給出了讓客戶滿意的答案。
三招神助攻:百萬直播保障背后的架構
成功保障離不開金山云深厚的技術和資源積累。為了世界杯直播,金山云的團隊運用了多種技術手段,保證了直播的觀看體驗。
金山云直播源站及轉(zhuǎn)碼集群架構圖
首先,金山云為客戶搭建了多個直播源站及轉(zhuǎn)碼集群。在央視和金山云的直播源站的基礎上,為每個源站配備轉(zhuǎn)碼,金山云這一集群支持央視網(wǎng)世界杯期間的內(nèi)容直播,RTMP/FLV拉源流,轉(zhuǎn)碼處理后支持央視HLS/HDS/FLV拉流。同時配備容災主備解決方案,可在搭建的多個源站之間互為備份,實現(xiàn)秒級切換。
金山云CDN邊緣節(jié)點可實現(xiàn)對直播內(nèi)容的預拉取
第二,金山云采用了CDN邊緣節(jié)點對直播內(nèi)容的預拉取。即能夠早于客戶一秒拉到直播內(nèi)容,保證用戶觀看流暢。由于HLS屬于切片式直播,正常情況下HLS直播內(nèi)容相對于直播現(xiàn)場的內(nèi)容有幾秒到幾十秒的延遲,在此過程中,金山云提前先將直播內(nèi)容拉到離用戶最近的邊緣節(jié)點上,這樣的預先拉取比起請求回源,延遲可大幅降低,大大提高了用戶的播放體驗。同時,金山云在邊緣節(jié)點處設置有“大腦”,負責內(nèi)容的分發(fā),保證負載的均衡性,提供最大的服務能力,減小上層源站的壓力。
金山云智能調(diào)度系統(tǒng)架構圖
第三,金山云在直播保障過程中,采用了智能調(diào)度系統(tǒng)。這一系統(tǒng)是金山云自主研發(fā)平臺,負責直播保障過程中智能調(diào)度策略的實現(xiàn),它有三大功能模塊——“負載均衡器”、“鷹眼”、“智能閥”。
在高峰時段來臨時,一旦CDN邊緣節(jié)點負載過大,就需要調(diào)度更多的邊緣節(jié)點,問題也隨之而來,在眾多邊緣節(jié)點中,需要將誰的流量調(diào)走?調(diào)多少?調(diào)到哪里?這時,“負載均衡器”就會按照任務的優(yōu)先級做出排名,對此進行計算。
對于調(diào)多少流量,調(diào)到哪里,“負載均衡器”能夠?qū)崿F(xiàn)自動調(diào)整。調(diào)到哪里,會根據(jù)帶寬圖,判斷在哪里有服務,在判斷需要調(diào)多少流量之前,“負載均衡器”會計算節(jié)點帶寬和節(jié)點的流量承載能力,如何才能不超過節(jié)點的流量安全水位線,從而實現(xiàn)既將流量水位降到安全標準,又能夠?qū)⑵渌?jié)點的影響降到最小。
智能調(diào)度系統(tǒng)的其它兩大功能模塊——“鷹眼”和“智能閥”同樣值得一提,它們是智能調(diào)度系統(tǒng)的左膀右臂,為精準流量調(diào)度護航。
發(fā)揮左膀作用的“鷹眼”,是金山云自主研發(fā)的網(wǎng)絡實時監(jiān)控平臺,通過它可監(jiān)測到直播數(shù)據(jù)的流向,包括中上層源的切換之后數(shù)據(jù)流向的監(jiān)控,包括所有節(jié)點的帶寬水位、機器的負載、業(yè)務的QPS在線人數(shù)、錯誤率、慢速率,可細化到每個省市。便于及時摘掉宕機的節(jié)點,如果出現(xiàn)節(jié)點帶寬不夠的問題,平臺自動調(diào)量,同時進行回源鏈路的優(yōu)選,源站有故障或質(zhì)量不好可瞬間切換。
而扮演右臂功能的“智能閥”,為流量調(diào)度提供靈活可控的策略,它可根據(jù)世界杯比賽產(chǎn)生的實時帶寬數(shù)據(jù)進行資源動態(tài)調(diào)整,將閑置資源分發(fā)給直播重點內(nèi)容,并且保證提供給世界杯直播的帶寬可獨占專享,其它直播業(yè)務無法占用,而且在流量峰值時,會預留鎖定量,不會出現(xiàn)帶寬緊張的問題。
在世界杯直播保障期間,團隊先是用“鷹眼”監(jiān)測數(shù)據(jù),看數(shù)據(jù)有沒有達到“水位”,如果“水位”將近,“智能閥”將開啟,提前預警和分配資源,再由智能調(diào)度系統(tǒng)調(diào)整流量的走向。
眼下,金山云的服務團隊正在按照重保方案,對亞運會直播保障進行演練。“不止亞運會,在接下來的一系列為央視網(wǎng)做直播保障的任務中,由于經(jīng)驗的不斷積累,就算世界杯或亞運會每個月舉辦一次,我們同樣會保障好”,團隊的一位成員這樣說道。