智能音箱能否成為AI的首張王牌？百度DuerOS給出了答案

智能終端 dvbcn編輯 2017-07-17 15:11 閱讀 2,760 來源：DVBCN 　

人工智能領域再度熱鬧起來，這一次是因為智能語音助手。

在百度推出DuerOS開放平臺后，國安廣視搭載DuerOS的新一代G2人工智能機頂盒及智能語音遙控器又落地河北。未來2年內，河北全省預計將有200萬+用戶享受人工智能帶來的生活改變。與此同時，阿里也推出一款內置中文人機交流系統AliGenie的智能音箱，加上騰訊在此前推出的小微智能語音解決方案，智能音箱已然成為BAT的又一戰場，而誰能成為中國版的Echo也成為科技圈的一大談資。

可在業界看來，阿里以及號稱要在八月份發布自己的智能音箱的騰訊，更像是智能語音領域一個遲到的“覺醒者”。距離亞馬遜Alexa的推出已經有近兩年的時間，蘋果的Siri、Google的Assistant、微軟的Cortana等也在推出時間上占據優勢。即便在國內，Fast Company 在去年年底就將百度排在最具創新的 AI 和機器學習企業榜單第三位，僅次于 Google 和 IBM。百度深度語音識別系統Deep Speech2更是入選MIT 2016十大突破性技術。

正如第三方分析機構Canalys分析師賈沫所說，智能音箱對人工智能技術要求很高。盡管目前語音識別方案較為完善，但是在深度學習等人工智能技術上并不是短時間內能夠彌補的，只有深耕人工智能才有可能成為大玩家。

這次，百度的DuerOS走在了最前面

巧合的是，在阿里推出“天貓精靈X1”的同時，百度也在其AI開發者大會也首次系統闡述了百度對于AI語音交互領域的重視以及野心，以DuerOS開放平臺為支撐，試圖在AI領域再造安卓式的操作系統生態。

一個瞄準了智能硬件，一個要做安卓式的操作系統生態，與百度相比，阿里在智能語音交互領域的動作還是晚了不少。

巨頭們紛紛瞄準智能音響，在某種程度上確認了科技領域的一個既定事實，即語音將成為下一代交互入口之一，甚至會在某些領域取代現有的圖像、動作等人機交互方式。而想要實現這一宏偉目標，僅靠智能音響這一純粹的硬件產品恐怕是難以實現的，畢竟智能音響還需要經歷數據積累、業務完善、云端服務部署等一系列流程。

阿里和百度不同的選擇，和兩家公司對人工智能的認識不無關系。早在 2013 年年初，百度就成立了百度深度學習研究院（IDL），并在三個月之后在硅谷成立了硅谷人工智能實驗室。而在當時，人工智能這個概念在業界方興未艾，大公司中也僅有百度等少數玩家嘗試進行系統性的布局。隨著業界對人工智能領域在未來的不斷看好，科技巨頭們相繼改變了對人工智能的態度：如果你失去了這塊領地，那你也將失去未來。

從2014年開始，阿里、騰訊等開始陸陸續續布局人工智能領域，試圖跟上百度等先驅者的節奏，并導致智能語音交互成為彼此交鋒的戰場之一。只不過，當追隨者還在琢磨智能硬件作為發力方向的時候，百度的DuerOS已經開始了開放生態的探索。

為什么說生態才有未來？

BAT為何要把戰火燒向了智能語音交互領域？一個公認的說法是，智能語音交互是基于語音輸入的新一代交互模式，因此也被視為是新的物聯網入口。

誠然，作為一種新型的人機交互模式，智能語音交互可以實現人機對話，即通過說話就可以得到反饋結果。將智能語音系統搭載終端硬件，在這樣的“配合”下，制造商們得以進入家庭的每個角落：在客廳看電視，在臥室吹空調，在廚房用冰箱，而這些也將成為物聯網時代下人機共處的具體場景。

換而言之，如果語音交互取得廣泛應用，智能語音系統企業獲利的同時，還將帶來從元器件到內容服務全產業鏈的重構。對此，百度也直接放言，對話式人工智能系統DuerOS將成為百度在下一個時代重回巔峰的核心。

然而，要實現這樣的場景，不僅需要深耕語音語義識別技術，還需構建完善的生態。從PC時代的Windows，到移動互聯網時代的安卓和iOS，再到智能語音時代的百花齊放，巨頭們一直想要實現的就是打破信息孤島，而開放往往被證明是最正確的答案。在人工智能時代有著同樣的商業邏輯，在系統級層面進行開源和開放，吸引足夠多的服務和硬件合作伙伴，連接起更多的終端和數據，最終實現“萬物互聯”的場景。

為了構建生態，百度做出了兩個重要舉措，一是收購了專注語音喚醒和自然語音交互技術的人工智能創業公司KITT.AI，并相繼發布了DCS(DuerOS Conversational Service)和DBF(DuerOS Bot Framework)兩大基礎協議，使得DuerOS成為國內軟硬一體的“最全”解決方案；二是百度在硬件上跟科勝訊、英特爾、MTK、Rockchip、全志、RDA、Realtek、高通等公司合作推出了不同的開發套件，包括套件的個人版、輕量版、標準版以及開放電路板設計、開放結構設計等完整一體化參考設計，以吸引更多硬件廠商的加入。

百度的做法有何啟示？

當然，在人工智能的風口下，試圖從系統層面做開放的絕不止百度一家，包括科大訊飛、云知聲等也有所嘗試，但百度的做法押對了嗎？

百度將DuerOS開放平臺分為智能設備開放平臺、對話核心系統、和技能開放平臺三層。簡而言之，對話系統提供算法能力，比如語音技術、自然語言處理技術、搜索技術、多輪對話技術等能力，以及知識圖譜等大數據；技能層，整合了音樂、有聲、新聞、娛樂等10大類、100多種生對話技能和愛奇藝、懶人聽書這類第三方內容資源，免費開放給開發者；算法層就是上文所提到的幾種軟硬結合的解決方案。

不難理解百度的野心，通過這些開源的技術和服務，開發者們可以實現不同場景的智能應用，輕松設計出滿足自己需求的產品，而非局限在“音箱”的形式上。語音交互平臺搭載終端硬件，成就更多的智能產品，進而搭建起良性的生態產業鏈，這才是百度現在和未來的發力重點。

能夠證明這一策略行之有效的，或許還是亞馬遜Echo的成功。Echo在發布之初似乎并不討市場喜歡，即便在音質輸出和設計方面均不輸專業級產品，亞馬遜還推出了一套完整的音樂流媒體服務。而當諸多的開發者接入Echo，亞馬遜也嘗試著將Alexa開放給更多開發者，使得這款智能語音助手更加“好玩”的時候，銷量便開始一路水漲船高。

DuerOS的討巧之處在于，只需要修改17行代碼，就可以在幾秒鐘內把搭載亞馬遜Alexa的設備遷移到百度DuerOS，極大地方便了開發者的“陣地轉移”，尤其對國內的開發者而言，而在這之前，整個過程至少需要五個研發人員花費3到6個月的時間。百度度秘事業部總經理景鯤也因此向開發者公開呼吁，在中國選擇DuerOS。

總的來看，BAT等巨頭們擁抱語音交互已經是不爭的事實，只是阿里在生態的搭建上則多少顯得有點瞻前顧后，雖然推出了AliGenie平臺，但與百度DuerOS鼓勵第三方開發產品合作共贏不同，阿里的重心還是自家產品。而騰訊在這個領域還尚未形成清晰的戰略布局。以至于有業內人士對此分析稱，從策略上來看，百度的DuerOS是大生態戰略，而天貓精靈X1等幾乎就是照抄Echo。

那么問題來了，阿里和騰訊是否會二次覺醒，在智能語音呀領域再次跟著百度DuerOS的節奏走起來嗎？

DuerOS