思必馳成立于2007年英國劍橋高新區,創始人均來自劍橋,2008年回國落戶蘇州;是國內唯一擁有人機對話技術,國際上極少數擁有自主產權、中英文綜合語音技術(語音識別、語音合成、自然語言理解、智能交互決策、聲紋識別、性別及年齡識別、情緒識別等)的公司之一。
去年9月,思必馳在北京發布了其擁有完全自主知識產權的DUI平臺。
DUI平臺集成的核心智能對話技術具有高度可定制性,實現了從本地端設備到云端服務,從識別到合成,從語義到對話邏輯,從技術模塊到內容資源的全方位定制支持。此外,平臺還為開發者提供大數據運維和后臺分析服務,根據硬件配置和具體需求提供定制的增值服務,可持續優化用戶體驗,以一種“三方共贏”的方式構建AI良好生態。
思必馳聯合創始人/首席科學家 俞凱
DUI平臺的發布會上,思必馳聯合創始人/首席科學家俞凱圍繞對話智能、流通、生長三個方面,從技術層面做了分享。
這次分享雖然是圍繞思必馳的產品,但內容上值得智能語音行業乃至整個AI行業借鑒,以下我們對分享內容進行了梳理與整合。
從語音到對話,這些年發生了很大的變化
這是個不斷變化的時代,從2013年到2018年,我們經歷了從PC互聯網、移動互聯網到智能設備互聯的發展,交互方式也經歷著從文本搜索、語音/文本對話、自然口語對話的變遷。
技術變革,從未停歇。在這段時間里,技術在不斷變革,深度學習的應用進入了深水區,當下大家都認為的“深度學習+大數據”就是一切嗎?是的,是因為現在無論如何都缺少不了深度學習和大數據;說不是,是因為單純的深度學習和大數據,沒有專業化的支持和專業化的調整還不能發揮作用。
應用變革,如雨后春筍。在技術驅動下,各類應用如雨后春筍般誕生,在整個應用的層面,關注對話,并且以對話為核心,有的是數據驅動,有的是專業技術驅動,有的是產品應用驅動,此類公司越來越多,這是一個趨勢,趨向于專業化分工。
產業鏈變革,AI 及 AI+ 的專業分化進程加速。在產業鏈上的專業化分工更加明顯,促進其快速細分化。例如,在基礎層,芯片、大數據、云計算等成為基礎支撐;在交互層,語音、圖像、觸覺等成為交互方式的中流砥柱;在系統應用層,汽車、家居、娛樂、醫療、教育、金融等各個領域在不斷接納與滲透。專業化的分工、專業化的結合已經不可避免了。
對話智能:信息自由溝通的未來
俞凱從概念上進行了解析,指出對話不等于語音,對話是以人機交互為核心,包括各個模態,對語義的理解,聲音、圖像、感知層面直接的編碼,以完整系統作為優化目標的一種系統級合成,需要全面的技術創新能力。
對話具備更大的價值,讓產品實現自由的人機交互。思必馳是引領中國對話智能發展的領軍企業之一,自2013年起,在產業界最早系統性提出,并一以貫之的專注推進對話智能的概念、技術發展及應用。2014年,思必馳發布了國內第一個口語對話系統平臺"思必馳對話工場",開放底層的ASR、TTS、NLU等SDK接口。伴隨著業務轉型的進一步轉型,思必馳AIOS對話操作系統在國內智能硬件領域得到了十分廣泛的應用。為追求體驗升級,打造高可用定制的對話平臺,思必馳策劃并推出了DUI開放平臺。
封閉解決方案VS開放生態圈
毋庸置疑,語音交互已經成為當下智能產品的必備交互方式,多樣化的產品帶來了多樣化的需求,這為技術提供方帶來很大挑戰。例如,在對話上有命令、問答、閑聊、任務等不同模式;在場景上,存在控制、購物、金融、教育、家庭、旅游等多種場景,并不斷并入新場景;在細節上,要求多喚醒詞、新領域、新說法、新動作、新邏輯等等,整個需求趨向于個性化、特色化。
就此問題,俞凱表示,目前國內提供語音交互技能的公司大體上有兩種不同的思路。一是提供封閉的解決方案,所有的東西都包攬優化;二是像思必馳DUI這樣的思路,開放,形成一個生態圈,有博弈的過程,但這是一個多贏博弈的過程,在生態圈上大家互相體諒。
封閉和開放的對比,就像是一家獨大和萬馬奔騰的關系。開放生態圈才具備更大的價值,將核心技術開放出去,對AI應用企業以及技術企業的流通和生長都有積極作用,使得大家都不瘸腿。
必須要有大規模的定制技術的能力
俞凱表示真正實現流通型的對話智能,必須要有大規模的定制技術的能力,即DUI提出的:規模定制化。
語音識別&語音合成方面:規模定制化將技術的應用權限交給了廠商,多場景環境、多樣化技術需求重要問題,需要滿足諸如多喚醒詞、即時喚醒定制、個性化語音自動訓練、垂直領域主題自適應、新詞隨意添加、說話人及聲學環境自適應等需求。
語義理解及對話方面:開放平臺在語義理解及對話方面的需求是要支持意圖及語義槽自定義,語義理解自定義,語音語義聯動定制即時完成,在公共語義理解模塊實現自適應優化,支持對話邏輯的自定義,可以進行技能組合及上下文傳遞等。思必馳通過支持語義理解定制和語言模型自適應,同時通過結合深度強化學習及統計實現統計對話管理,并支持跨Skill的上下文信息和指代消解。
軟硬件系統支撐方面:這方面,要求軟硬件配置即時更新生效,跨平臺支撐,大規模定制化部署。思必馳DUI開放平臺的四大系統(玲瓏、天機、青囊、紫微)即是從軟硬件配合方面去考慮,玲瓏系統主要負責做跨平臺的轉接,紫微負責內容和服務支撐,天機為用戶提供可視化大數據和運營系統,而青囊則負責DUI服務力和研發支撐。四大系統各自分工又相互協同,保證DUI的最終落地應用。