語(yǔ)音記錄,是記者、編輯、作家等文字工作者們常用的記錄方式。但是,對(duì)于記錄者來(lái)說(shuō),語(yǔ)音并不方便后期的整理、分享和追溯,這也導(dǎo)致聽(tīng)語(yǔ)音記錄的過(guò)程耗時(shí)耗力,影響信息的溝通。近日,搜狗推出語(yǔ)音實(shí)時(shí)變文字的速記工具“搜狗聽(tīng)寫(xiě)”,解決會(huì)議、采訪、寫(xiě)作等場(chǎng)景下長(zhǎng)語(yǔ)音內(nèi)容轉(zhuǎn)寫(xiě)難題。
為了保證在各種復(fù)雜場(chǎng)景下都能精準(zhǔn)轉(zhuǎn)寫(xiě),搜狗聽(tīng)寫(xiě)采用了大量的前沿技術(shù)。在轉(zhuǎn)寫(xiě)方面,搜狗聽(tīng)寫(xiě)使用了搜狗知音獨(dú)家研發(fā)的長(zhǎng)時(shí)語(yǔ)音轉(zhuǎn)寫(xiě)技術(shù),并與業(yè)內(nèi)領(lǐng)先的端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)深度整合,使得語(yǔ)音識(shí)別準(zhǔn)確率保持在較高水平。據(jù)了解,搜狗聽(tīng)寫(xiě)的功能相當(dāng)強(qiáng)大,可以支持寫(xiě)文章、采訪錄音、會(huì)議記錄、筆記整理 、日常記事等場(chǎng)景,幫助用戶實(shí)現(xiàn)高效記錄和信息輸入。而且針對(duì)不同場(chǎng)景和需求,搜狗聽(tīng)寫(xiě)可以支持“聽(tīng)寫(xiě)”和“轉(zhuǎn)寫(xiě)”兩種模式。在“聽(tīng)寫(xiě)”模式下,錄音的同時(shí)即可實(shí)時(shí)給出識(shí)別結(jié)果,話音落文字出,幾乎沒(méi)有時(shí)間差;而“轉(zhuǎn)寫(xiě)”模式下則可以離線錄音,錄音完成后一次性獲取文字結(jié)果。同時(shí),為了提高文字整理效率,搜狗聽(tīng)寫(xiě)還貼心的加入了邊聽(tīng)邊改、無(wú)線標(biāo)重點(diǎn)、多端同步、信息分享等人性化功能,大幅度提升記錄效率,讓文字編輯更輕松。此外,在針對(duì)圖書(shū)館、咖啡廳等不便于大聲說(shuō)話而又有使用語(yǔ)音的場(chǎng)景,搜狗聽(tīng)寫(xiě)提供耳語(yǔ)識(shí)別技術(shù),在人的說(shuō)話音量低至30分貝時(shí),依然可以準(zhǔn)確識(shí)別。
搜狗公司語(yǔ)音交互技術(shù)中心總經(jīng)理王硯峰表示:“搜狗聽(tīng)寫(xiě)作為一款多場(chǎng)景的語(yǔ)音聽(tīng)寫(xiě)工具,其產(chǎn)品的關(guān)鍵在于語(yǔ)音識(shí)別準(zhǔn)確率,而通過(guò)大規(guī)模的優(yōu)質(zhì)語(yǔ)音訓(xùn)練數(shù)據(jù)和深度學(xué)習(xí)的技術(shù)能力積累,搜狗也將這種語(yǔ)音識(shí)別的技術(shù)優(yōu)勢(shì)轉(zhuǎn)化到了更多的適用場(chǎng)景中。”
目前,搜狗已經(jīng)建立了強(qiáng)大的語(yǔ)音自研團(tuán)隊(duì),擁有互聯(lián)網(wǎng)規(guī)模最大的語(yǔ)音數(shù)據(jù)。每天超過(guò)2.6億次的語(yǔ)音請(qǐng)求,為搜狗智能語(yǔ)音系統(tǒng)提供了海量的真實(shí)語(yǔ)料數(shù)據(jù),使得機(jī)器不斷學(xué)習(xí),識(shí)別準(zhǔn)確率越來(lái)越高,可應(yīng)用的場(chǎng)景也越來(lái)越廣泛。此次推出搜狗聽(tīng)寫(xiě)產(chǎn)品,是搜狗語(yǔ)音深入用戶垂直場(chǎng)景下的又一個(gè)全新探索,通過(guò)更加專注于特定的場(chǎng)景和人群,去理解用戶需求、解決實(shí)際問(wèn)題,從而讓語(yǔ)音技術(shù)為更多人所用。綜合搜狗在人工智能上的產(chǎn)品布局,我們可以清晰的發(fā)現(xiàn),讓人工智能更“接地氣”,已經(jīng)成為搜狗在人工智能領(lǐng)域的獨(dú)特標(biāo)志。