* 語音交互- */>
智能語音交互
匯聚語音識別、語音合成、自然語言理解等技術(shù)
深度理解語音內(nèi)容并賦予與人交流及反饋的能力
語音算法模型可以根據(jù)實際場景訓(xùn)練提升識別效率
智能語音識別的原子能力
深度語義解析
支持50多個領(lǐng)域的語義理解
多語種和多方言識別
支持普通話、粵語、
英文、方言等識別
中文標(biāo)點(diǎn)智能斷句
內(nèi)容理解和停頓智能匹配合適
的標(biāo)點(diǎn)符號(包括,。???)
數(shù)字格式智能轉(zhuǎn)換
轉(zhuǎn)換數(shù)字序列、小數(shù)、時間、
分?jǐn)?shù)、基礎(chǔ)運(yùn)算符正確轉(zhuǎn)換
智能語言糾錯
根據(jù)語音的內(nèi)容理解自動
糾正為正確內(nèi)容
批量快速識別
支持批量上傳、
批量輸出識別結(jié)果
識別結(jié)果支持時間戳
識別返回的文字結(jié)果帶有時間戳,
切分句子開始和結(jié)束時間
豐富場景音庫
支持在線/離線語音合成,
語速、音調(diào)、音量靈活設(shè)置
智能語音識別的核心功能
錄音音頻識別
實時語音交互
語音定制化及合成
深度自我學(xué)習(xí)
結(jié)合自然語言識別及機(jī)器學(xué)習(xí)技術(shù),提供豐富及可持續(xù)深化的語音交互體驗
毫秒級實時識別與反饋
語義理解準(zhǔn)確
配置簡單可定制
核心功能應(yīng)用場景
會議/庭審語音轉(zhuǎn)寫
通過豐富的日常語音數(shù)據(jù)庫以及行業(yè)關(guān)鍵詞的積累, 如司法/政務(wù)等,提高語義理解的準(zhǔn)確度,識別準(zhǔn)確率高達(dá)97%。 充當(dāng)秘書或書記員的角色,實現(xiàn)輸出文字自動識別、自動糾錯, 自動斷點(diǎn),自動總結(jié)。
解決的業(yè)務(wù)難點(diǎn)
通過對會議/庭審等音頻的識別與語義理解,智能語音識別技術(shù)可以 將語音直接轉(zhuǎn)變?yōu)槲淖?,自動糾錯,有效將重要會議/庭審重要信息 作為會議紀(jì)要、庭審筆錄直接使用。