撥打海底撈餐廳的客服電話,一個語氣熱情的女聲從電話那頭傳來,很多人可能都沒有意識到,這并不是人工客服,而是智能電話機器人的聲音。
同樣,當你撥打10086/10010客服熱線,電話那頭不再是話務員,而是智能機器人客服在接聽。所有這些變化都得益于智能客服的普及。
在客服語音識別技術的支持下,智能客服為企業(yè)與海量用戶之間的溝通建立了一種基于自然語言的快捷有效的技術手段,能夠降低客服中心的人力成本、提升客服中心的運營效率。
不過,隨著智能客服在各個行業(yè)的普及,越來越多人反映智能客服有時并不“智能”。
當你撥打銀行客服電話時,經常會聽到“請直接說出你要辦理的業(yè)務”的提示,但“答非所問”的現象十分常見。一位市民曾表示,與智能客服的交流“還是和機器交流的感覺,而且你說話一定要短,不然也得重來一遍”。
造成智能客服“兜圈子”、“聽不懂人話”的一個重要原因在于語音語言的復雜性。
首先,中國有七大方言區(qū)、數十種方言,不同的地域有不同的口音特點。所以,如何識別客戶的方言以及帶有口音的普通話,成為客服語音識別亟待解決的問題。
其次,人們習慣于以非常自然的方式同客服進行對話,語速快、吐字不清、搶話疊字等說話習慣同樣會對客服語音識別的準確率產生影響。
最后,電話信道數字語音的采樣頻率定義為8kH,音質較差,且各行各業(yè)都擁有自己獨特的領域術語,客觀上也為客服語音識別構成了挑戰(zhàn)。
數據堂在深刻理解智能客服場景的基礎上,對海量原始語音數據進行提取、分類、標注等一系列處理,將混雜的數據轉化為可供機器深度學習的智能客服專業(yè)數據,為上述客服語音識別面臨的技術挑戰(zhàn)提供了可靠的數據解決方案。
普通話語音識別
構建普通話基礎語音數據,能夠有效提升智能客服系統(tǒng)對普通話識別的精準度。
數據堂開發(fā)的普通話基礎語音數據包括普通話朗讀數據、重口音普通話數據和普通話自然對話數據。
朗讀數據能夠為客服語音識別提供模型,重口音普通話數據能夠提高各地口音語音的適應性,而自然對話數據能夠提高自然風格語音的適應性。
數據堂自有版權普通話語音數據
方言語音識別
與普通話語音識別的解決方案類似,基礎語音數據也是提升方言語音識別精準度的重要保障。
數據堂開發(fā)的方言語音基礎數據包括方言朗讀數據和方言自然對話數據。
方言朗讀數據是構建方言語音識別模型的基礎,方言自然對話數據能夠提高自然風格語音的適應性。
數據堂自有版權方言語音數據
數據定制服務
為了有效解決客服語音識別所面臨的領域術語難題,數據堂特提供數據定制服務。
客服語音標注示例
數據堂積累了近十年標注經驗,打造了一個業(yè)內領先的數據處理平臺。
數據堂創(chuàng)建了可視化數據制作流程和管理制度,擁有語音、文本、圖片和視頻等近20種豐富的可配置工具,掌握多個領域20余個場景的預處理能力,保障了自動標注的高效性。
為保障數據的質量,數據堂采取了標注(多人擬合)、質檢(機器質檢、人工抽檢)、人工驗收等多級數據質量管控措施。
數據堂保密性極高的標注服務基地
數據堂提供的數據處理平臺私有化部署+云標注的模式能夠有效保護客服數據所涉及的企業(yè)機密或客戶隱私。
數據堂的語音數據產品可以做到從智能客服實際應用場景出發(fā),幫助客戶快速提升語音識別的性能。
數據堂在人工智能數據服務領域將持續(xù)發(fā)揮導向性作用,不斷優(yōu)化自身業(yè)務與技術實力,為人工智能技術研發(fā)與應用提供數據能源支持。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )