引言:AIoT,用技術改變生活!
若說當今時代的關鍵詞,“AIoT”當之無愧。“AIoT”也就是“AI+IoT”,指的是人工智能技術與物聯(lián)網(wǎng)在實際應用中的落地融合。目前,越來越多的行業(yè)及應用將AI與IoT結(jié)合到了一起,AIoT已經(jīng)成為各大傳統(tǒng)行業(yè)智能化升級的最佳通道,也是未來物聯(lián)網(wǎng)發(fā)展的必然趨勢。
作為人工智能應用最成熟的技術之一,智能語音技術在AIoT領域應用十分廣泛。B 端的醫(yī)療、教育行業(yè);C 端的智能手機、智能家居、智能穿戴設備中智能語音技術的新賦能,都讓我們都看到了這項新技術給我們生活帶來的巨大改變。
根據(jù)中投顧問發(fā)布的《 2018-2022 年中國智能語音行業(yè)深度調(diào)研及投資前景預測報告》顯示,智能語音應用將是人工智能發(fā)展的重點方向。
目前,國家正在加快人工智能的產(chǎn)業(yè)布局,發(fā)布多項利好政策促進人工智能產(chǎn)業(yè)發(fā)展;5G時代的來臨更是為人工智能的發(fā)展培育了一片物聯(lián)網(wǎng)沃土。我們可以預見,智能語音作為下一代人機交互的新入口,將率先在這片人工智能的沃土上生根發(fā)力,推動整個產(chǎn)業(yè)的茁壯成長。
中國企業(yè)在智能語音領域表現(xiàn)突出,創(chuàng)新創(chuàng)業(yè)日益活躍,還有搜狗智能語音等一批龍頭企業(yè)加速成長,在國際上獲得廣泛關注和認可。
目前智能語音在語音拾取、語音分析和語義理解等核心技術環(huán)節(jié)取得了多項重大突破,智能語音技術已經(jīng)呈現(xiàn)一種整體的解決方案。
在聲音處理的整體解決方案中第一步也是最關鍵的一步——
如何將人的聲音傳達至機器,讓機器“聽到”、“聽清”且“聽懂”?
“聽到”和“聽清”在技術上又是如何實現(xiàn)?
相關技術上現(xiàn)在有哪些難點和突破?......
基于對人工智能行業(yè)的智能語音技術發(fā)展現(xiàn)狀的好奇,國內(nèi)多家知名科技媒體一同來到中國領先消費類芯片原廠炬芯科技,一起探索新時代智能語音技術將給我們的生活帶來什么改變!
炬芯技術市場專家陶永耀應邀接受了媒體的群訪,為大家一一解開關于智能語音技術的奧秘以及AIoT行業(yè)發(fā)展的種種疑惑。
陶永耀技術市場專家
炬芯“技術勞模”,對聲音技術有著獨特的見解,深受行業(yè)人士認可。
為幫助大家理解,陶永耀先就聲音的工作原理以及智能語音技術中的關鍵:聲音前處理技術做了簡單的科普。我們也一起來學習下吧!
聲音的工作原理
△語音處理數(shù)據(jù)流
聲音應用的三個主要場景:
?聲音的傳輸,例如打電話,通過聲音傳輸,讓通話功能實現(xiàn);
?聲音的存儲,例如錄音、播放CD等等;
?聲音的識別,就是語音交互體驗
而聲音的前處理技術和聲音的后處理技術就是上述場景實現(xiàn)的關鍵。
聲音的后處理技術,是聲音經(jīng)過存儲之后進行播放的同時處理。是對音源例如MP3等媒體解碼播放的聲音進音效增強處理。(例如虛擬重低音、環(huán)繞立體聲、高音增強、EQ等等。)
聲音的前處理技術,是聲音沒有進入傳輸、沒有存儲之前的處理。聲音前處理目的,就是讓聲音的存儲、傳輸效率更高,識別率更好。(例如回聲消除、降噪、聲音活動檢測等等。)
炬芯在過去三十多年,一直在進行聲音的處理工作,例如MP3(聲音的后處理技術)、錄音筆等聲音的保留、存儲(聲音的前處理),聲音的麥克風識別,聲音的回聲消除及降噪(聲音的前處理)、后期的音效增強(聲音的后處理技術)等等。
智能語音終端設備關鍵——聲音前處理技術
聲音前處理技術其實是解決機器“聽到”和“聽清”兩件事,從而達到“聽懂”的目的。
聲音的“聽到”主要依托的是麥克風。主要形式為單個麥克風或麥克風陣列(多個麥克風按照一定規(guī)則排列,在特定空間對聲音進行獲取和處理)。
而基于麥克風的語音信號處理算法則是讓聲音“聽懂”的關鍵。麥克風+算法,在不同的環(huán)境下排列組合,最終達到“聽到”和“聽懂”。
我們可以根據(jù)距離,將聲音的前處理分為分為遠場拾音(3到5米)和近場拾音(1米內(nèi))。
近場拾音,一般采用的是單麥克風,可在近距離、低噪聲的情況下拾取符合語音識別需求的聲音。但是一旦將智能手機放在有噪聲的較遠的距離,語音助手的識別率就會直線下降,單麥克風的局限就凸顯了出來。
遠場拾音,由于距離、噪聲、混響等因素,遠場拾音多采用多麥克風陣列,并且和遠場語音識別算法相匹配。
通過陶永耀對聲音工作原理及聲音前處理技術的重點講解,對聲音技術有進一步了解,眾媒體紛紛對炬芯的技術發(fā)展進一步提出疑問,我們也將相關熱門問題及回答羅列出來和大家一起分享!
Q:
炬芯在聲音前處理方面都有哪些獨家優(yōu)勢?
A:
炬芯的主要優(yōu)勢在于我們一直在做系統(tǒng)集成SoC,芯片硬件技術跟軟件技術能夠完美結(jié)合。憑借多年的經(jīng)驗,炬芯在聲音采集的精度、速度上有很好的基礎,并且通過聲音處理算法硬件化等方式,能夠?qū)⑿酒墓暮托詢r比維持在行業(yè)領先位置。
Q:
炬芯在聲音前處理技術上已經(jīng)覆蓋了哪些行業(yè)及落地了哪類產(chǎn)品?
A:
我們現(xiàn)在主要的產(chǎn)品包括兒童錄音筆、故事機、藍牙音箱等等。在技術方面,主要包含了聲音的降噪、回聲消除技術、抗混響技術、在線語音識別。
同時,炬芯也在拓展一些新領域,例如智能家居和智能家電領域。在這個方向上炬芯會更多的關注離線識別技術(離線語音技術可以避免在線技術網(wǎng)絡不穩(wěn)定、聯(lián)網(wǎng)難、人的隱私被曝光等問題;并在較短反應時間內(nèi)實現(xiàn)家電的控制。)。
最近炬芯在推廣的智能耳穿戴產(chǎn)品,就融合了離線和在線的語音識別功能。我們可以通過有限的命令詞條實現(xiàn)一些命令控制,也可以通過手機和云上識別,去實現(xiàn)一些語義理解命令。離在線結(jié)合的識別技術,將是未來技術發(fā)展的一個重要方向。
Q:
在未來,聲音前處理技術還有哪些難點需要攻克?
A:
第一,如何讓機器聽懂是我們在技術上需要持續(xù)關注的問題。讓機器聽最大的難點在于機器的識別率和誤識別率,這兩個比率也是未來需要不斷地持續(xù)發(fā)展提高的。需要特別指出的是:機器的識別率和誤識別率即聽對聽錯的概率相互之間還存在互相制約平衡的關系。
第二,是在拾取聲音的環(huán)境方面。聲音的拾取除了受自己的回聲和環(huán)境混響影響,還受環(huán)境中各類的噪聲影響。各種穩(wěn)態(tài)和非穩(wěn)態(tài)的噪聲都需要我們通過聲音前處理技術進行處理。如何處理各種穩(wěn)態(tài)的噪聲和非穩(wěn)態(tài)的噪聲也將是未來需要持續(xù)關注的技術難點。
Q:
對于 AIoT 的發(fā)展趨勢和相關的行業(yè)機會怎么看?
A:
AIoT是必然的發(fā)展趨勢,而技術又是一個長期的研發(fā)和投入的過程。在技術的發(fā)展過程當中,我們發(fā)現(xiàn)強人工智能落地是一場持久戰(zhàn),但弱人工智能,在某些場景下能夠切實解決人們的一些需求。因此,當一些適應場景的AI市場機會出現(xiàn)時,我們也需要把握住市場機會。
AIoT是一場持久戰(zhàn),短期、長期的技術研發(fā)及市場收益,需要我們不斷的平衡與發(fā)展。
想了解更多精彩采訪內(nèi)容,請點擊下方采訪視頻!
眾所周知,炬芯科技多年來一直為無線音頻及智能耳穿戴、智能多媒體、智慧計算及物聯(lián)網(wǎng)等產(chǎn)品領域提供專業(yè)芯片及完整解決方案。尤其在聲音領域,炬芯已經(jīng)推出了眾多音頻和智能機器人等方案,在語音交互體驗方面已經(jīng)處于行業(yè)領先地位,落地產(chǎn)品深受國內(nèi)外品牌商的青睞。
因為炬芯在“聲音”領域持續(xù)耕耘,二十多年的技術積累以及與高要求品牌商深度合作的實戰(zhàn)經(jīng)驗,讓炬芯在行業(yè)一直處于領先地位。
AIoT,新時代將至,炬芯將持續(xù)不斷的追求技術上的深耕發(fā)展,用更好的技術帶給人們更美好的生活體驗!
- 盒馬創(chuàng)始人預測:美團在快銷品領域超越天貓京東只是遲早的事
- 港科大攜手百望股份,打造金融智能體新篇章:開啟未來經(jīng)濟預測新紀元
- 特斯拉得州工廠再次停產(chǎn):產(chǎn)能壓力下的困境?
- 網(wǎng)傳持股計劃泡湯,員工成"最慘打工人"事件引爆輿論,廣汽埃安已采取行動辟謠
- 微軟與AMD聯(lián)手打造未來Xbox,揭秘芯片合作新篇章!
- 盒馬創(chuàng)始人:劉強東揭示京東天貓快消品與美團競爭之謎,新零售風向標!
- 劉強東坦言:京東面臨挑戰(zhàn),未來五年創(chuàng)新業(yè)務成破局關鍵
- 華為助力上海移動5G-A 2.0升級,打造智慧城市新標桿
- 亞馬遜云科技升級三大安全功能,筑牢生成式AI防御城墻
- 羅永浩數(shù)字人:驚艷還是噱頭,背后技術揭秘
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。