女人被狂躁到高潮呻吟小说,蜜桃成人网,女人与公豬交交30分钟视频,久久无码精品一区二区三区,浓毛老太交欧美老妇热爱乱

百度新出同傳AI,DEMO效果驚人,是噱頭還是實力?

同聲傳譯自1919年在巴黎和會上最早一次亮相后,一直在會議語言排障和實時溝通上發(fā)揮著至關重要的作用。同傳不同于其他翻譯,這種異常消耗腦力的工作不僅需要工作者雙語運用自如的語言功底,還需要隨機應變的能力。要達到同傳的高級翻譯水平,更是需要漫長的修煉過程。正是因人才的極度稀缺,早就讓同聲傳譯被冠以“日進斗金”的稱號。

人工智能技術的發(fā)展雖然在各個方面改善了人們的生活,但同時,它也帶來了一些現(xiàn)實存在的威脅,即去人力化并導致群體性失業(yè)。如今就連站在人才頂端的同聲傳譯行業(yè)也面臨著被替代的危險。

AI同傳工作要求高度的實時性、專業(yè)度,以及更低的容錯率,因此在機器翻譯領域算是個艱難的任務,甚至有人稱之為機器翻譯的“圣杯”。即是圣杯,勝者必將贏得一片天地,因此除了孜孜不倦的獨角獸,微軟、百度、谷歌等海內(nèi)外的AI大廠也都在不斷攻克這項難題,然而各方成果卻有喜有憂。

眾人競捧AI同傳圣杯,噱頭還是實力?

去年,具有世界領先翻譯技術的科大訊飛發(fā)布的曉譯翻譯機獲得了超高的人氣,其卓越的表現(xiàn)甚至被認為是取代同聲傳譯的一款人工智能產(chǎn)品。然而好景不長,前段時間,爆出的“科大訊飛造假事件”掀起了一場軒然大波,雖科大訊飛方面再三強調(diào)“人機耦合”而非AI同傳,但其偷換概念,避重就輕的做法還是令一些人對AI同傳產(chǎn)生消極的看法,一時間唱衰AI同傳突然鵲起。然而因此全盤否定AI在同傳上的成就和能力,就有點以偏概全了。

其實,訊飛造假事件中,核心問題甚至不在于AI同傳的技術能力,而是它根本沒有使用AI同傳。事實上,該會議僅僅使用了“訊飛聽見”產(chǎn)品,實際使用的僅僅是語音轉(zhuǎn)換文本功能而已。

搜狗同傳憑實力為AI同傳正聲

然而科大訊飛的造假事件并非代表著AI同傳真的涼了,真正的AI同傳也并非不存在。相反,今天越來越多國際會議和新聞發(fā)布會、體育賽事等等重要場合開始使用AI同傳。

前段時間,搜狗同傳作為中國網(wǎng)球公開賽的官方翻譯合作伙伴,從賽前的媒體發(fā)布會到賽后采訪,對獲勝球員的發(fā)言交流提供實時翻譯,這是AI同傳首次支持大型國際體育賽事。雖然依然有諸多技術不完美之處,但進步顯著,并且是AI同傳證明其實力的一次重要展現(xiàn)。

搜狗同傳采用的是端對端神經(jīng)網(wǎng)絡翻譯技術,可以使用循環(huán)神經(jīng)網(wǎng)絡生成翻譯結(jié)果,并將神經(jīng)網(wǎng)絡精簡為五層,翻譯的結(jié)果相比傳統(tǒng)機器翻譯大約能高出30%-40%,效率也大幅提升;其使用的語音斷句算法,能很好地識別詞語和句子的停頓,輸送出更符合人類語言習慣的翻譯結(jié)果,這也是搜狗同傳能夠快速超車,為AI同傳正聲的實力所在。

百度新推AI同傳,DEMO效果驚人,可期

近日,百度于硅谷宣布了最新重大突破——一個名為STACL的同傳AI,論文結(jié)果優(yōu)異,Demo效果驚人,MIT科技評論、IEEE Spectrum等一眾外媒紛紛好評,這是自2016年百度Deep Speech 2發(fā)布以來,又一項讓技術外媒們?nèi)绱思拥男逻M展。

據(jù)百度方透露,與現(xiàn)在大多數(shù)AI“實時”翻譯系統(tǒng)不同,STACL具備可預測和延時可控的特點,不走“整句說完再翻譯”的路線,能夠在演講者講話后幾秒鐘開始翻譯,并在句子結(jié)束后幾秒鐘內(nèi)完成。那么百度又是如何做到高質(zhì)量與短延時兼具的呢?

同音近音字問題

如何分辨同音近音字是保證同傳準確性的一個關鍵點,需要根據(jù)語境和背景知識共同分析的過程。在這方面,百度采取了提升容錯率,忽略語音-文字轉(zhuǎn)碼階段的錯誤,進而去提升文字翻譯階段的正確率的方案。百度同傳的“語音容錯”的對抗訓練翻譯模型,重點就在于有意在訓練數(shù)據(jù)集中加入針對性的噪聲數(shù)據(jù),這樣即使模型接受到錯誤的語音識別結(jié)果時,也能給出正確的譯文。

預測能力

這次百度推出AI同傳的重點技術為STACL“wait-k words”,即等待講話時后的第k個詞開始翻譯,通過對講話者的語言風格數(shù)據(jù)進行訓練,實現(xiàn)預測能力。同時還可以根據(jù)不同語種之間的差異性和不同場景的需求程度來調(diào)整K值。

機器學習

在百度同傳系統(tǒng)中,提出了快速融合領域知識策略,建立在百度自身的互聯(lián)網(wǎng)大數(shù)據(jù)之上,百度同傳系統(tǒng)獲得最基礎的通用領域翻譯模型。而當進入細分領域時,該系統(tǒng)也會像人類一樣,針對細分領域進行學習。

建立在通用模型的基礎上,通過對某一領域數(shù)據(jù)的增強訓練和專用術語的強制解碼,盡可能讓整體模型和該領域更加契合,從而減少同音字、多義字翻譯錯誤等諸如此類現(xiàn)象,提升整體效率。

由此可見,百度新出的AI同傳技術并非夸大宣傳,而是有技術支撐的實力展現(xiàn)。

對于百度此次在AI同傳上的大動作,Engadget認為:“雖然這個系統(tǒng)仍舊有局限性,而且無法在必要的時候取代人類翻譯。但是它在谷歌缺席中國的情況下,給出了一種新的選擇?!?/p>

AI同傳是一個復雜的工作過程,其在表現(xiàn)上的細微差距,背后都隱藏著從機器翻譯技術集成、神經(jīng)網(wǎng)絡系統(tǒng),到NLP等多種技術能力的集合。一家公司復雜龐大AI+語言領域技術體系,最終將會在終端產(chǎn)品表現(xiàn)。正是語音識別、機器翻譯等領域上的深厚積累,千錘百煉之下造就了能聽會說、能理解會思考的AI同傳。最終能捧得AI同傳這座圣杯的,拼的不是噱頭,不是夸大宣傳,而是實打?qū)嵉募夹g體系。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )

贊助商
2018-10-27
百度新出同傳AI,DEMO效果驚人,是噱頭還是實力?
同聲傳譯自1919年在巴黎和會上最早一次亮相后,一直在會議語言排障和實時溝通上發(fā)揮著至關重要的作用。

長按掃碼 閱讀全文