由百度聯(lián)合馬來(lái)亞大學(xué)、華南理工大學(xué)、西班牙巴塞羅那自治大學(xué)-計(jì)算機(jī)視覺(jué)中心、中國(guó)圖象圖形學(xué)會(huì)主辦的ICDAR 2019-LSVT(Large-scale Street View Text with Partial Labeling,弱標(biāo)注大規(guī)模街景文字)、ICDAR 2019-ArT(Arbitrary-Shaped Text,任意形狀場(chǎng)景文字)國(guó)際權(quán)威競(jìng)賽任務(wù)于5月圓滿結(jié)束。此次競(jìng)賽共吸引來(lái)自業(yè)界頂尖技術(shù)團(tuán)隊(duì)、高校及科研機(jī)構(gòu)共118支團(tuán)隊(duì)參賽,有效提交結(jié)果總計(jì)339個(gè)。經(jīng)過(guò)兩個(gè)月的激烈角逐,ICDAR 2019-ArT競(jìng)賽五項(xiàng)子任務(wù)的冠軍分別由中科院(文字檢測(cè))、曠視(Latin文字識(shí)別)、韓國(guó)NAVER(Latin中文混合文字識(shí)別)、北京航空航天大學(xué)(Latin文字、Latin中文混合端到端文字識(shí)別)獲得,ICDAR 2019-LSVT競(jìng)賽文字檢測(cè)和端到端文字識(shí)別兩項(xiàng)任務(wù)冠軍由騰訊團(tuán)隊(duì)獲得。
精英薈聚ICDAR2019 桂冠引群雄爭(zhēng)奪
ICDAR“Robust Reading Competitions”競(jìng)賽是評(píng)估自然場(chǎng)景/網(wǎng)絡(luò)圖片/復(fù)雜視頻文本提取與智能識(shí)別新技術(shù)進(jìn)展的權(quán)威國(guó)際賽事及評(píng)測(cè)標(biāo)準(zhǔn),競(jìng)賽中涌現(xiàn)出諸多方法持續(xù)推動(dòng)業(yè)界新技術(shù)的創(chuàng)新與應(yīng)用。在ICDAR2019百度發(fā)布的兩項(xiàng)極具挑戰(zhàn)的競(jìng)賽任務(wù)中, ICDAR 2019-LSVT競(jìng)賽數(shù)據(jù)包括5萬(wàn)張精標(biāo)注街景圖像、40萬(wàn)張弱標(biāo)注街景圖像,聚焦探索大規(guī)模數(shù)據(jù)場(chǎng)景下深度學(xué)習(xí)文字識(shí)別能力極限。ICDAR2019-ArT競(jìng)賽數(shù)據(jù)總計(jì)10176張,是業(yè)界最大的任意形狀場(chǎng)景文字集合,聚焦推動(dòng)自然場(chǎng)景下任意形狀文字檢測(cè)識(shí)別能力新突破。
各工業(yè)界與學(xué)術(shù)界頂尖團(tuán)隊(duì)充分發(fā)揮各自技術(shù)優(yōu)勢(shì),針對(duì)競(jìng)賽任務(wù)不斷優(yōu)化創(chuàng)新方案與算法效果,經(jīng)過(guò)激烈角逐的比賽結(jié)果展現(xiàn)出大規(guī)模街景文字識(shí)別深度學(xué)習(xí)、任意形狀文字檢測(cè)與識(shí)別技術(shù)新高度。百度聯(lián)合學(xué)術(shù)界將持續(xù)對(duì)該競(jìng)賽集合及榜單進(jìn)行維護(hù),為推進(jìn)相關(guān)視覺(jué)AI技術(shù)領(lǐng)域不斷發(fā)展貢獻(xiàn)力量。
圖1. ICDAR 2019-LSVT競(jìng)賽結(jié)果示例:人工標(biāo)注 vs 算法效果
圖2. ICDAR 2019-ArT競(jìng)賽結(jié)果示例:人工標(biāo)注 vs 算法效果
百度OCR實(shí)力強(qiáng)勁 多場(chǎng)景應(yīng)用實(shí)踐豐富
此次ICDAR 2019國(guó)際競(jìng)賽任務(wù)推動(dòng)了大規(guī)模街景深度學(xué)習(xí)文字識(shí)別及任意形狀文字識(shí)別方向的發(fā)展,是一場(chǎng)學(xué)術(shù)交流與技術(shù)碰撞的盛宴。而在ICDAR 2019國(guó)際競(jìng)賽中,百度OCR承擔(dān)競(jìng)賽組織者角色,這也進(jìn)一步加強(qiáng)了百度的國(guó)際影響力。
百度曾在2015至2019年期間多次獲得ICDAR 2013、 ICDAR 2015、ICDAR 2017-MLT、ICDAR2017-RCTW權(quán)威集合檢測(cè)、識(shí)別、端到端各項(xiàng)任務(wù)榜單第一,處于業(yè)內(nèi)領(lǐng)先水平。近兩年來(lái),百度OCR也多次在CVPR,ICCV,BMVC,ACCV,ICDAR等會(huì)議上發(fā)表論文,此次ICDAR 2019有兩篇新工作被接收。"An End-to-end Video Text Detector with Online Tracking" 致力于解決視頻OCR檢測(cè)問(wèn)題,將視頻文字檢測(cè)和在線跟蹤任務(wù)高效集成到統(tǒng)一、可訓(xùn)練的網(wǎng)絡(luò)框架中。"EATEN: Entity-aware Attention for Single Shot Visual Text Extraction"提出端到端的結(jié)構(gòu)化信息提取方法,同時(shí)公開(kāi)了結(jié)構(gòu)化信息提取領(lǐng)域的大型數(shù)據(jù)集合。
百度不僅致力于OCR技術(shù)領(lǐng)域的縱深研究,同時(shí)也是“領(lǐng)先且實(shí)用AI視覺(jué)技術(shù)”的堅(jiān)定實(shí)踐者。多年實(shí)踐經(jīng)驗(yàn)積累形成了豐富的百度OCR產(chǎn)品矩陣。通用系列文字識(shí)別能力不僅能高精度的識(shí)別文字,還支持中、英、日、韓、法等十國(guó)語(yǔ)言的識(shí)別以及置信度、位置等信息的返回;卡證識(shí)別能力不僅支持對(duì)身份證、銀行卡、護(hù)照、名片等常見(jiàn)卡證的識(shí)別,還支持卡證采集、分類、屬性判斷等能力;票據(jù)識(shí)別能力不僅支持財(cái)務(wù)場(chǎng)景全品類識(shí)別,還支持金融、醫(yī)療等場(chǎng)景票據(jù)識(shí)別;針對(duì)終端文字識(shí)別場(chǎng)景,百度領(lǐng)先的模型壓縮技術(shù)應(yīng)用于所有OCR終端產(chǎn)品,OCR終端SDK與多家手機(jī)廠商達(dá)成合作,將識(shí)字能力賦予手機(jī)。目前,百度OCR產(chǎn)品能力已超50項(xiàng),在各行業(yè)實(shí)現(xiàn)了諸多技術(shù)突破與產(chǎn)品落地,覆蓋了財(cái)務(wù)、銀行、醫(yī)療、政法、教育、交通、電商、快遞等場(chǎng)景。
未來(lái),百度會(huì)與各企業(yè)持續(xù)探索OCR的落地可能性,讓OCR賦能更多企業(yè),同時(shí)也將持續(xù)秉持普惠的價(jià)值理念,在產(chǎn)業(yè)實(shí)踐中不斷打磨,持續(xù)賦能服務(wù)客戶,持續(xù)打造領(lǐng)先且實(shí)用的AI技術(shù),用科技的力量讓復(fù)雜的世界更簡(jiǎn)單。
- 華為云推出火星數(shù)字空間模型:探索未來(lái)科技,開(kāi)啟火星新紀(jì)元
- 華為云盤古大模型5.5揭秘:五大基礎(chǔ)模型全面升級(jí),揭開(kāi)AI新篇章
- 華為智能眼鏡半年破音?小鵬高管揭秘:換新后依舊如此,真實(shí)體驗(yàn)大揭秘
- 蘿卜快跑能否征服東南亞,年底將揭曉!
- 張一鳴“隱身”國(guó)內(nèi)?知情人士揭秘:他仍在新加坡,定期回國(guó)交流技術(shù)
- 螞蟻數(shù)科辟謠:與海南華鐵僅交流未合作,勿過(guò)度解讀
- 機(jī)器人界新星Q5驚艷登場(chǎng),星動(dòng)紀(jì)元引領(lǐng)服務(wù)機(jī)器人新潮流
- 馬蜂窩夏季旅行新風(fēng)向:泡泡瑪特城市樂(lè)園成熱門,熱度暴漲114%引爆旅行新潮流
- 新能源汽車安全新標(biāo)準(zhǔn):三部門嚴(yán)陣以待,安全至上,規(guī)范行業(yè)新篇章
- 新能源車企人才爭(zhēng)奪戰(zhàn):揭秘哪些專業(yè)人才最緊缺
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。