近日,在國際頂級的計算機視覺競賽Pascal VOC挑戰(zhàn)賽目標檢測comp4賽道上,創(chuàng)新奇智(AInnovation)研發(fā)的AInnoDetection目標檢測算法獲得綜合成績排名第一的好成績,超越Google、Microsoft、CMU(美國卡耐基-梅隆大學)、清華大學、阿里巴巴、平安科技、搜狗、Yi+、騰訊優(yōu)圖等眾多國內(nèi)外知名人工智能企業(yè)和高校人工智能實驗室,在Pascal VOC共20項的評測指標中,其中10項指標排名第一,充分體現(xiàn)了創(chuàng)新奇智人工智能算法能力,尤其是AI視覺算法的創(chuàng)新和設計能力。
創(chuàng)新奇智在20項評測指標中取得10項指標第一、總分第一的成績
(單項第一使用黑粗體顯示)
(圖片來源:Pascal VOC官網(wǎng))
Pascal VOC數(shù)據(jù)集
目標檢測是圖像領域三大基本任務之一,同時也是圖像領域非常具有挑戰(zhàn)的算法難題。Pascal VOC挑戰(zhàn)賽是世界最權威的三大計算機視覺挑戰(zhàn)賽之一,其數(shù)據(jù)集標注質(zhì)量高、場景復雜、目標多樣、檢測難度大,是快速檢驗算法有效性的首選。Pascal VOC數(shù)據(jù)量小但是場景豐富,更加考驗人工智能算法的設計和創(chuàng)新能力。ImageNet、MSCOCO數(shù)據(jù)量大,側重考查人工智能算力的建設能力。
Pascal VOC是國內(nèi)外AI公司競相展開激烈競爭的主賽場。截至目前,Pascal VOC挑戰(zhàn)賽吸引了全球近百支專業(yè)隊伍參賽,包括Google、Microsoft、CMU(美國卡耐基-梅隆大學)、清華大學、阿里巴巴、騰訊、搜狗、Yi+、平安科技等國內(nèi)外知名圖像領域的頂尖團隊參與比賽。
Pascal VOC的數(shù)據(jù)集包括數(shù)十個類別,包括人類、動物、交通工具、室內(nèi)物體等。創(chuàng)新奇智視覺算法團隊參加了Object Detection (Competition4) 子任務,在20類不同的目標檢測上獲得了10個類別的檢測MAP(準確率)第一、總分第一的成績。
Pascal VOC數(shù)據(jù)集部分樣本
創(chuàng)新奇智AInnoDetection算法
創(chuàng)新奇智提出的AInnoDetection模型算法,使用著名的二階段檢測算法,采用數(shù)據(jù)增強來擴充訓練數(shù)據(jù),包括填充小物體和mixup的方法。
通過以上步驟,使檢測模型能夠?qū)π∥矬w檢測效果更好,同時能夠使模型預測效果更好,更健壯。
模型選擇著名的二階段檢測網(wǎng)絡,骨干網(wǎng)絡使用ResneXt152網(wǎng)絡架構,使用它來提取多尺度特征圖,頸部網(wǎng)絡采用一個6級特征金字塔網(wǎng)絡(FPN),用來生成更豐富的多尺度卷積特征金字。在這之后,連接兩個共享子網(wǎng),一個子網(wǎng)負責分類目標框,另一個網(wǎng)絡負責將目標框回歸到真實框,最后使用focal-loss作為二分類的損失。同時采用多尺度測試融合,這樣能夠使網(wǎng)絡根據(jù)不同的圖像尺度來關注不同的目標框信息。
讓小圖片更加關注大物體,大圖片更加關注小物體。
最后采用多模型融合的方法,輸出最優(yōu)的結果。
目標檢測算法的商用價值
創(chuàng)新奇智自成立伊始就瞄準高精尖的人工智能算法在零售、制造、金融等多個領域的商業(yè)化產(chǎn)品落地,重點突破人工智能算法的領先性和成熟性,形成具有巨大商業(yè)潛力的AI產(chǎn)品和解決方案。目前,創(chuàng)新奇智已經(jīng)打造出業(yè)界領先的機器學習平臺和AI工業(yè)視覺平臺ManuVision,并發(fā)表了數(shù)篇頂級會議論文。這些成果實實在在提升了算法在實際場景的精度,提升了訓練和推理的速度,并極為高效地整合了算力資源。
據(jù)悉,創(chuàng)新奇智的人工智能視覺算法已經(jīng)應用在零售渠道陳列監(jiān)控的商品識別、智能貨柜、工業(yè)視覺、智慧園區(qū)社區(qū)等領域,商用效果處于行業(yè)領先水平。此次奪冠的目標檢測算法在創(chuàng)新奇智的商品檢測、工業(yè)視覺缺陷檢測、渠道陳列監(jiān)控等產(chǎn)品中已經(jīng)使用。除了這次Pascal VOC賽事奪冠之外,創(chuàng)新奇智在多個世界頂級人工智能算法大賽上奪冠,比如最近,創(chuàng)新奇智在WIDER FACE人臉檢測賽事中奪冠。
關于參賽團隊
創(chuàng)新奇智本次Pascal VOC競賽奪冠隊伍由張發(fā)恩、吳佳洪、楊志錚、曹浩天、宋劍飛和范馨予組成。其中團隊Leader張發(fā)恩現(xiàn)任創(chuàng)新奇智CTO、創(chuàng)新工場人工智能工程院首席架構師和寧波諾丁漢大學榮譽教授,他在人工智能工業(yè)界和學術界成績不菲,曾任職Microsoft、Google和百度,持有多項國內(nèi)外人工智能算法專利和發(fā)表過數(shù)篇人工智能頂級會議論文。隊伍中其他成員也都有著深厚的人工智能教育背景和從業(yè)經(jīng)歷。
創(chuàng)新奇智是創(chuàng)新工場的AI子公司,以“人工智能賦能商業(yè)未來”為使命,致力于用最前沿的人工智能技術為企業(yè)提供AI相關產(chǎn)品及商業(yè)解決方案。創(chuàng)新奇智CEO徐輝在IT行業(yè)擁有20余年的銷售、產(chǎn)品、技術、服務、管理經(jīng)驗,歷任IBM、微軟、SAP等多家世界500強科技巨頭企業(yè)高管,對中國市場各個行業(yè)發(fā)展有著深入了解。創(chuàng)新奇智采用 “技術產(chǎn)品”+“行業(yè)場景”雙輪驅(qū)動模式,商業(yè)化速度飛快。
創(chuàng)新奇智擁有優(yōu)異的技術研發(fā)團隊,結合AI技術商業(yè)化的特點,制定了科學技術人才三級體系建設方案,三級體系形成一個金字塔結構,從頂?shù)较路謩e是:“創(chuàng)新奇智科研委員會 — 創(chuàng)新奇智創(chuàng)新研究院 — 創(chuàng)新奇智工程算法研發(fā)團隊”。其中,“創(chuàng)新奇智科研委員會” 由世界頂級人工智能科學家及知名專家擔任,包括前騰訊AI Lab負責人張潼、 百度研究院三維視覺首席科學家楊睿剛、密歇根州立大學教授張彌、創(chuàng)新工場人工智能工程院執(zhí)行院長王詠剛、創(chuàng)新奇智CTO張發(fā)恩。
- 為什么年輕人不愛換手機了
- 柔宇科技未履行金額近億元被曝已6個月發(fā)不出工資
- 柔宇科技被曝已6個月發(fā)不出工資 公司回應欠薪有補償方案
- 第六座“綠動未來”環(huán)保公益圖書館落地貴州山區(qū)小學
- 窺見“新紀元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機打造全新一代屏幕壓感
- 清潔家電新老玩家市場定位清晰,攜手共進,核心技術決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領域達成戰(zhàn)略合作伙伴關系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。