女人被狂躁到高潮呻吟小说,蜜桃成人网,女人与公豬交交30分钟视频,久久无码精品一区二区三区,浓毛老太交欧美老妇热爱乱

動態(tài)生成掩膜預(yù)測網(wǎng)絡(luò)生成模型CondInst,助力FCN重奪實例檢測顛峰

實例分割是計算機(jī)視覺領(lǐng)域的基礎(chǔ)任務(wù),需要算法預(yù)測出圖像中每個實例的掩膜和對應(yīng)的分類標(biāo)簽。Mask R-CNN作為一種性能優(yōu)異的算法,在實例分割領(lǐng)域取得了巨大成功,這種兩階段的方法主要依賴于ROI操作來獲取最終的實例掩膜。

而在這篇文章中,作者從全新的角度解決了實例分割問題,來自澳大利亞阿德萊德大學(xué)的研究人員在實例條件下提出了動態(tài)實例生成的網(wǎng)絡(luò)模型,代替了先前逐個實例的ROI區(qū)域作為預(yù)測的輸入。

這種全卷積網(wǎng)絡(luò)消除了對于ROI區(qū)域測裁剪操作和特征配準(zhǔn)方法,其次由于動態(tài)生成的條件卷積大幅提升了網(wǎng)絡(luò)容量使得mask分支變得非常緊湊,推理速度得到了大幅度提升。實驗表明這種方法無需更長時間的訓(xùn)練,在COCO數(shù)據(jù)集上取得了比Mask R-CNN更好的結(jié)果,同時在精度和速度上都得到了明顯提升。

實例分割

Mask R-CNN是近幾年來實例分割領(lǐng)域非常重要的突破,它使用了Faster R-CNN來為每個實例預(yù)測邊界框,而后針對每個實例利用ROIAlign操作對在特征圖中進(jìn)行ROI區(qū)域裁剪,最后利用緊湊的全卷積網(wǎng)絡(luò)來對每一個實例的掩膜進(jìn)行預(yù)測。

然而這種基于ROI的方法也有著諸多需要克服的困難:

首先ROI一般都是和圖像坐標(biāo)軸對齊的邊框,當(dāng)遇到非常規(guī)不規(guī)則物體時框中就會包含較多的背景或者其他實例的部分。雖然可以通過旋轉(zhuǎn)ROI解決這一問題,但隨之而來是更為復(fù)雜的計算代價和處理流程;其次為了區(qū)分前景和背景或者其他雜亂的實例,mask端需要堆疊更多的卷積層來獲取更大的感受野,這使得計算量大幅增加;第三由于ROI尺寸各不相同,為了有效利用批(batch)處理計算它們會被重置為相同的大小,這會限制大范圍實例的分辨率。

在計算機(jī)視覺領(lǐng)域與實例分割最相近的要數(shù)語義分割了,全卷積網(wǎng)絡(luò)FCN在這一任務(wù)上取得了巨大的成功。此外FCN同時也在其他逐像素的預(yù)測任務(wù)上表現(xiàn)優(yōu)異,像圖像去噪、超分辨這類底層圖像處理任務(wù)、光流估計和邊緣檢測這類中級任務(wù),單發(fā)目標(biāo)檢測、單目深度估計和目標(biāo)計數(shù)這類高級任務(wù)都有著FCN的貢獻(xiàn)。但在實例分割任務(wù)中幾乎所有的純粹FCN方法都沒有達(dá)到最先進(jìn)的水平。究竟是什么原因讓強(qiáng)大的FCN在實例分割中敗下陣來呢?

研究人員發(fā)現(xiàn)主要的問題在于,網(wǎng)絡(luò)對于同一張圖像需要針對不同類別預(yù)測出不同的掩膜,這會讓FCN陷入兩難的境地。例如針對兩個人A和B,在圖像中具有相同的外觀和形狀特征,但在預(yù)測A的掩膜時網(wǎng)絡(luò)需要將B視為背景,這會讓網(wǎng)絡(luò)陷入到一定程度的迷茫中。所以ROI才需要將目標(biāo)區(qū)域特征圖剪切出來。

本質(zhì)上來講,實例分割網(wǎng)絡(luò)需要兩種類型的信息:外觀形狀特征信息用于確定目標(biāo)類別、位置信息用于從同一類中區(qū)分出不同的實例?;赗OI的方法都隱式地編碼了目標(biāo)實例的位置信息。而這篇文章的方法則探索對對于實例位置敏感的卷積層來嘗試解決目標(biāo)位置信息問題。

基于這樣的考量,研究人員提出了新的解決方法,來代替標(biāo)準(zhǔn)的、由一系列固定權(quán)重濾波器組成的ConvNet來作為實例預(yù)測端針對所有實例進(jìn)行處理,利用了一種參數(shù)基于待預(yù)測實例自適應(yīng)的網(wǎng)絡(luò)結(jié)構(gòu)來進(jìn)行預(yù)測。在動態(tài)濾波器和條件卷積的啟發(fā)下,控制子網(wǎng)絡(luò)會針對每一個實例動態(tài)生成mask FCN的網(wǎng)絡(luò)參數(shù)(也就是基于帶預(yù)測實例的中心區(qū)域來生成),隨后這些參數(shù)實例化為mask FCN用于預(yù)測對應(yīng)實例的掩膜。

其中的思想在于網(wǎng)絡(luò)參數(shù)能夠編碼實例的特征、并僅激活這一實例的像素,巧妙地避開了前面提到的問題。得到的條件mask端作用于整個特征圖免去了獲取ROI的操作。這一方法也許在有的人看來會帶來非常多的網(wǎng)絡(luò)參數(shù)(由于實例的數(shù)量很多),但研究人員巧妙地利用了動態(tài)生成的濾波器來構(gòu)建緊湊的FCN mask預(yù)測端,在提高性能的同時,大幅度減少了計算復(fù)雜性。

CondInst

實例分割模型的目標(biāo)在于通過輸入圖像為圖中的實例預(yù)測出對應(yīng)的掩膜,實例數(shù)量的不確定對于傳統(tǒng)的FCN來說十分困難。本文工作的核心在于,針對圖中待處理的K個實例,模型會動態(tài)生成K個不同的掩膜處理端,每個掩膜處理分支將目標(biāo)實例的特征包含在了其參數(shù)中。當(dāng)其作用于特征圖時僅僅會激活實例上的像素用于掩膜預(yù)測。下圖顯示了模型的主要架構(gòu):

12下一頁>

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2020-06-11
動態(tài)生成掩膜預(yù)測網(wǎng)絡(luò)生成模型CondInst,助力FCN重奪實例檢測顛峰
實例分割是計算機(jī)視覺領(lǐng)域的基礎(chǔ)任務(wù),需要算法預(yù)測出圖像中每個實例的掩膜和對應(yīng)的分類標(biāo)簽。

長按掃碼 閱讀全文