人工智能進軍動漫產業(yè),可以助力整個行業(yè),讓動漫日更、優(yōu)化動漫視效?
來自喵圖科技的算法研發(fā)團隊給出了深度學習在動漫領域的研究進展,開發(fā)了一套在壓縮GPU顯存的情況下,通過人工智能給漫畫線稿優(yōu)化線條、自動上色的技術。
訓練機器自動上色,生成效果“以假亂真”!
研究團隊使用生成對抗網絡(GAN)完成上色任務,達到與人工作畫相近的效果。GAN 使用了兩個以博弈論的方式協(xié)同工作的網絡,以相互競賽的方式來訓練彼此。構成 GAN 的兩個網絡分別是鑒別器和生成器,神經網絡自行從輸入圖片中學習到上色的方法,由生成器創(chuàng)建偽造的樣本,同時鑒別器接收[input, training data]和[input, fake output]對來鑒別哪些樣本是真實的,哪些樣本是偽造的。網絡G的目標就是盡量生成真實的圖片去欺騙判別網絡D,隨著其中一個網絡變得更強大,另一個網絡也必須適應和提升。最后博弈的結果是什么?在最理想的狀態(tài)下,G可以生成足以“以假亂真”的圖片?;贕AN 的生成器,研發(fā)團隊還針對不同的業(yè)務場景設計了解耦模型,通過校正輸出、輸入圖片之間的關系,減弱甚至消除這種相互關聯(lián),將不同場景區(qū)別開來。如此訓練后得到的模型,能夠找到最接近輸入圖片畫面風格的參數(shù),實現(xiàn)自動上色。
喵圖科技自動上色多種渲染,一鍵完成只需0.5秒
攻克技術難題,GPU模型壓縮技術很優(yōu)秀
傳統(tǒng)的自動上色算法對GPU的資源消耗極大,很難做到大規(guī)模的對應上色處理請求。舉個例子來講,具有50個卷積層的ResNet-50需要超過95MB的存儲器以及38億次浮點運算。喵圖科技研發(fā)團隊基于通道減枝,試圖去除冗余和不重要的項來降低存儲和計算復雜度,訓練一個更緊湊的神經網絡來重現(xiàn)一個更大的網絡的輸出。此外,他們還將神經網絡二值化,讓計算主要在正1或負1間進行,幾十倍地降低了網絡大小和計算量,保證預測準確率。經過他們的努力,AI自動上色仍能照常工作,但GPU 顯存占用降低至原模型的5%,速度提升為10倍。
此項研究的成功,代表著自動上色技術不僅可以用于娛樂面向用戶,也可以形成低成本工業(yè)規(guī)模服務于整個動漫行業(yè),可以為動漫行業(yè)提供“工業(yè)級”畫面輸出,大大壓縮動漫制作的生產時間,節(jié)約生產成本。在未來,動漫制作組只需要幾個人為作品制作劇情方向、繪制部分分鏡,剩下的可以都交給AI自動上色來搞定。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。