智象未來團隊提出全新層級自回歸生成范式Hierarchical Masked Autoregressive models (Hi-MAR),有效解決自回歸圖像生成中結構失真問題。該研究已被 ICML 2025 收錄,并在多個圖像生成任務中取得領先性能。
現(xiàn)有自回歸圖像生成模型存在缺乏全局結構建模能力、訓練-推理分布不一致、尺度引導缺失等問題。Hi - MAR 借鑒人類繪畫過程,采用自頂向下層次化生成范式,還引入多尺度聯(lián)合訓練策略等。實驗顯示,其在圖像質量和語義一致性上優(yōu)于主流方法,可以顯著提升模型的全局感知能力與生成質量。
本次發(fā)表的論文《Hierarchical Masked Autoregressive Models with Low-Resolution Token Pivots》,展示了團隊在多模態(tài)生成式基礎架構設計領域的前沿探索。這一全新的層級自回歸生成架構 Hi-MAR,為構建具備“全局感知+局部細化”能力的生成基礎架構提供了新的范式,同時它也是HiDream系列開源模型家族重要的一員,為下一代多模態(tài)生成式基礎架構的技術演進帶來更多的可能性!
- 劉強東反思退休:從理想主義到職業(yè)經(jīng)理人傳承的轉變
- 北京智能家居新補貼:解鎖、馬桶等產(chǎn)品最高享2000元優(yōu)惠
- 華為遼寧移動聯(lián)手創(chuàng)新,全球首個智能追焦單元商用組網(wǎng)驚艷登場
- 華為C919再獲肯定,DeepSeek引領科技新潮流
- 蘋果iOS 18.6新功能曝光:AI功能仍缺席,國行iPhone用戶或成最大犧牲品?
- 華為鴻蒙OS PC市場潛力顯現(xiàn),中國大陸PC市場2025年Q1有望迎來強勁增長
- 李書福豪賭新能源車市:極星獲2億美元“定心錘”,能否攪動高端市場?
- 印度共享汽車平臺Zoomcar再陷數(shù)據(jù)泄露風波:840萬用戶信息受影響,警惕安全風險
- 小鵬汽車老板回應小米股票投資:賺翻卻不吹捧紅利空間
- 小米汽車熱銷背后:技術實力取勝,不依賴流量,實干鑄就輝煌
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。