研究無分類器引導的有效性
這篇論文被接受於2024年NeurIPS的現代機器學習數學研討會(M3L)。
我們研究了無分類器引導(CFG)的不合理有效性。CFG是文本到圖像擴散模型中條件取樣的主要方法,但與擴散的其他方面不同,它的理論基礎仍然不穩固。在這篇論文中,我們駁斥了一些常見的誤解,顯示CFG與DDPM和DDIM的互動方式不同,且這兩種取樣器與CFG都無法生成伽瑪分佈。
接著,我們澄清了CFG的行為,顯示它是一種預測-修正(PC)方法,交替進行去噪和銳化,我們稱之為預測-修正引導(PCG)。我們展示在隨機微分方程(SDE)極限下,DDPM-CFG等同於PCG,並且使用DDIM預測器應用於條件分佈,還有Langevin動力學修正器應用於伽瑪分佈。雖然標準的PC修正器應用於條件分佈並提高取樣準確性,但我們的修正器則是對分佈進行銳化。
新聞來源
本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!