從複雜的機率分布中取樣在許多領域都很重要,包括統計建模、機器學習和物理學。這涉及從目標分布中生成代表性的數據點,以解決如貝葉斯推斷、分子模擬和高維空間中的優化等問題。與生成建模不同,生成建模使用現有的數據樣本,而取樣則需要算法在沒有直接訪問這些樣本的情況下探索分布的高概率區域。在高維空間中,這項任務變得更加複雜,因為識別和準確估計感興趣的區域需要有效的探索策略和大量的計算資源。
這個領域的一個主要挑戰來自於需要從未標準化的密度中取樣,因為正規化常數通常無法獲得。有了這個常數,即使評估給定點的可能性也變得更容易。隨著分布的維度增加,問題變得更加嚴重;概率質量通常集中在狹窄的區域,使得傳統方法在計算上變得昂貴且效率低下。當前的方法經常難以平衡計算效率和高維問題的取樣準確性,特別是當存在尖銳且分離良好的模式時。
有兩種主要方法可以應對這些挑戰,但各有局限:
序列蒙特卡羅 (Sequential Monte Carlo, SMC)
SMC技術通過一系列中間步驟,逐漸將粒子從初始的簡單先驗分布演變到複雜的目標分布。這些方法使用馬爾可夫鏈蒙特卡羅 (Markov Chain Monte Carlo, MCMC) 等工具來細化粒子的位置,並通過重取樣來專注於更可能的區域。然而,SMC方法可能因依賴預定的轉換而導致收斂緩慢,這些轉換本可以更動態地優化以適應目標分布。
擴散基方法 (Diffusion-based Methods)
擴散基方法學習隨機微分方程 (Stochastic Differential Equations, SDEs) 的動態,以在目標分布之前運輸樣本。這種適應性使它們能克服SMC的一些限制,但通常會以訓練過程中的不穩定性和模式崩潰等問題為代價。
來自劍橋大學 (University of Cambridge)、柏林蘇茲研究所 (Zuse Institute Berlin)、dida Datenschmiede GmbH、加州理工學院 (California Institute of Technology) 和卡爾斯魯厄理工學院 (Karlsruhe Institute of Technology) 的研究人員提出了一種新型取樣方法,稱為序列控制朗之萬擴散 (Sequential Controlled Langevin Diffusion, SCLD)。這種方法結合了SMC的穩健性和擴散基取樣器的適應性。研究人員將這兩種方法框架置於連續時間的範疇內,使得學習的隨機轉換與SMC的重取樣策略無縫整合。這樣,SCLD算法利用了它們的優勢,同時解決了它們的弱點。
SCLD算法引入了一個連續時間框架,通過退火和自適應控制的組合來優化粒子軌跡。從先驗分布開始,粒子沿著一系列退火密度向目標分布引導,並結合重取樣和MCMC的細化,以保持多樣性和精確性。該算法使用對數方差損失函數,確保數值穩定性,並在高維度中有效擴展。SCLD框架允許端到端的優化,使其組件的直接訓練得以改善性能和效率。使用隨機轉換而非確定性轉換進一步增強了算法探索複雜分布的能力,而不會陷入局部最優解。
研究人員在11個基準任務上測試了SCLD算法,這些任務包括合成和現實世界的例子。這些任務包括高維問題,如在50維中具有40個模式的高斯混合模型 (Gaussian mixture models, GMM40)、具有多個良好分離模式的機器手臂配置,以及如信用數據集的貝葉斯推斷和布朗運動等實際任務。在這些多樣的基準中,SCLD的表現超過了其他方法,包括傳統的SMC、CRAFT和控制蒙特卡羅擴散 (Controlled Monte Carlo Diffusions, CMCD)。
SCLD算法在許多基準任務上達到了最先進的結果,僅需其他擴散基方法10%的訓練預算。在ELBO估計任務中,SCLD在所有任務中都取得了最佳表現,僅使用3000次梯度步驟就超越了CMCD-KL和CMCD-LV在40,000步驟後獲得的結果。在像GMM40和Robot4這樣的多模態任務中,SCLD避免了模式崩潰,並準確地從所有目標模式中取樣,與CMCD-KL相比,後者崩潰到更少的模式,而CRAFT則在樣本多樣性上掙扎。收斂分析顯示,SCLD迅速超越了CRAFT等競爭對手,在五分鐘內達到最先進的結果,並將與CMCD相比的訓練時間和迭代次數減少了十倍。
這項研究帶來了幾個重要的啟示和見解:
- 混合方法結合了SMC重取樣步驟的穩健性和學習擴散轉換的靈活性,提供了一種平衡且高效的取樣機制。
- 通過利用端到端優化和對數方差損失函數,SCLD以最少的計算資源實現了高準確性。它通常只需要競爭方法10%的訓練迭代。
- 該算法在高維空間中表現穩健,例如50維的任務,傳統方法在模式崩潰或收斂問題上掙扎。
- 該方法在各種應用中顯示出潛力,包括機器人技術、貝葉斯推斷和分子模擬,展示了其多樣性和實用性。
總結來說,SCLD算法有效解決了序列蒙特卡羅和擴散基方法的限制。通過將穩健的重取樣與自適應隨機轉換相結合,SCLD在最少的計算資源下實現了更高的效率和準確性,同時在高維和多模態任務中提供了卓越的性能。它適用於從機器人技術到貝葉斯推斷等多種應用。SCLD為取樣算法和複雜統計計算樹立了新的基準。
查看論文。這項研究的所有功勞都歸於這個項目的研究人員。此外,別忘了在Twitter上關注我們,加入我們的Telegram頻道和LinkedIn小組。還有,別忘了加入我們的60k+機器學習SubReddit。
🚨 熱門消息:LG AI研究發布EXAONE 3.5:三個開源雙語前沿AI級模型,提供無與倫比的指令跟隨和長上下文理解,為生成AI卓越的全球領導地位奠定基礎……。
新聞來源
本文由 AI 台灣 使用 AI 編撰,內容僅供參考,請自行進行事實查核。加入 AI TAIWAN Google News,隨時掌握最新 AI 資訊!