這篇AI論文以序列控制的Langevin擴散算法樹立了取樣的新標準

從複雜的機率分布中取樣在許多領域都很重要，包括統計建模、機器學習和物理學。這涉及從目標分布中生成代表性的數據點，以解決如貝葉斯推斷、分子模擬和高維空間中的優化等問題。與生成建模不同，生成建模使用現有的數據樣本，而取樣則需要算法在沒有直接訪問這些樣本的情況下探索分布的高概率區域。在高維空間中，這項任務變得更加複雜，因為識別和準確估計感興趣的區域需要有效的探索策略和大量的計算資源。

這個領域的一個主要挑戰來自於需要從未標準化的密度中取樣，因為正規化常數通常無法獲得。有了這個常數，即使評估給定點的可能性也變得更容易。隨著分布的維度增加，問題變得更加嚴重；概率質量通常集中在狹窄的區域，使得傳統方法在計算上變得昂貴且效率低下。當前的方法經常難以平衡計算效率和高維問題的取樣準確性，特別是當存在尖銳且分離良好的模式時。

有兩種主要方法可以應對這些挑戰，但各有局限：

序列蒙特卡羅 (Sequential Monte Carlo, SMC)

SMC技術通過一系列中間步驟，逐漸將粒子從初始的簡單先驗分布演變到複雜的目標分布。這些方法使用馬爾可夫鏈蒙特卡羅 (Markov Chain Monte Carlo, MCMC) 等工具來細化粒子的位置，並通過重取樣來專注於更可能的區域。然而，SMC方法可能因依賴預定的轉換而導致收斂緩慢，這些轉換本可以更動態地優化以適應目標分布。

擴散基方法 (Diffusion-based Methods)

擴散基方法學習隨機微分方程 (Stochastic Differential Equations, SDEs) 的動態，以在目標分布之前運輸樣本。這種適應性使它們能克服SMC的一些限制，但通常會以訓練過程中的不穩定性和模式崩潰等問題為代價。

來自劍橋大學 (University of Cambridge)、柏林蘇茲研究所 (Zuse Institute Berlin)、dida Datenschmiede GmbH、加州理工學院 (California Institute of Technology) 和卡爾斯魯厄理工學院 (Karlsruhe Institute of Technology) 的研究人員提出了一種新型取樣方法，稱為序列控制朗之萬擴散 (Sequential Controlled Langevin Diffusion, SCLD)。這種方法結合了SMC的穩健性和擴散基取樣器的適應性。研究人員將這兩種方法框架置於連續時間的範疇內，使得學習的隨機轉換與SMC的重取樣策略無縫整合。這樣，SCLD算法利用了它們的優勢，同時解決了它們的弱點。

SCLD算法引入了一個連續時間框架，通過退火和自適應控制的組合來優化粒子軌跡。從先驗分布開始，粒子沿著一系列退火密度向目標分布引導，並結合重取樣和MCMC的細化，以保持多樣性和精確性。該算法使用對數方差損失函數，確保數值穩定性，並在高維度中有效擴展。SCLD框架允許端到端的優化，使其組件的直接訓練得以改善性能和效率。使用隨機轉換而非確定性轉換進一步增強了算法探索複雜分布的能力，而不會陷入局部最優解。

研究人員在11個基準任務上測試了SCLD算法，這些任務包括合成和現實世界的例子。這些任務包括高維問題，如在50維中具有40個模式的高斯混合模型 (Gaussian mixture models, GMM40)、具有多個良好分離模式的機器手臂配置，以及如信用數據集的貝葉斯推斷和布朗運動等實際任務。在這些多樣的基準中，SCLD的表現超過了其他方法，包括傳統的SMC、CRAFT和控制蒙特卡羅擴散 (Controlled Monte Carlo Diffusions, CMCD)。

SCLD算法在許多基準任務上達到了最先進的結果，僅需其他擴散基方法10%的訓練預算。在ELBO估計任務中，SCLD在所有任務中都取得了最佳表現，僅使用3000次梯度步驟就超越了CMCD-KL和CMCD-LV在40,000步驟後獲得的結果。在像GMM40和Robot4這樣的多模態任務中，SCLD避免了模式崩潰，並準確地從所有目標模式中取樣，與CMCD-KL相比，後者崩潰到更少的模式，而CRAFT則在樣本多樣性上掙扎。收斂分析顯示，SCLD迅速超越了CRAFT等競爭對手，在五分鐘內達到最先進的結果，並將與CMCD相比的訓練時間和迭代次數減少了十倍。