網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

生成式貝葉斯濾波和參數(shù)學(xué)習(xí)

2026-02-09 00:13:15　來源: CreateAMind

上海舉報(bào)

分享至

Generative Bayesian Filtering and Parameter Learning

https://arxiv.org/pdf/2511.04552

摘要

生成貝葉斯濾波（Generative Bayesian Filtering, GBF）為復(fù)雜非線性非高斯?fàn)顟B(tài)空間模型的后驗(yàn)推斷提供了一個(gè)強(qiáng)大而靈活的框架。我們的方法將生成貝葉斯計(jì)算（Generative Bayesian Computation, GBC）擴(kuò)展到動(dòng)態(tài)場(chǎng)景，利用深度神經(jīng)網(wǎng)絡(luò)驅(qū)動(dòng)的基于仿真的方法實(shí)現(xiàn)遞歸后驗(yàn)推斷。GBF 無(wú)需顯式密度評(píng)估，因此在觀測(cè)分布或狀態(tài)轉(zhuǎn)移分布難以解析處理時(shí)尤為有效。為解決參數(shù)學(xué)習(xí)問題，我們引入了生成吉布斯采樣器（Generative-Gibbs sampler），該采樣器通過從隱式全條件分布中迭代采樣各變量，繞過顯式密度評(píng)估。這一技術(shù)具有廣泛的適用性，能夠?qū)崿F(xiàn)具有難以處理密度的層次貝葉斯模型（包括狀態(tài)空間模型）中的推斷。我們通過模擬研究和實(shí)證研究評(píng)估了所提出方法的性能，包括 α-穩(wěn)定隨機(jī)波動(dòng)率模型的估計(jì)。研究結(jié)果表明，在處理難以處理的狀態(tài)空間模型時(shí)，GBF 在準(zhǔn)確性和穩(wěn)健性方面顯著優(yōu)于現(xiàn)有的無(wú)似然方法。

1 引言

狀態(tài)空間模型是宏觀經(jīng)濟(jì)學(xué)和金融學(xué)中時(shí)間序列分析的基石，在自然科學(xué)和社會(huì)科學(xué)領(lǐng)域也有廣泛應(yīng)用，適用于需要從含噪或不完整數(shù)據(jù)中推斷潛在動(dòng)態(tài)過程的場(chǎng)景。

難處理模型在各個(gè)領(lǐng)域均有出現(xiàn)。例如，在金融學(xué)中，α-穩(wěn)定分布常被用于捕捉資產(chǎn)收益率呈現(xiàn)的不對(duì)稱厚尾特征（Mandelbrot，1963；Mittnik and Rachev，1993），然而這些分布缺乏閉式密度表達(dá)式。在宏觀經(jīng)濟(jì)學(xué)中，非線性DSGE模型（Fernández-Villaverde et al.，2016）依賴于數(shù)值求解的均衡條件，導(dǎo)致轉(zhuǎn)移動(dòng)態(tài)僅能隱式定義，因此在分析上難以處理。類似的挑戰(zhàn)也出現(xiàn)在生物學(xué)中，機(jī)制模型如Lotka-Volterra捕食者-被捕食者系統(tǒng)（Lotka，1925；Volterra，1926）會(huì)導(dǎo)出具有難處理轉(zhuǎn)移核的狀態(tài)空間模型。更一般地說，每當(dāng)狀態(tài)空間模型的觀測(cè)或轉(zhuǎn)移分量通過某個(gè)數(shù)值黑盒模型定義時(shí)，便會(huì)出現(xiàn)難處理性。

雖然缺乏易處理的密度排除了基于標(biāo)準(zhǔn)似然的推斷，但許多難處理的狀態(tài)空間模型仍然允許從生成過程進(jìn)行高效模擬。這一重要特征促使了在此類情境下采用近似貝葉斯計(jì)算方法。特別是，Jasra等人（2012）引入了ABC粒子濾波器，用于在似然難處理的狀態(tài)空間模型中進(jìn)行狀態(tài)推斷；而Jasra等人（2013）提出了一種粒子MCMC方法，該方法利用ABC-PF構(gòu)建似然估計(jì)量，以對(duì)狀態(tài)和模型參數(shù)進(jìn)行聯(lián)合推斷。

盡管這些方法具有理想的漸近收斂性質(zhì)——我們將在后文詳細(xì)討論——但它們?cè)谟邢迾颖局械男阅苋晕吹玫匠浞掷斫狻Ｓ绕涫茿BC-PF的準(zhǔn)確性和可靠性對(duì)若干實(shí)施選擇高度敏感。這包括用于比較模擬數(shù)據(jù)和觀測(cè)數(shù)據(jù)的距離度量的定義、控制接受與否的容差閾值的選擇，以及所使用的粒子數(shù)量。增加粒子數(shù)量并降低容差可以改善后驗(yàn)近似效果。然而，這種組合在實(shí)際中往往在計(jì)算上不可行，而次優(yōu)的參數(shù)調(diào)整可能導(dǎo)致有偏估計(jì)和高度不穩(wěn)定的后驗(yàn)近似，從而引發(fā)對(duì)實(shí)證應(yīng)用穩(wěn)健性的擔(dān)憂。此外，這些問題還因粒子濾波器所存在的、已有充分記錄的問題（特別是權(quán)值退化和樣本貧化，參見例如Li et al., 2014）而加劇。

為解決這些擔(dān)憂，已有多種基礎(chǔ)ABC-PF的變體被提出（將在第2.2節(jié)中回顧），每種都旨在改進(jìn)理論保證或?qū)嶋H性能。盡管如此，這些工具從根本上仍然受限于ABC和SMC方法的結(jié)構(gòu)性局限。

然而，當(dāng)轉(zhuǎn)換到狀態(tài)空間背景時(shí)，GBC呈現(xiàn)出兩個(gè)結(jié)構(gòu)性局限。首先，它本質(zhì)上是靜態(tài)的，為固定數(shù)據(jù)集而非順序演化的觀測(cè)而設(shè)計(jì)。其次，它假設(shè)數(shù)據(jù)與參數(shù)之間存在直接聯(lián)系。這兩種假設(shè)都與狀態(tài)空間建模不兼容——在狀態(tài)空間建模中，諸如濾波等推斷任務(wù)需要對(duì)潛在狀態(tài) X t
t進(jìn)行遞歸更新，并且未知參數(shù)通常僅通過這些潛在過程間接影響觀測(cè)。因此，在本文中，我們通過擴(kuò)展GBC以支持遞歸推斷并適應(yīng)分層貝葉斯依賴關(guān)系，來應(yīng)對(duì)這兩個(gè)局限性。

1.1 貢獻(xiàn)與結(jié)構(gòu)

我們引入了一種新穎的狀態(tài)空間推斷與學(xué)習(xí)框架，該框架適用于所有能以方程（1）和（2）所示形式表達(dá)的模型——無(wú)論其噪聲分布或轉(zhuǎn)移函數(shù)與觀測(cè)函數(shù)的具體形式如何——只要能夠從該模型進(jìn)行模擬。因此，該框架也涵蓋了具有難處理密度函數(shù)的模型。

我們的方法立足于生成式貝葉斯計(jì)算，并將其擴(kuò)展到動(dòng)態(tài)情境。在此情境中，問題的結(jié)構(gòu)要求對(duì)潛在狀態(tài)序列 ( X t )
的后驗(yàn)分布進(jìn)行遞歸更新。最終目標(biāo)是重構(gòu)關(guān)鍵分布，如濾波分布、預(yù)測(cè)分布和平滑分布。我們既考慮了參數(shù)向量已知的情況，也考慮了參數(shù) θ 未知且必須從先驗(yàn)分布 p ( θ )
出發(fā)，通過數(shù)據(jù)推斷的情況。

我們的生成式濾波器（簡(jiǎn)稱Gen-Filter）旨在成為現(xiàn)有ABC-PF方法的一種有前景的替代方案。兩種方法都只需要具備從數(shù)據(jù)生成過程進(jìn)行模擬的能力。然而，與ABC-PF不同——ABC-PF由于使用接受閾值，提供的樣本來自于一個(gè)近似的、本質(zhì)上存在偏差的濾波分布——生成式濾波器允許從真實(shí)的濾波分布中采樣。只要訓(xùn)練數(shù)據(jù)集足夠大，且用于近似逆CDF映射的神經(jīng)網(wǎng)絡(luò)具有足夠的表達(dá)能力，這一結(jié)論就成立。設(shè)計(jì)一個(gè)有效的神經(jīng)網(wǎng)絡(luò)架構(gòu)仍然是我們方法中的核心挑戰(zhàn)。與Polson和Sokolov（2023）的研究一致，我們采用分位數(shù)神經(jīng)網(wǎng)絡(luò)作為我們的基線方法。我們也探索了其他潛在方法，包括O’Hagan和Ro?ková（2025）提出的貝葉斯替代方案。

我們的結(jié)果表明，只要訓(xùn)練數(shù)據(jù)集足夠大，標(biāo)準(zhǔn)的深度學(xué)習(xí)架構(gòu)能夠提供準(zhǔn)確可靠的性能。

這通常不構(gòu)成限制，因?yàn)樵诖蠖鄶?shù)情況下，從模型生成數(shù)據(jù)在計(jì)算上是高效且廉價(jià)的。

雖然我們的生成式濾波器（Gen-Filter）可以自然地用于構(gòu)建似然函數(shù)的估計(jì)量，從而能夠以類似于粒子馬爾可夫鏈蒙特卡羅算法的方式對(duì)潛在軌跡和未知參數(shù)進(jìn)行聯(lián)合推斷，但我們還開發(fā)了一種創(chuàng)新的采樣策略。這種策略提供了顯著更高的計(jì)算效率和卓越的靈活性，我們稱之為生成式吉布斯采樣器。

通過生成式吉布斯采樣器，我們將生成式貝葉斯計(jì)算方法擴(kuò)展到分層貝葉斯建模，即擴(kuò)展到具有多層潛在結(jié)構(gòu)和復(fù)雜參數(shù)依賴關(guān)系的場(chǎng)景。

與傳統(tǒng)吉布斯采樣類似，生成式吉布斯方法通過迭代地從模型參數(shù)的全條件分布中抽樣來生成后驗(yàn)樣本。至關(guān)重要的是，與經(jīng)典方法不同，所有全條件分布均通過隱式生成模型進(jìn)行近似，從而使得在原本全條件分布解析難處理的場(chǎng)景中仍能進(jìn)行吉布斯采樣。這使得生成式吉布斯采樣器具有廣泛的適用性，并且對(duì)難處理的狀態(tài)空間模型尤為有利。我們證明生成式吉布斯采樣器能夠獲得與傳統(tǒng)馬爾可夫鏈蒙特卡羅方法一致的后驗(yàn)近似結(jié)果。

本文的結(jié)構(gòu)如下：第二節(jié)回顧了使用近似貝葉斯計(jì)算方法和生成式貝葉斯計(jì)算在狀態(tài)空間建模方面的最新進(jìn)展。第三節(jié)介紹生成式貝葉斯濾波的概念，并提出兩種算法：生成式濾波器和預(yù)訓(xùn)練生成式濾波器。它們的性能通過第三節(jié)中的模擬研究進(jìn)行評(píng)估，并與現(xiàn)有濾波技術(shù)進(jìn)行比較。第四節(jié)討論模型參數(shù)未知且必須與潛在軌跡聯(lián)合推斷的場(chǎng)景。為此，我們提出生成式吉布斯采樣器，并展示如何以前向?yàn)V波后向采樣的策略形式有效應(yīng)用于一般狀態(tài)空間模型。生成式吉布斯采樣器的模擬結(jié)果在第五節(jié)中報(bào)告。最后在第六節(jié)中，我們使用金融數(shù)據(jù)進(jìn)行實(shí)證應(yīng)用。隨后是結(jié)論部分，總結(jié)主要發(fā)現(xiàn)并討論未來研究的潛在方向。

2 背景 2.1 狀態(tài)空間模型中的序列推斷

在這一遞歸過程中，核心思想是：在每個(gè)時(shí)間點(diǎn) t，預(yù)測(cè)分布充當(dāng)關(guān)于未來狀態(tài)和觀測(cè)的先驗(yàn)分布，當(dāng)新數(shù)據(jù)通過濾波更新變得可用時(shí)，該先驗(yàn)分布將隨之被精細(xì)化。

狀態(tài)空間模型中精確且高效的推斷僅在有限情況下可行，例如線性高斯模型，其最優(yōu)濾波解由著名的卡爾曼濾波器給出（Kalman, 1960）。然而，實(shí)際上許多系統(tǒng)表現(xiàn)出非線性動(dòng)態(tài)和/或非高斯噪聲，使得精確推斷成為不可能。因此，人們開發(fā)了各種近似推斷方法。在確定性方法中，有擴(kuò)展卡爾曼濾波器（Maybeck, 1979）和無(wú)跡卡爾曼濾波器（Julier and Uhlmann, 1997），它們?cè)噲D通過線性化動(dòng)態(tài)或近似分布，使?fàn)顟B(tài)空間模型適應(yīng)卡爾曼濾波器的假設(shè)。盡管這些方法在某些情況下有效，但在存在強(qiáng)烈非線性或非高斯噪聲時(shí)，其精度會(huì)下降。另一方面，SMC算法（在該領(lǐng)域通常稱為粒子濾波器）已獲得了顯著地位。這些方法提供了一個(gè)靈活的、基于模擬的框架，用于近似復(fù)雜的后驗(yàn)分布，能夠處理廣泛的非線性和非高斯?fàn)顟B(tài)空間模型類別。

2.2 粒子濾波器與ABC

人們開發(fā)了替代的濾波策略，這些策略利用模型的生成結(jié)構(gòu)，而非依賴于顯式的似然計(jì)算。

其中一種方法是卷積粒子濾波器（Rossi and Vila，2006；Rossi and Vila，2009），它通過基于潛在狀態(tài)生成的條件偽觀測(cè)構(gòu)建核近似，來代替難以處理的似然函數(shù)。然而，這種方法可能效率低下，尤其是在高維情況下，并且對(duì)核帶寬的選擇敏感，當(dāng)帶寬未適當(dāng)調(diào)整時(shí)，性能往往不佳。

一般而言，核函數(shù)、距離度量或容差參數(shù)的選擇不當(dāng)往往會(huì)放大粒子濾波方法固有的一些已知挑戰(zhàn)，特別是權(quán)重退化和樣本貧化。為了緩解這一問題，實(shí)踐者通常依賴于自適應(yīng)閾值調(diào)整、更平滑的核函數(shù)或信息豐富的低維匯總統(tǒng)計(jì)量，以維持非零的接受率并保持推斷過程的連續(xù)性。一些相關(guān)的例子包括：Alive ABC-PF（Jasra等人，2013），它通過在每一步確保固定數(shù)量的粒子被接受來緩解粒子退化問題；Plug-in Bandwidth ABC-PF（Calvet和Czellar，2014），被證明能以最優(yōu)衰減率收斂；以及ABC-Auxiliary PF（Vankov等人，2019），通過改進(jìn)提議分布來提高效率。

與ABC-PF類似，我們的生成式濾波器通過利用模型的底層數(shù)據(jù)生成過程，避免直接進(jìn)行密度計(jì)算。然而，它不依賴ABC方法典型的接受-拒絕機(jī)制，而是利用生成建模的最新進(jìn)展，從濾波分布中高效采樣。我們將在下一節(jié)詳細(xì)介紹我們方法背后的方法論。

2.3 生成式貝葉斯計(jì)算
生成式貝葉斯計(jì)算方法通常依賴于隱式分布。這類分布的密度函數(shù)無(wú)法直接計(jì)算，但我們可以通過一個(gè)隨機(jī)生成器（也稱為傳輸映射）輕松地從其抽取樣本。該生成器將來自參考測(cè)度（如多元高斯分布或均勻分布）的樣本轉(zhuǎn)換為目標(biāo)概率測(cè)度的樣本。在現(xiàn)代實(shí)現(xiàn)中，傳輸映射通常由深度神經(jīng)網(wǎng)絡(luò)參數(shù)化（Mohamed and Lakshminarayanan，2016）。

這種采樣技術(shù)在應(yīng)對(duì)傳統(tǒng)貝葉斯計(jì)算方法的關(guān)鍵局限方面證明特別有價(jià)值，尤其是解決了對(duì)顯式密度計(jì)算的依賴以及與迭代模擬算法（如馬爾可夫鏈蒙特卡洛）相關(guān)的高計(jì)算負(fù)擔(dān)。例如，Titsias 和 Ruiz（2019）利用隱式變分分布來擴(kuò)展可容許變分近似的族類，從而實(shí)現(xiàn)了比標(biāo)準(zhǔn)參數(shù)形式更靈活、更具表現(xiàn)力的后驗(yàn)表示。

在本文中，我們所說的生成式貝葉斯計(jì)算更精確地指代那些將后驗(yàn)本身建模為隱式分布的方法，其使用傳輸映射直接從相應(yīng)的后驗(yàn)概率測(cè)度生成樣本。近年來已有越來越多的研究探討了參數(shù)化傳輸映射的各種神經(jīng)網(wǎng)絡(luò)架構(gòu)。Wang 和 Ro?ková（2023）使用條件貝葉斯生成對(duì)抗網(wǎng)絡(luò)來學(xué)習(xí)給定任意觀測(cè)數(shù)據(jù)向量下的后驗(yàn)分布的生成模型。Polson 和 Sokolov（2023）利用隱式分位數(shù)網(wǎng)絡(luò)對(duì)給定數(shù)據(jù)下單變量參數(shù)的條件分位數(shù)函數(shù)進(jìn)行建模，從而實(shí)現(xiàn)了直接的后驗(yàn)采樣；而 Kim 等人（2025）則將這一思想推廣到多變量設(shè)置，允許從貝葉斯可信集直接采樣。在另一條相關(guān)的研究方向上，Sharrock 等人（2024）采用基于條件分?jǐn)?shù)的擴(kuò)散模型進(jìn)行后驗(yàn)采樣。

3 生成式貝葉斯濾波

3.1 生成式濾波器

3.2 預(yù)訓(xùn)練生成式濾波器

生成式濾波器的主要優(yōu)勢(shì)在于其多功能性，即能夠處理廣泛的狀態(tài)空間模型，而無(wú)需對(duì)底層隨機(jī)過程（尤其是平穩(wěn)性）施加嚴(yán)格假設(shè)。盡管如此，當(dāng)平穩(wěn)性條件滿足時(shí)，我們可以利用這一特性。

3.4 模擬研究 3.4.1 線性高斯模型

我們首先在線性高斯?fàn)顟B(tài)空間模型上評(píng)估新開發(fā)的方法，該模型作為一個(gè)易于理解且分析上可處理的基準(zhǔn)。如第2.1節(jié)所述，在此設(shè)置下，濾波問題可以使用卡爾曼濾波器精確求解。模型定義如下：

線性高斯案例中觀察到的出色性能為本文引入的濾波策略的有效性提供了有力證據(jù)。為進(jìn)一步證明其普遍適用性，我們將分析擴(kuò)展到一個(gè)基于一類非線性、非高斯?fàn)顟B(tài)空間模型（通常稱為隨機(jī)波動(dòng)率模型）的模擬示例。

盡管迄今為止，收益率新息項(xiàng)的高斯設(shè)定是最常見的選擇，這主要是因?yàn)槠淠軒矸治錾系囊滋幚硇?、良好的似然函?shù)形式以及直接的模擬特性，但金融領(lǐng)域的經(jīng)驗(yàn)證據(jù)（例如 Cont, 2001; Chakraborti 等人, 2011; Ratliff-Crain 等人, 2023）一致表明，資產(chǎn)收益率表現(xiàn)出超額峰度、厚尾和偏度等特征，這些是高斯分布無(wú)法再現(xiàn)的。因此，從 Mandelbrot (1963)、Fama (1965) 以及 Mittnik 和 Rachev (1993) 的開創(chuàng)性工作開始，α-穩(wěn)定分布因其有趣的特性而在該領(lǐng)域廣受歡迎。具體而言， α < 2
的穩(wěn)定分布自然地容納了冪律尾部，而偏度參數(shù) β β允許對(duì)不對(duì)稱性進(jìn)行建模。這些特性使得 α-穩(wěn)定模型非常適合捕捉高頻和危機(jī)時(shí)期金融數(shù)據(jù)中觀察到的極端事件和不對(duì)稱風(fēng)險(xiǎn)模式，為風(fēng)險(xiǎn)度量、期權(quán)定價(jià)和投資組合壓力測(cè)試提供了更現(xiàn)實(shí)的基礎(chǔ)。

圖2展示了三種信息分布的可視化對(duì)比。前兩種情形允許使用標(biāo)準(zhǔn)粒子濾波器作為參考后驗(yàn)，我們可以借此評(píng)估生成式濾波器。相比之下，在第三種情形中，似然函數(shù)無(wú)法以閉式求解，因此標(biāo)準(zhǔn)粒子濾波器不適用。因此，我們采用粒子數(shù) N = 100 , 000 的ABC-PF作為基準(zhǔn)，以比較不同濾波策略。

如前一節(jié)所述，我們?cè)诿糠N信息分布設(shè)定下模擬了100個(gè)場(chǎng)景。對(duì)于柯西分布情形，我們剔除概率小于萬(wàn)分之一的抽樣值。在該分布中，此類罕見事件會(huì)導(dǎo)致絕對(duì)值極大的觀測(cè)值；這些極端異常值在實(shí)際場(chǎng)景中不僅不現(xiàn)實(shí)，也可能導(dǎo)致所有無(wú)似然濾波方法失效。類似地，對(duì)于厚尾非對(duì)稱α-穩(wěn)定分布情形，我們剔除概率低于十萬(wàn)分之一的抽樣值。

圖3展示了在柯西信息下的一個(gè)模擬場(chǎng)景中，各方法估計(jì)的潛在軌跡。圖中顯示，即使在這種ABC-PF表現(xiàn)不佳的厚尾設(shè)定中，我們的策略仍與粒子濾波器提供的真實(shí)估計(jì)保持一致。

4 參數(shù)學(xué)習(xí)

至此，我們一直假設(shè) θ ∈ Θ 是已知的；然而，在實(shí)際應(yīng)用中這很少見。因此，我們現(xiàn)在提出在生成式濾波器框架內(nèi)對(duì)潛在軌跡和未知參數(shù)進(jìn)行聯(lián)合推斷的策略。

在無(wú)似然設(shè)定下，大多數(shù)工作集中于獨(dú)立于軌跡估計(jì)的參數(shù)推斷。例如，Dean 等人（2014）、Martin 等人（2014）、Y?ld?r?m 等人（2015）和 Martin 等人（2019）開發(fā)了基于 ABC 的方法，這些方法主要針對(duì)靜態(tài)參數(shù) θ θ進(jìn)行推斷，而將潛在軌跡視為次要或隱式邊緣化處理。更專注于同時(shí)處理參數(shù)和軌跡推斷的嘗試包括 Jasra 等人（2013）以及隨后的 Vankov 等人（2019），他們提出使用粒子馬爾可夫鏈蒙特卡羅算法來近似聯(lián)合后驗(yàn)分布 p ( θ , x 0 : T ∣ y 1 : T），其中 ABC 粒子濾波器被用作似然估計(jì)器。

原則上，也可以在生成式貝葉斯濾波框架內(nèi)構(gòu)建粒子馬爾可夫鏈蒙特卡羅類算法，其中生成式濾波器代替粒子濾波器作為似然估計(jì)器。然而，我們追求更具計(jì)算優(yōu)勢(shì)的方法。具體而言，我們提出兩種高效的、完全無(wú)需密度計(jì)算的方法，它們適用于廣泛的狀態(tài)空間模型。

第一種方法將參數(shù)和潛在軌跡的聯(lián)合后驗(yàn)分布分解為：

從觀測(cè)過程中識(shí)別合適的匯總統(tǒng)計(jì)量可能具有挑戰(zhàn)性。例如，Martin 等人（2019）探索了基于輔助似然的方法，其中匯總統(tǒng)計(jì)量從一個(gè)比真實(shí)模型更容易估計(jì)的輔助模型中獲得；而 Maneesoonthorn 等人（2024）則利用了來自多個(gè)數(shù)據(jù)源的匯總統(tǒng)計(jì)量。

一種更穩(wěn)健且直觀的策略是采用同時(shí)納入潛在軌跡信息的匯總統(tǒng)計(jì)量。然而，在實(shí)踐中實(shí)現(xiàn)這一方法具有挑戰(zhàn)性，因?yàn)闋顟B(tài)序列是不可觀測(cè)的，因此這類匯總統(tǒng)計(jì)量無(wú)法像基于觀測(cè)數(shù)據(jù)的匯總統(tǒng)計(jì)量那樣直接計(jì)算。為解決這一問題，我們開發(fā)了一種新穎的貝葉斯計(jì)算方法，稱為 Gen-Gibbs 采樣器。該方法廣泛適用于貝葉斯推斷，尤其適用于層次模型——在層次模型中，由于存在多個(gè)層次，僅基于觀測(cè)數(shù)據(jù)為每個(gè)潛變量構(gòu)建信息性匯總統(tǒng)計(jì)量十分困難。在這種情況下，可以利用層次結(jié)構(gòu)本身來設(shè)計(jì)更有效的匯總統(tǒng)計(jì)量并提高計(jì)算效率。我們將在下一節(jié)詳細(xì)討論該方法。

5 生成式吉布斯采樣

生成式吉布斯采樣指的是一種廣泛適用的采樣策略，它將馬爾可夫鏈蒙特卡羅算法的嚴(yán)謹(jǐn)特性與生成建模的最新進(jìn)展相結(jié)合，從而在一個(gè)基于原理的貝葉斯計(jì)算框架內(nèi)利用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)。

類似于吉布斯采樣，生成式吉布斯采樣算法通過迭代地從參數(shù)的全條件分布中抽樣來近似后驗(yàn)分布。與經(jīng)典方法需要解析推導(dǎo)條件分布不同，生成式吉布斯采樣利用深度學(xué)習(xí)模型來近似這些條件分布的分位數(shù)函數(shù)。

上述采樣策略在分層貝葉斯模型中尤其有用，包括狀態(tài)空間模型，其中一些參數(shù)并不直接與數(shù)據(jù)相關(guān)聯(lián)。舉例來說，假設(shè) θ θ控制潛在動(dòng)態(tài)，因此僅直接依賴于未觀測(cè)狀態(tài)而非觀測(cè)本身。在這種情況下，狀態(tài)空間模型可以寫成一個(gè)兩層次的分層模型

因此，在狀態(tài)空間模型中應(yīng)用生成式吉布斯采樣器可簡(jiǎn)化為一種針對(duì)潛在狀態(tài)的前向?yàn)V波后向采樣策略，并與吉布斯采樣相結(jié)合

5.1 模擬研究

5.1.1 線性高斯模型

對(duì)于單個(gè)模擬過程，圖 4b 和 4c 表明 Gen-Gibbs 后驗(yàn)與傳統(tǒng)吉布斯采樣獲得的后驗(yàn)高度吻合。特別值得關(guān)注的是圖 4a 展示的混合和收斂行為，該圖表明 Gen-Gibbs 鏈實(shí)現(xiàn)了快速混合和穩(wěn)定收斂，與經(jīng)典方法相當(dāng)。值得注意的是，圖 4b 和 4c 還顯示，當(dāng)以相同的參數(shù)值初始化時(shí)，兩種方法在近似相同的步數(shù)內(nèi)收斂。這表明所提出的方法不僅能以高精度復(fù)現(xiàn)后驗(yàn)分布，而且保持了理想的抽樣性質(zhì)，使其成為傳統(tǒng)吉布斯采樣的可行替代方案，尤其是在后者無(wú)法直接使用時(shí)。

在所有 100 個(gè)模擬過程中重復(fù)該分析，我們發(fā)現(xiàn)兩種方法得到的未知參數(shù)的后驗(yàn)均值和分位數(shù)高度一致，如圖 5 所示，表 5 報(bào)告的覆蓋值也證實(shí)了這一點(diǎn)。此外，兩種方法估計(jì)的潛在軌跡表現(xiàn)出可比較的均方根誤差（RMSE）和覆蓋值，如圖 6 所示。

總體而言，這些結(jié)果極具前景，促使我們將分析擴(kuò)展到更具挑戰(zhàn)性的場(chǎng)景，特別是像我們處理已知參數(shù)情況時(shí)所做的那樣，擴(kuò)展到非線性、非高斯示例。

表 7 報(bào)告了在幾種參數(shù)配置下，對(duì) 100 個(gè)模擬隨機(jī)波動(dòng)率過程取平均后的模型參數(shù)和狀態(tài)序列的估計(jì)結(jié)果。表中報(bào)告的結(jié)果表明，所提出的方法提供了非常準(zhǔn)確的估計(jì)，且這一穩(wěn)健性能在所有配置下始終保持。特別是，該方法即使在具有重尾和強(qiáng)非對(duì)稱特征的挑戰(zhàn)性場(chǎng)景下，以及在 α 接近 2 且 β 難以識(shí)別的情形下，都表現(xiàn)良好。

我們想特別強(qiáng)調(diào) Gen-Gibbs 方法的一個(gè)特別吸引人的特性，即其靈活性。一旦完成算法 3 描述的預(yù)訓(xùn)練階段，所學(xué)得的映射函數(shù)可以在 Gen-Gibbs 采樣器（算法 4）中重復(fù)使用，以估計(jì)屬于同一類狀態(tài)空間系統(tǒng)的模型，而幾乎不產(chǎn)生額外的計(jì)算成本。換句話說，只需提供新的觀測(cè)數(shù)據(jù)序列，就可以快速完成狀態(tài)和參數(shù)估計(jì)。這一特性相比傳統(tǒng) ABC 方法提供了顯著的計(jì)算優(yōu)勢(shì)，因?yàn)閭鹘y(tǒng) ABC 方法需要對(duì)每個(gè)新數(shù)據(jù)集進(jìn)行完整的重新估計(jì)程序。

6 實(shí)證研究

對(duì)金融時(shí)間序列的實(shí)證研究持續(xù)揭示了一系列反復(fù)出現(xiàn)的模式，通常稱為典型事實(shí)，任何現(xiàn)實(shí)的資產(chǎn)定價(jià)模型都應(yīng)致力于重現(xiàn)這些特征。這些經(jīng)驗(yàn)規(guī)律已在廣泛的資產(chǎn)、資產(chǎn)類別和市場(chǎng)中得到記錄，對(duì)支撐傳統(tǒng)金融模型（如期權(quán)定價(jià)的Black-Scholes框架（Black和Scholes，1973））的同方差性和正態(tài)分布收益率等經(jīng)典假設(shè)構(gòu)成了重大挑戰(zhàn)。在一項(xiàng)開創(chuàng)性貢獻(xiàn)中，Cont（2001）系統(tǒng)地歸納了十一個(gè)此類特征。α-穩(wěn)定隨機(jī)波動(dòng)率模型能夠復(fù)現(xiàn)其中多個(gè)典型事實(shí)，包括：線性自相關(guān)缺失、條件與非條件厚尾性、收益/損失不對(duì)稱性、波動(dòng)率聚集以及絕對(duì)收益率自相關(guān)的緩慢衰減。此外，本文引入的生成式貝葉斯濾波框架為開發(fā)和估計(jì)能夠捕捉Cont（2001）識(shí)別出的其余典型事實(shí)的更復(fù)雜模型奠定了基礎(chǔ)。

作為展示這些特征的金融時(shí)間序列示例，我們考慮由ProShares1發(fā)行的Short VIX Short-Term Futures ETF，通常簡(jiǎn)稱為SVXY。該產(chǎn)品旨在提供對(duì)S&P 500 VIX短期期貨指數(shù)的反向敞口，該指數(shù)跟蹤短期VIX期貨的持續(xù)滾動(dòng)持倉(cāng)。因此，當(dāng)市場(chǎng)波動(dòng)率下降且VIX期貨曲線保持期貨升水時(shí)，SVXY會(huì)產(chǎn)生正收益。

實(shí)際上，市場(chǎng)波動(dòng)率容易發(fā)生突變，這會(huì)導(dǎo)致VIX期貨價(jià)格急劇跳躍，并相應(yīng)地給SVXY等反向波動(dòng)率產(chǎn)品帶來巨大損失。雖然股市持續(xù)平靜的時(shí)期可能帶來平穩(wěn)的正收益，但市場(chǎng)壓力時(shí)期可能導(dǎo)致波動(dòng)率迅速上升和重大損失。此類事件發(fā)生在2018年2月所謂的“波動(dòng)率末日”期間，當(dāng)時(shí)股市波動(dòng)率的突然飆升導(dǎo)致VIX期貨出現(xiàn)前所未有的暴漲。在單個(gè)交易日中，多種做空波動(dòng)率產(chǎn)品經(jīng)歷了嚴(yán)重回撤，其中一些最終被清盤（例如，瑞信XIV交易所交易票據(jù)的關(guān)閉）。在此事件之后，包括SVXY在內(nèi)的許多波動(dòng)率掛鉤交易所交易產(chǎn)品經(jīng)歷了重大重組。特別是，ProShares降低了該基金的敞口，將其杠桿從-1倍調(diào)整為-0.5倍，旨在減輕尾部風(fēng)險(xiǎn)。由于這一調(diào)整可能改變了收益生成過程，我們將分析重點(diǎn)放在2014年3月至2018年4月期間（共1000個(gè)交易日），這一時(shí)間段包含了2018年2月的沖擊，同時(shí)排除了重組后的制度。

我們將原始價(jià)格序列轉(zhuǎn)換為去均值后的日度對(duì)數(shù)收益率，具體如下：

由于從后驗(yàn)預(yù)測(cè)分布生成的收益率成功捕捉了實(shí)際收益率的動(dòng)態(tài)特性，研究結(jié)果強(qiáng)有力地證明，即使在似然函數(shù)解析上難以處理且標(biāo)準(zhǔn)貝葉斯計(jì)算技術(shù)無(wú)法應(yīng)用的環(huán)境中，所提出的估計(jì)框架仍能為潛在狀態(tài)和參數(shù)提供可靠的推斷。通過克服這些局限性，我們的方法極大地?cái)U(kuò)展了可在貝葉斯范式下進(jìn)行估計(jì)的狀態(tài)空間模型類別。這進(jìn)而使得我們能夠使用更豐富、更現(xiàn)實(shí)的模型設(shè)定，這些設(shè)定包含了常因計(jì)算便利性而被忽視的特征，例如市場(chǎng)突然的負(fù)向波動(dòng)以及金融收益率中其他形式的極端行為。

7 討論

在本文中，我們提出了一種用于狀態(tài)空間模型濾波與參數(shù)學(xué)習(xí)的新穎框架。我們的方法在模型設(shè)定導(dǎo)致復(fù)雜的先驗(yàn)與似然系統(tǒng)（使得傳統(tǒng)的MCMC和SMC方法難以甚至無(wú)法應(yīng)用）的情況下，例如難處理的狀態(tài)空間模型，證明尤其有價(jià)值。我們證明，只要能夠從模型進(jìn)行模擬，無(wú)論噪聲分布或轉(zhuǎn)移函數(shù)與觀測(cè)方程的函數(shù)形式如何，通過我們的生成式濾波器方法，對(duì)潛在狀態(tài)的估計(jì)仍然是可行的。我們還提供了預(yù)訓(xùn)練版本，為需要快速更新濾波分布的應(yīng)用——例如實(shí)時(shí)目標(biāo)跟蹤和高頻波動(dòng)率監(jiān)測(cè)，且在可以合理假設(shè)潛在過程平穩(wěn)且發(fā)射分布時(shí)齊的條件下——提供了一種高效的替代方案。與基準(zhǔn)ABC-PF相比，這兩種方法均表現(xiàn)出更優(yōu)的性能，實(shí)現(xiàn)了更高的準(zhǔn)確性、更好的覆蓋率以及與真實(shí)后驗(yàn)更近的接近度。

對(duì)于模型參數(shù)未知且必須與潛在狀態(tài)聯(lián)合推斷的場(chǎng)景，我們開發(fā)了生成式吉布斯采樣器。該方法提供了一種完全無(wú)需密度計(jì)算的采樣方案，能夠在具有復(fù)雜分層結(jié)構(gòu)和難處理密度的模型中實(shí)現(xiàn)貝葉斯推斷，其中某些類別的狀態(tài)空間模型是其特例。當(dāng)標(biāo)準(zhǔn)MCMC技術(shù)可以應(yīng)用時(shí)，生成式吉布斯采樣器能夠獲得可比較的結(jié)果，證明了其作為通用推斷工具的有效性和穩(wěn)健性。

我們的生成式貝葉斯濾波框架具有廣泛的跨學(xué)科適用性，可用于任何允許狀態(tài)空間表示的模型。在本工作中，我們專注于金融應(yīng)用，特別是波動(dòng)率估計(jì)——這是濾波文獻(xiàn)中一個(gè)長(zhǎng)期存在的挑戰(zhàn)。正如Cont等人（2023）所記錄的，金融收益率中觀察到的復(fù)雜動(dòng)態(tài)很難用具有嚴(yán)格假設(shè)的簡(jiǎn)單模型捕捉，盡管這些模型仍然是有用的基準(zhǔn)。我們的框架為更靈活、更現(xiàn)實(shí)的建模打開了大門。特別是，我們展示了采用α-穩(wěn)定分布能夠捕捉金融收益率中一些眾所周知的典型事實(shí)，并增強(qiáng)波動(dòng)率估計(jì)。我們邀請(qǐng)經(jīng)濟(jì)學(xué)家和量化研究人員進(jìn)一步探索我們的框架，并將我們的分析擴(kuò)展到更豐富的動(dòng)態(tài)特性，如跳躍、杠桿效應(yīng)和其他非線性。重現(xiàn)我們結(jié)果所需的所有材料可在第一作者的GitHub倉(cāng)庫(kù)3中找到。

采用我們框架的研究者應(yīng)注意，該方法在深度學(xué)習(xí)模型訓(xùn)練期間可能涉及相當(dāng)大的計(jì)算成本。然而，通過利用高性能計(jì)算資源（如GPU）和并行處理，這一負(fù)擔(dān)可以得到極大緩解。盡管如此，我們的結(jié)果表明，使用標(biāo)準(zhǔn)計(jì)算設(shè)置仍能實(shí)現(xiàn)出色的性能。此外，在預(yù)訓(xùn)練生成式濾波器和生成式吉布斯采樣的背景下，此計(jì)算成本僅產(chǎn)生一次；訓(xùn)練完成后，濾波和參數(shù)學(xué)習(xí)的速度可與經(jīng)典粒子濾波器和粒子馬爾可夫鏈蒙特卡羅方法相媲美。特別是，在訓(xùn)練階段學(xué)習(xí)到的映射可以輕松復(fù)用于估計(jì)整類狀態(tài)空間模型，只需提供新數(shù)據(jù)即可。與傳統(tǒng)ABC方法相比，這是一個(gè)特別吸引人的優(yōu)勢(shì)，因?yàn)閭鹘y(tǒng)方法必須在數(shù)據(jù)集改變時(shí)重新初始化估計(jì)過程。

另一個(gè)相關(guān)點(diǎn)是，我們對(duì)生成式貝葉斯濾波框架的實(shí)現(xiàn)主要依賴于分位數(shù)神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)用于從目標(biāo)分布生成樣本的逆累積分布函數(shù)映射。因此，它受到該技術(shù)固有局限性的制約。盡管分位數(shù)神經(jīng)網(wǎng)絡(luò)的使用并非嚴(yán)格必要，也可以采用其他隱式分位數(shù)方法，但神經(jīng)網(wǎng)絡(luò)的訓(xùn)練通常需要仔細(xì)的調(diào)優(yōu)和驗(yàn)證。

在本文中，我們專注于單變量情況。作為未來研究的一部分，我們旨在將所提出的框架擴(kuò)展到多維狀態(tài)空間模型，其中 Y t
和 X t
均為向量值。這一方向的動(dòng)機(jī)來自Kim等人（2025）最近的工作，他們將生成式貝葉斯計(jì)算方法推廣到多變量設(shè)置。

原文鏈接：https://arxiv.org/pdf/2511.04552

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.