国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

因果潛在因子模型中的雙重穩(wěn)健推斷

0
分享至

Doubly Robust Inference in Causal Latent Factor Models

因果潛在因子模型中的雙重穩(wěn)健推斷

https://arxiv.org/pdf/2402.11652



摘要

本文介紹了一種在存在未觀測混雜因素情形下估計(jì)平均處理效應(yīng)的新估計(jì)量,適用于現(xiàn)代數(shù)據(jù)豐富環(huán)境,該環(huán)境具有大量觀測單元與結(jié)果變量。所提出的估計(jì)量具有雙重穩(wěn)健性,融合了結(jié)果填補(bǔ)(outcome imputation)、逆概率加權(quán)(inverse probability weighting)以及一種用于矩陣補(bǔ)全(matrix completion)的新型交叉擬合(cross-fitting)程序。我們推導(dǎo)了有限樣本與漸近性質(zhì)的理論保證,并證明該新估計(jì)量的誤差以參數(shù)速率收斂至均值為零的高斯分布。模擬結(jié)果驗(yàn)證了本文所分析估計(jì)量的形式性質(zhì)的實(shí)際相關(guān)性。

  1. 引言

本文提出了一種在存在未觀測混雜因素情形下、針對現(xiàn)代數(shù)據(jù)豐富環(huán)境的平均處理效應(yīng)估計(jì)新框架。我們將現(xiàn)代數(shù)據(jù)豐富環(huán)境定義為在大量觀測單元上收集了廣泛結(jié)果測量值的環(huán)境。我們對數(shù)據(jù)豐富環(huán)境的關(guān)注源于數(shù)字平臺(例如互聯(lián)網(wǎng)零售商、社交媒體公司和共享出行公司)、電子病歷系統(tǒng)、物聯(lián)網(wǎng)設(shè)備以及其他實(shí)時(shí)數(shù)字化數(shù)據(jù)系統(tǒng)的興起,這些系統(tǒng)以前所未有的廣度與細(xì)粒度收集經(jīng)濟(jì)與社會行為數(shù)據(jù)。

以互聯(lián)網(wǎng)零售商為例。該平臺不僅收集眾多客戶在眾多產(chǎn)品或產(chǎn)品類別上的購買信息,還記錄瀏覽次數(shù)、曝光量、轉(zhuǎn)化率、參與度指標(biāo)、導(dǎo)航路徑、配送選擇、支付方式、退貨記錄、用戶評價(jià)等數(shù)據(jù)。盡管某些變量(如地理位置、設(shè)備或?yàn)g覽器類型)可被安全地視為相對于平臺處理行為(如廣告投放、折扣發(fā)放、網(wǎng)頁設(shè)計(jì)等)預(yù)先確定的變量,但大多數(shù)變量均為受處理干預(yù)、潛在客戶偏好及未觀測產(chǎn)品特征共同影響的結(jié)果變量。我們利用現(xiàn)代數(shù)據(jù)豐富環(huán)境中大量結(jié)果測量值的可得性,在存在未觀測混雜因素的情況下估計(jì)平均處理效應(yīng)。核心識別思想在于:若高維結(jié)果向量的每個(gè)元素均受同一低維未觀測混雜因素向量的影響,則有可能消除混雜因素的影響并識別出處理效應(yīng)。

處理效應(yīng)估計(jì)主要有兩種方法:基于結(jié)果的方法(outcome-based methods)與基于分配的方法(assignment-based methods)。仍以互聯(lián)網(wǎng)零售平臺為例,客戶與不同產(chǎn)品類別發(fā)生交互,平臺針對每個(gè)消費(fèi)者-類別配對決定是否提供折扣,并記錄消費(fèi)者是否在該類別中購買了產(chǎn)品?;诮Y(jié)果的方法通過填補(bǔ)每個(gè)消費(fèi)者-產(chǎn)品類別配對缺失的潛在結(jié)果進(jìn)行操作:該過程包括預(yù)測接受折扣的消費(fèi)者若未獲得折扣是否會購買(即無折扣下的潛在結(jié)果),反之亦然,預(yù)測未獲折扣的消費(fèi)者若獲得折扣是否會購買(即有折扣下的潛在結(jié)果)。相比之下,基于分配的方法則估計(jì)消費(fèi)者在各產(chǎn)品類別中獲得折扣的概率,并通過對觀測結(jié)果進(jìn)行與缺失概率成反比的加權(quán)來調(diào)整缺失的潛在結(jié)果。

大量文獻(xiàn)探討了基于結(jié)果的方法,尤其在所有混雜因素均被觀測的設(shè)定下(參見如Cochran, 1968;Rosenbaum與Rubin, 1983;Angrist, 1998;Abadie與Imbens, 2006等眾多研究)。在存在未觀測混雜因素情形下進(jìn)行潛在結(jié)果填補(bǔ)則構(gòu)成更為復(fù)雜的挑戰(zhàn)。在此背景下,常用框架包括合成控制法及其變體(參見如Abadie與Gardeazabal, 2003;Abadie等, 2010;Cattaneo等, 2021;Arkhangelsky等, 2021)。另一種相關(guān)但不同的方法是潛在因子框架(latent factor framework)(Bai與Ng, 2002;Bai, 2009;Xiong與Pelger, 2023),其中高維結(jié)果向量的每個(gè)元素均受同一低維未觀測混雜因素向量影響。矩陣補(bǔ)全方法(參見如Chatterjee, 2015;Athey等, 2021;Bai與Ng, 2021;Dwivedi等, 2022a;Agarwal等, 2023a)在推薦系統(tǒng)與面板數(shù)據(jù)模型中得到廣泛應(yīng)用,與潛在因子模型密切相關(guān)。類似地,現(xiàn)有的基于分配的平均處理效應(yīng)估計(jì)程序通常依賴于無未測量混雜假設(shè)(參見如Robins等, 2000;Hirano等, 2003;Wooldridge, 2007)、共同趨勢限制(Abadie, 2005)或工具變量的可得性(Abadie, 2003;Sloczynski等, 2024)。

本文提出了一種在存在未觀測混雜因素情形下的平均處理效應(yīng)雙重穩(wěn)健估計(jì)量(參見Robins等, 1994;Bang與Robins, 2005;Chernozhukov等, 2018)。該估計(jì)量在潛在因子框架下同時(shí)利用結(jié)果過程與處理分配機(jī)制的信息,將結(jié)果填補(bǔ)與逆概率加權(quán)相結(jié)合,并引入一種用于矩陣補(bǔ)全的新型交叉擬合方法。我們證明,相較于其他基于結(jié)果或基于分配的估計(jì)量,所提出的雙重穩(wěn)健估計(jì)量具有更優(yōu)的有限樣本保證。此外,在矩陣補(bǔ)全誤差率可被證明有效的條件下,無論所用矩陣補(bǔ)全算法的其他性質(zhì)如何,該雙重穩(wěn)健估計(jì)量均漸近無偏、近似服從高斯分布,并以參數(shù)速率收斂。

據(jù)我們所知,本文是首篇同時(shí)利用分配過程與結(jié)果過程中的潛在結(jié)構(gòu),以獲得存在未觀測混雜因素時(shí)平均處理效應(yīng)雙重穩(wěn)健估計(jì)量的研究。Arkhangelsky與Imbens(2022)在縱向數(shù)據(jù)下研究了雙重穩(wěn)健識別,其假設(shè)是對處理分配隨時(shí)間變化的某一函數(shù)(例如個(gè)體暴露于處理的次數(shù)比例)進(jìn)行條件化足以消除混雜。Athey等(2021)、Bai與Ng(2021)、Dwivedi等(2022a)、Agarwal等(2023a)以及Xiong與Pelger(2023)提出了應(yīng)用矩陣補(bǔ)全技術(shù)填補(bǔ)潛在結(jié)果的估計(jì)量。盡管這些研究利用了結(jié)果過程中的低秩限制,但并未探究處理分配過程中可能存在類似潛在結(jié)構(gòu)的可能性。本文對此問題進(jìn)行了探討,并證明納入分配機(jī)制結(jié)構(gòu)知識可帶來實(shí)質(zhì)性收益。



  1. 設(shè)定






  1. 估計(jì)

在本節(jié)中,我們提出一種利用處理分配矩陣A和觀測結(jié)果矩陣Y來估計(jì)的程序,其中


本節(jié)所提出的估計(jì)量將矩陣補(bǔ)全作為關(guān)鍵子程序加以利用。我們以矩陣補(bǔ)全方法的簡要概述開啟本節(jié)。



3.2. 關(guān)鍵構(gòu)建模塊






3.3. 雙重穩(wěn)?。―R)估計(jì)量


4. 主要結(jié)果



4.1. 假設(shè)
關(guān)于數(shù)據(jù)生成過程的要求。我們對數(shù)據(jù)的生成方式作出兩項(xiàng)假設(shè)。首先,我們對分配概率施加一個(gè)正值性條件。






公式(14)要求,在每個(gè)單元的兩個(gè)分區(qū)內(nèi),對于每次測量,估計(jì)的潛在結(jié)果均值和估計(jì)的分配概率與分配概率中的誤差聯(lián)合獨(dú)立。類似地,公式(15)要求,在每個(gè)單元的兩個(gè)分區(qū)內(nèi),對于每次測量,估計(jì)的分配概率與分配概率和潛在結(jié)果中的噪聲聯(lián)合獨(dú)立。像公式(14)和公式(15)這樣的條件在雙穩(wěn)健估計(jì)文獻(xiàn)中是常見的。Chernozhukov等人(2018)采用交叉擬合裝置,在沒有未測量混雜因素的背景下,強(qiáng)制執(zhí)行類似于假設(shè)4的條件。第5節(jié)為矩陣估計(jì)提供了一種新穎的交叉擬合流程,在該流程下,假設(shè)4對任何MC算法都成立(在對噪聲變量的額外假設(shè)下)。






4.3.漸近保證





該模型中滯后處理效應(yīng)的存在使得為整個(gè)處理序列定義因果估計(jì)量變得至關(guān)重要。附錄I描述了如何將所提出的雙穩(wěn)健估計(jì)擴(kuò)展到處理序列,并推導(dǎo)了定理1的推廣形式。


5. 帶有交叉擬合的矩陣補(bǔ)全


5.1. 交叉擬合-MC:一種用于矩陣補(bǔ)全的元交叉擬合算法







許多MC算法旨在對隨機(jī)缺失模式下的矩陣進(jìn)行去噪和缺失值插補(bǔ);研究最常見的缺失模式是每個(gè)條目有相同的缺失概率,且獨(dú)立于其他所有因素。相比之下,交叉擬合-MC生成的模式中,一個(gè)區(qū)塊內(nèi)的所有條目都是確定性缺失的,如圖3(b)所示。最近關(guān)于矩陣補(bǔ)全方法與因果推斷模型之間相互作用的研究——特別是在合成控制框架內(nèi)——已經(jīng)貢獻(xiàn)了允許塊狀缺失的矩陣補(bǔ)全算法(參見,例如,Athey等人,2021;Agarwal等人,2021;Bai和Ng,2021;Agarwal等人,2023b;Arkhangelsky等人,2021;Agarwal等人,2023a;Dwivedi等人,2022a,b)。然而,將這些方法已知的理論保證應(yīng)用于本文的設(shè)定存在挑戰(zhàn),原因在于:(i) 使用了交叉擬合——這創(chuàng)建了所有觀測都缺失的區(qū)塊——以及 (ii) 在完全缺失的區(qū)塊之外,仍然可能存在具有異質(zhì)缺失概率的缺失觀測。在下一節(jié)中,我們將展示如何修改為塊狀缺失模式設(shè)計(jì)的MC算法,使其能夠應(yīng)用于我們的帶有交叉擬合和折疊外異質(zhì)缺失概率的設(shè)定。為具體起見,我們采用Bai和Ng(2021)的Tall-Wide矩陣補(bǔ)全算法進(jìn)行說明。


5.2. 交叉擬合-SVD算法

交叉擬合-SVD是一個(gè)端到端的MC算法,通過將交叉擬合-MC元算法與Bai和Ng(2021)的Tall-Wide算法(我們稱之為TW)實(shí)例化而獲得。為完整起見,我們在第5.2.1節(jié)詳細(xì)描述TW算法,然后在第5.2.2節(jié)中使用它來描述交叉擬合-SVD。








原文鏈接:https://arxiv.org/pdf/2402.11652

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

張雪峰去世僅兩天!公司宣布重大決定:收回他所有肖像使用權(quán)

娛樂圈圈圓
2026-03-26 21:47:07
廣東:堅(jiān)決擁護(hù)黨中央決定

廣東:堅(jiān)決擁護(hù)黨中央決定

新京報(bào)政事兒
2026-03-27 22:17:04
阿根廷友誼賽半場變臉,梅西上場后全隊(duì)災(zāi)難級表現(xiàn)

阿根廷友誼賽半場變臉,梅西上場后全隊(duì)災(zāi)難級表現(xiàn)

體壇周報(bào)
2026-03-28 11:57:18
41歲單親媽媽因“涉黑”被羈押821天后無罪釋放,申請國家賠償僅13天就被叫停,法院認(rèn)定無罪警方又以騙貸為由再立案,檢察院回應(yīng)

41歲單親媽媽因“涉黑”被羈押821天后無罪釋放,申請國家賠償僅13天就被叫停,法院認(rèn)定無罪警方又以騙貸為由再立案,檢察院回應(yīng)

大風(fēng)新聞
2026-03-28 12:10:12
張雪峰出殯現(xiàn)場:送行隊(duì)伍綿延數(shù)公里、交警維持秩序、菊花賣脫銷

張雪峰出殯現(xiàn)場:送行隊(duì)伍綿延數(shù)公里、交警維持秩序、菊花賣脫銷

娛樂圈圈圓
2026-03-28 10:48:11
“老虎”伍茲被捕

“老虎”伍茲被捕

南方都市報(bào)
2026-03-28 11:02:22
姚文元入獄后,審判員讓他認(rèn)罪,他卻說:我是遵照毛主席指示做的

姚文元入獄后,審判員讓他認(rèn)罪,他卻說:我是遵照毛主席指示做的

華人星光
2026-03-28 12:20:30
妻子由男醫(yī)生產(chǎn)檢,丈夫崩潰撞墻

妻子由男醫(yī)生產(chǎn)檢,丈夫崩潰撞墻

中國新聞周刊
2026-03-27 21:47:06
伊朗首都德黑蘭遭近期最大規(guī)模襲擊

伊朗首都德黑蘭遭近期最大規(guī)模襲擊

極目新聞
2026-03-28 06:56:12
震驚!網(wǎng)傳山東驚現(xiàn)大量水泥墳引熱議,網(wǎng)友:這樣還怎么冒青煙?

震驚!網(wǎng)傳山東驚現(xiàn)大量水泥墳引熱議,網(wǎng)友:這樣還怎么冒青煙?

火山詩話
2026-03-28 11:22:13
這0.4秒的丑陋,就是NBA必須要改變的原因

這0.4秒的丑陋,就是NBA必須要改變的原因

只關(guān)于籃球
2026-03-28 12:58:09
很多人只看到了"老頭樂起訴小米"的荒誕感,卻沒看到雷軍不敢戀戰(zhàn)背后的“惶恐”

很多人只看到了"老頭樂起訴小米"的荒誕感,卻沒看到雷軍不敢戀戰(zhàn)背后的“惶恐”

新浪財(cái)經(jīng)
2026-03-28 00:31:15
人老了,想多活幾年,先管住自己這10點(diǎn):1、不摔倒,2、不勞累…

人老了,想多活幾年,先管住自己這10點(diǎn):1、不摔倒,2、不勞累…

荷蘭豆愛健康
2026-03-28 09:28:48
霍爾木茲海峽停擺,浙江這位船商卻公開承諾:不加價(jià)!他說這是浙江人的契約精神

霍爾木茲海峽停擺,浙江這位船商卻公開承諾:不加價(jià)!他說這是浙江人的契約精神

都市快報(bào)橙柿互動
2026-03-28 00:20:22
NBA歷史首次父子助攻!詹姆斯14+6+8連線布朗尼中三分 官方盛贊

NBA歷史首次父子助攻!詹姆斯14+6+8連線布朗尼中三分 官方盛贊

醉臥浮生
2026-03-28 13:08:36
大反轉(zhuǎn)!國足無緣踢澳大利亞隊(duì)原因曝光,國際足聯(lián)給出答案

大反轉(zhuǎn)!國足無緣踢澳大利亞隊(duì)原因曝光,國際足聯(lián)給出答案

啊噠體育
2026-03-28 13:29:52
尋釁滋事情節(jié)嚴(yán)重、影響惡劣 四川瀘縣5名未成年人被依法拘留

尋釁滋事情節(jié)嚴(yán)重、影響惡劣 四川瀘縣5名未成年人被依法拘留

紅星新聞
2026-03-28 09:48:14
暴跌95%,裁員5萬人,全球第二大車企爆大雷

暴跌95%,裁員5萬人,全球第二大車企爆大雷

蔣東文
2026-03-27 21:09:47
63歲男籃傳奇人物:與兒子定居廣東,轉(zhuǎn)行當(dāng)吃播,拒絕復(fù)出執(zhí)教

63歲男籃傳奇人物:與兒子定居廣東,轉(zhuǎn)行當(dāng)吃播,拒絕復(fù)出執(zhí)教

攬星河的筆記
2026-03-27 13:59:24
張雪峰去世事件升級!網(wǎng)傳有健身房的跑步機(jī)空無一人,恐慌加劇…

張雪峰去世事件升級!網(wǎng)傳有健身房的跑步機(jī)空無一人,恐慌加劇…

火山詩話
2026-03-27 17:20:58
2026-03-28 15:35:00
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1310文章數(shù) 18關(guān)注度
往期回顧 全部

科技要聞

遭中國學(xué)界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

牛彈琴:伊朗狠角色強(qiáng)硬嘲諷美國 卻被美移出獵殺名單

頭條要聞

牛彈琴:伊朗狠角色強(qiáng)硬嘲諷美國 卻被美移出獵殺名單

體育要聞

“我是全家最差勁的運(yùn)動員”

娛樂要聞

王一博改名上熱搜!個(gè)人時(shí)代正式開啟!

財(cái)經(jīng)要聞

我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

汽車要聞

置換補(bǔ)貼價(jià)4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

游戲
旅游
本地
手機(jī)
公開課

網(wǎng)曝超級馬力歐新作延期,《塞爾達(dá)傳說:時(shí)之笛》將推重制版

旅游要聞

這場“春季村晚”,點(diǎn)亮“江南桃花源”

本地新聞

在濰坊待了三天,沒遇到一個(gè)“濰坊人”

手機(jī)要聞

天璣9500性能天花板!一加Ace 6至尊版入網(wǎng):超高刷直屏+8000mAh級電池

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版