国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

科學(xué)研究中的自我修養(yǎng):學(xué)會(huì)對“顯著相關(guān)”說“那又怎樣”?

0
分享至



在科研中,我們習(xí)慣于從數(shù)據(jù)中尋找關(guān)系,并且常常能得到相關(guān)關(guān)系。但問題在于,相關(guān)分析給出的,往往只是一個(gè)起點(diǎn),而不是答案。從相關(guān)到因果之間,隱藏著一整套不那么顯眼、卻至關(guān)重要的前提:是否存在混雜?控制變量是否恰當(dāng)?即使統(tǒng)計(jì)上再“顯著”,結(jié)論也可能偏離真實(shí)機(jī)制??茖W(xué)的推進(jìn),往往不在于更復(fù)雜的模型,而在于更嚴(yán)格的追問:當(dāng)我們說一個(gè)變量“影響”另一個(gè)時(shí),這個(gè)判斷究竟建立在什么之上?

撰文 | 胡月瑤

1

從冰淇淋和溺水:混雜如何制造表面相關(guān)

在夏天,冰淇淋銷量越高,溺水人數(shù)也越多。如果只看數(shù)據(jù),這兩個(gè)變量往往會(huì)一起上升,甚至呈現(xiàn)明顯的正相關(guān)。但這種相關(guān)本身,并不能說明冰淇淋銷量會(huì)直接提高溺水風(fēng)險(xiǎn)。更合理的解釋通常是,真正同時(shí)推動(dòng)這兩件事變化的,是氣溫。天氣越熱,人們越想吃冰淇淋,也越可能去游泳、去海邊、去接觸水域,于是溺水風(fēng)險(xiǎn)也隨之上升。這個(gè)例子把問題擺得很直接:數(shù)據(jù)里看到的“有關(guān)系”,并不等于“一個(gè)導(dǎo)致了另一個(gè)”。有時(shí)候,兩個(gè)變量之所以一起變化,并不是因?yàn)樗鼈儽舜酥g存在直接作用,而是因?yàn)樗鼈兌际艿谌齻€(gè)因素影響。這個(gè)第三個(gè)因素,就是所謂的混雜因素。這類“共同原因造成表面相關(guān)”的結(jié)構(gòu),是因果分析最需要警惕的基本情形之一。

在數(shù)據(jù)分析里,研究者最先看到的,通常不是因果,而是關(guān)聯(lián)。比如,我們會(huì)先看兩個(gè)變量是否“同升同降”,也會(huì)進(jìn)一步用線性模型去刻畫這種關(guān)系。在線性回歸里,常見的寫法是:



但問題也恰恰在這里:線性模型和相關(guān)分析擅長描述關(guān)聯(lián),卻不自動(dòng)等于揭示因果。更準(zhǔn)確地說,回歸系數(shù)首先描述的是統(tǒng)計(jì)關(guān)聯(lián),而不是因果效應(yīng)。它直接回答的是:在當(dāng)前模型設(shè)定下、在統(tǒng)計(jì)上考慮了其他納入模型的變量之后,X 和 Y 呈現(xiàn)怎樣的關(guān)系;它并不自動(dòng)等于“如果我真的去改變 X,Y 就會(huì)按這個(gè)方向和幅度發(fā)生變化”。



圖1. 冰淇淋銷量、氣溫與溺水風(fēng)險(xiǎn)。高溫同時(shí)推動(dòng)冰淇淋消費(fèi)和人接觸水域的機(jī)會(huì),因此冰淇淋銷量與溺水人數(shù)可以呈現(xiàn)顯著相關(guān),但這并不意味著二者之間存在直接因果作用。

2

為什么相關(guān)不等于因果

同一個(gè)統(tǒng)計(jì)關(guān)系,背后可能對應(yīng)完全不同的解釋。

有時(shí)是 A 導(dǎo)致 B(A→B)。比如,吸煙增加肺癌風(fēng)險(xiǎn)。

有時(shí)是 B 導(dǎo)致 A(B→A)。比如,壓力大的人睡不好,到底是壓力導(dǎo)致失眠,還是長期失眠讓人更焦慮、更容易感到壓力大?

有時(shí)是 A 和 B 都由 C 引起(A←C→B)。冰淇淋銷量和溺水人數(shù),就是這種典型的混雜。

還有種情況是,A 和 B 都會(huì)影響某個(gè)第三變量 C(A→C←B)。如果我們只分析那些“C 發(fā)生了”的樣本,就可能在 A 和 B 之間看到原本并不存在的關(guān)系。這種結(jié)構(gòu)在因果圖里叫對撞點(diǎn),由此帶來的偏差常表現(xiàn)為選擇偏差。想象一所學(xué)校的錄取規(guī)則是同時(shí)看成績和體育特長,兩項(xiàng)可以互相彌補(bǔ)——只要你有一項(xiàng)特別突出,就有機(jī)會(huì)被錄取。在全體考生中,成績和體育本來沒什么關(guān)系,有人擅長考試但不愛運(yùn)動(dòng),有人運(yùn)動(dòng)健將但成績平平。但如果你只盯著被錄取的人看,就會(huì)觀察到一種奇特的現(xiàn)象:成績頂尖的人,體育往往比較一般,因?yàn)樗某煽円呀?jīng)足夠讓他進(jìn)來,不需要體育幫忙;反過來,體育拔尖的人,成績也常常不太突出,道理相同。在這里,“被錄取”就是一個(gè)由成績和體育共同決定的對撞點(diǎn)。只看這個(gè)子樣本,就會(huì)制造出成績和體育之間的表面負(fù)相關(guān)——它們本來無關(guān),但因?yàn)楣餐瑳Q定了一個(gè)結(jié)果,在結(jié)果內(nèi)部反而顯得“此消彼長”。

有些系統(tǒng)里,A 和 B 甚至可能彼此反饋。比如經(jīng)濟(jì)增長和就業(yè),常常互相影響。再極端一點(diǎn),有時(shí)所謂“顯著關(guān)系”只是小樣本下的偶然巧合,換一批數(shù)據(jù)就不見了。

所以,“相關(guān)不等于因果”并不是一句口號,而是一種更嚴(yán)格的判斷方式。它提醒我們:相關(guān)告訴我們這里存在統(tǒng)計(jì)關(guān)聯(lián),卻不自動(dòng)告訴我們“誰影響了誰”以及“影響有多大”。更進(jìn)一步,因果分析還提醒我們,并不是控制的變量越多越好。如果控制的是暴露和結(jié)果的共同原因,通常有助于減少混雜偏差;如果控制的是對撞點(diǎn),反而可能制造出原本不存在的相關(guān)性;如果控制的是中介變量,那么在關(guān)注總效應(yīng)時(shí),就可能把一部分真實(shí)作用路徑人為切斷。也就是說,因果分析不是簡單地把更多變量塞進(jìn)回歸,而是要先弄清楚這些變量在整體結(jié)構(gòu)中扮演什么角色。

3

因果分析真正多問了什么

如果說相關(guān)研究的是“變量如何一起變化”,那么因果研究真正多問的一步是:如果我主動(dòng)改變它,結(jié)果會(huì)不會(huì)變?

這一步看起來樸素,卻是最困難的地方。因?yàn)橄嚓P(guān)只是在描述我們已經(jīng)看到的世界,而因果在追問的是:如果條件被改動(dòng),結(jié)果會(huì)不會(huì)隨之改變。

把這個(gè)區(qū)別說得很清楚的一種方式,是把因果問題分成三個(gè)層次。第一層是觀察。這一層關(guān)心的是我們從數(shù)據(jù)里直接看到了什么,比如相關(guān)性、條件概率和回歸系數(shù)。第二層是干預(yù)。這一層不再滿足于看見模式,而是繼續(xù)追問:如果我真的去改變一個(gè)條件,會(huì)發(fā)生什么?第三層是反事實(shí)。這一層最難,它關(guān)心的是已經(jīng)發(fā)生的事情本來是否可能有另一種結(jié)果。比如,一個(gè)病人后來康復(fù)了,我們會(huì)追問:如果當(dāng)時(shí)沒有接受治療,他還會(huì)康復(fù)嗎?

這三層常被概括為因果之梯。它真正想表達(dá)的意思是:相關(guān)主要停留在第一層,而因果分析至少要往第二層走一步。線性模型因此并不是沒用,而是它通常主要處在“觀察”這一層,是發(fā)現(xiàn)模式的起點(diǎn),而不是因果問題的終點(diǎn)。Pearl 在《The Book of Why》中正是用這條“觀察—干預(yù)—反事實(shí)”的階梯,把統(tǒng)計(jì)關(guān)聯(lián)與因果問題區(qū)分開來。

這里還要多加一句邊界說明:在隨機(jī)對照實(shí)驗(yàn)里,“干預(yù)”可以直接通過實(shí)驗(yàn)操作來定義;在觀察性研究里,第二層問題往往還需要額外的識別假設(shè)或策略,比如可忽略性、工具變量、斷點(diǎn)回歸、雙重差分等,否則“如果我改變它”這句話并不能自動(dòng)從相關(guān)數(shù)據(jù)里讀出來。這種從觀察到干預(yù)的跨越,在依賴觀察數(shù)據(jù)的學(xué)科中尤其具有挑戰(zhàn)性。對很多學(xué)科而言,真正困難的還不只是理解這條因果之梯本身,而是如何在難以操控、只能觀察的數(shù)據(jù)里,盡可能把機(jī)制問題問清楚。比較和演化研究正是這樣的典型場景。



圖2. 因果之梯的三個(gè)層級。第一層“觀察”,第二層“干預(yù)”,第三層“反事實(shí)”。線性模型主要停留在觀察層,而因果分析至少要進(jìn)入干預(yù)層。更高層級的因果模型通常包含回答下層問題所需的信息,因此能夠覆蓋下層問題的回答范圍。

4

在演化生物學(xué)中,因果尤其重要

因果思維對演化生物學(xué)尤其重要,因?yàn)檠莼飳W(xué)關(guān)注的核心問題之一,是生物差異和生物多樣性如何產(chǎn)生、維持和改變。它當(dāng)然關(guān)心不同性狀、類群和環(huán)境之間反復(fù)出現(xiàn)的模式,但更核心的追問是:這些模式究竟由什么過程造成。為什么某個(gè)性狀會(huì)出現(xiàn),為什么會(huì)變大,為什么又會(huì)消失?背后可能是自然選擇帶來的適應(yīng)優(yōu)勢,也可能受到發(fā)育限制,或者主要反映共同祖先留下的歷史痕跡。只看到相關(guān),我們最多知道哪些模式反復(fù)出現(xiàn);只有繼續(xù)追問因果,才更有可能判斷這些模式背后的機(jī)制。

這類問題在比較研究中尤其突出,因?yàn)榭缥锓N數(shù)據(jù)天然面臨兩個(gè)困難。第一,物種之間并不是獨(dú)立樣本。近緣物種共享祖先,也往往繼承了相似的形態(tài)、生活史和生態(tài)背景,因此某些相關(guān)關(guān)系可能部分來自共同歷史,而不完全來自當(dāng)前機(jī)制。第二,不同候選解釋常常彼此相關(guān)、同時(shí)變化。結(jié)果就是,同一個(gè)跨物種模式,往往可以支持不止一種生物學(xué)解釋,而單個(gè)統(tǒng)計(jì)模型通常很難告訴我們,哪些關(guān)系更接近機(jī)制,哪些只是共同變化留下的表象。系統(tǒng)發(fā)育比較方法的重要性,就在于它把這種由共享歷史帶來的非獨(dú)立性納入分析,從而更謹(jǐn)慎地評估比較數(shù)據(jù)中的變量關(guān)系。

相對腦大小的演化,就是一個(gè)典型例子。圍繞“為什么有些脊椎動(dòng)物演化出更大的腦”,研究者長期提出過不同解釋。其中最有影響力的一類觀點(diǎn),是 Dunbar 提出的社會(huì)腦假說。這個(gè)假說認(rèn)為,社會(huì)關(guān)系越復(fù)雜,個(gè)體需要處理和記憶的社會(huì)信息就越多,因此更大的腦可能是一種應(yīng)對社會(huì)復(fù)雜性的認(rèn)知適應(yīng)。這個(gè)假說之所以影響深遠(yuǎn),是因?yàn)樵缙谠S多比較研究確實(shí)觀察到群體規(guī)模、社會(huì)聯(lián)系和腦大小之間的正相關(guān)(圖3)。



圖3.社會(huì)腦假說的經(jīng)典證據(jù)圖:靈長類平均群體規(guī)模與新皮層比例的正相關(guān)。在不同靈長類屬中,平均群體規(guī)模越大,新皮層比例通常也越高。這一模式曾被解釋為:更復(fù)雜的社會(huì)關(guān)系需要更強(qiáng)的信息處理能力,因此與更高的新皮層比例相聯(lián)系。改自 Dunbar (1998)。

隨著樣本擴(kuò)大和分析方法更新,事情開始變得沒有這么簡單。2017 年,DeCasien、Williams 和 Higham 在 Nature Ecology & Evolution 上重新分析靈長類數(shù)據(jù),發(fā)現(xiàn)當(dāng)體型和系統(tǒng)發(fā)育被納入控制后,食果類靈長類的腦組織平均比同體重的食葉類高約 25%,而群體規(guī)模、社會(huì)系統(tǒng)和交配系統(tǒng)都不能解釋額外的腦大小變異。作者據(jù)此提出,尋找果實(shí)所需的空間記憶、提取性取食,以及高質(zhì)量食物帶來的能量條件,可能比社會(huì)復(fù)雜性更直接地推動(dòng)了腦演化。與此同時(shí),他們對靈長類相對腦大小和群體規(guī)模的祖先狀態(tài)重建也顯示,兩者的演化軌跡并不總是同步變化(圖4),這進(jìn)一步削弱了“群體越大,腦就越大”這一簡單解釋。



圖4. 靈長類相對腦容積(左)與平均群體規(guī)模(右)的祖先狀態(tài)重建。顏色由紅到藍(lán)表示相對腦容積和平均群體規(guī)模由低到高。按照社會(huì)腦假說的簡單預(yù)測,群體規(guī)模增加的譜系往往也應(yīng)伴隨腦大小上升;但這張圖顯示,二者的演化軌跡并不總是同步。DeCasien 等(2017)據(jù)此認(rèn)為,社會(huì)性并不足以單獨(dú)解釋靈長類腦大小演化。

不過,這并不意味著答案就變成了“社會(huì)性錯(cuò)了,食性對了”。2023 年,Grabowski 等人在 Systematic Biology 上利用 128 個(gè)靈長類物種的完整比較數(shù)據(jù),并采用能同時(shí)處理適應(yīng)過程與系統(tǒng)發(fā)育歷史的比較模型重新分析腦大小演化,結(jié)果發(fā)現(xiàn)飲食和社會(huì)性都會(huì)產(chǎn)生影響:向更復(fù)雜的社會(huì)性轉(zhuǎn)變與相對更大的腦相關(guān),而向更偏食葉的方向轉(zhuǎn)變則與相對更小的腦相關(guān)。也就是說,同一個(gè)問題,在不同數(shù)據(jù)和模型下,并不會(huì)自動(dòng)收斂到一個(gè)唯一答案。

近年的研究進(jìn)一步表明,大腦演化不僅與社會(huì)和生態(tài)壓力有關(guān),也受到發(fā)育與能量條件的限制。2025 年發(fā)表于PNAS的一項(xiàng)跨脊椎動(dòng)物研究提出,相對腦容積最大的譜系,往往既能夠產(chǎn)生較大的單個(gè)后代,又能維持較高體溫(圖5)。這說明,理解大腦演化,不能只問“更大的腦有沒有用”,還要問“生物體是否有條件承擔(dān)它的代價(jià)”。



圖5. 相對更大的腦如何演化出來:發(fā)育與能量條件示意圖。影響脊椎動(dòng)物腦變大的關(guān)鍵條件主要有兩類:一類與較大的新生個(gè)體有關(guān),反映發(fā)育早期更高的資源投入;另一類與較高體溫有關(guān),反映更有利于維持大腦這種高代謝器官的生理?xiàng)l件。體內(nèi)受精和內(nèi)溫性是與這兩類條件關(guān)系最密切的主要因素,而護(hù)育與攜帶后代、通過行為調(diào)節(jié)體溫等行為途徑,也可能在部分類群中起到輔助作用。改自 Song et al. (2025)。

把這些研究放在一起看,問題就變得很清楚了:在腦大小這樣的課題上,困難并不在于找不到相關(guān),而在于社會(huì)因素、生態(tài)因素、發(fā)育條件、親代投入和熱生理?xiàng)l件往往纏在一起變化。于是,當(dāng)我們發(fā)現(xiàn)某個(gè)因素與腦大小顯著相關(guān)時(shí),并不能立刻說腦變大就是由它直接造成的。單靠相關(guān)模式本身,我們很難分清到底是哪一個(gè)因素更接近真正的原因。

正因如此,線性模型、混合模型和系統(tǒng)發(fā)育回歸雖然是比較研究的基礎(chǔ)工具,卻更擅長描述模式,不一定足以單獨(dú)完成機(jī)制判別。當(dāng)多個(gè)解釋彼此相關(guān)時(shí),不同的變量選擇、控制策略和模型設(shè)定,都可能改變結(jié)果的解釋方向。在這樣的背景下,研究者才會(huì)進(jìn)一步發(fā)展那些比普通相關(guān)分析更接近機(jī)制解釋的方法。在比較生物學(xué)中,一個(gè)常見做法是從已有生物學(xué)假說出發(fā),明確提出幾種候選因果結(jié)構(gòu),再比較它們與數(shù)據(jù)的一致性。系統(tǒng)發(fā)育路徑分析(phylogenetic path analysis, PPA)正是這樣一種確認(rèn)式框架:它在考慮共享祖先影響的同時(shí),比對不同候選模型,從而區(qū)分直接路徑和間接路徑,并比較不同路徑的相對作用。和單純回歸相比,這已經(jīng)更接近機(jī)制解釋;但它的邊界也很明確——它只能比較研究者已經(jīng)提出的結(jié)構(gòu),而不能保證真正的因果結(jié)構(gòu)一定就在這些模型之中。對比較和演化研究而言,因果思維的重要性,并不在于把原有結(jié)論說得更強(qiáng),而在于避免把伴隨變化誤當(dāng)成驅(qū)動(dòng)力,把歷史遺留誤當(dāng)成當(dāng)前適應(yīng),把表面相關(guān)誤當(dāng)成機(jī)制本身。

5

研究者怎樣從數(shù)據(jù)逼近因果

面對因果問題,研究者通常會(huì)分兩步走:先盡量弄清變量之間可能的作用結(jié)構(gòu),誰更像上游,誰更像下游,哪些邊可能根本不該有;再進(jìn)一步,討論如果真的改變某個(gè)變量,另一個(gè)變量會(huì)怎么變,變化有多大。

前一部分為因果發(fā)現(xiàn);后一部分為因果推斷。它們回答的問題并不相同,但也不是彼此孤立。很多時(shí)候,如果連結(jié)構(gòu)都完全沒有頭緒,談效應(yīng)就會(huì)很危險(xiǎn);反過來,光有一張結(jié)構(gòu)圖,不去問“改變它會(huì)怎樣”,也還沒有真正觸及因果分析最核心的目標(biāo)。更重要的是,結(jié)構(gòu)并不總是要靠算法“發(fā)現(xiàn)”;在很多實(shí)際研究中,領(lǐng)域知識本身就是構(gòu)建因果圖的重要起點(diǎn),而數(shù)據(jù)驅(qū)動(dòng)的方法更多是在領(lǐng)域知識不足時(shí)提供補(bǔ)充、檢驗(yàn)或候選結(jié)構(gòu)。

研究者從數(shù)據(jù)里探索結(jié)構(gòu)時(shí),經(jīng)常會(huì)先問一個(gè)問題:在給定某個(gè)變量集之后,這個(gè)關(guān)系是否仍然存在?如果 A 和 B 表面相關(guān),但在給定某個(gè)變量集之后,A 和 B 條件獨(dú)立,那么它們之間看到的聯(lián)系,未必是一條直接作用。沿著這條思路,發(fā)展出了一類經(jīng)典的結(jié)構(gòu)學(xué)習(xí)方法,其中最有代表性的就是PC 算法(PC algorithm)。

PC 算法并不是簡單地“看哪個(gè)變量和哪個(gè)變量相關(guān),就給它畫箭頭”。它真正利用的是條件獨(dú)立關(guān)系。假設(shè)我們關(guān)心四個(gè)變量:降雨、灑水車、地面濕和路面濕滑。直覺上,降雨和灑水車都可能讓地面變濕,而地面濕了以后,路面更容易濕滑。PC 算法一開始并不知道這些方向。它先假設(shè)變量之間都可能有關(guān),從一張所有變量兩兩相連的無向圖出發(fā);然后通過一系列條件獨(dú)立檢驗(yàn),不斷刪除那些其實(shí)不需要保留的邊。比如,如果數(shù)據(jù)表明“降雨”和“灑水車”在給定某個(gè)變量集之后條件獨(dú)立,那么它們之間的直接邊就沒有保留的必要。在刪邊之后,算法再利用一些特殊的局部結(jié)構(gòu)來幫助定向。其中最經(jīng)典的一類是 v-structure:如果 A 和 B 本身不相連,但都和 C 相連,并且先前找到的分離集合里不包含 C,那么算法就會(huì)把這部分結(jié)構(gòu)定向成 A→C←B。因此,PC 的關(guān)鍵不在于“控制后相關(guān)是不是變?nèi)趿恕?,而在于能不能找到某個(gè)條件變量集,使兩個(gè)變量在給定它之后變得條件獨(dú)立。

PC 算法的重要價(jià)值,在于它把“相關(guān)不等于因果”變成了一套可以操作的分析流程:哪些邊可能根本不該存在,哪些方向有一定結(jié)構(gòu)依據(jù),哪些地方的數(shù)據(jù)還不足以把方向分清,它都能給出相應(yīng)信息。但它也有清楚的邊界。標(biāo)準(zhǔn) PC 并不總能唯一確定每條邊的方向,而常常只能輸出一個(gè)由數(shù)據(jù)支持的等價(jià)類;那些保留下來的無向邊,表示方向暫時(shí)仍不可識別。它的結(jié)果也依賴條件獨(dú)立檢驗(yàn)本身:在線性高斯情形里,常見做法是偏相關(guān)或 Fisher’s Z;換成離散或二元數(shù)據(jù),則需要使用別的檢驗(yàn)方法。此外,標(biāo)準(zhǔn) PC 主要適用于沒有隱藏變量的觀測數(shù)據(jù);如果存在隱藏共同原因,通常要考慮 FCI 或 RFCI 等更一般的方法。

除了“在給定某些變量后是否仍然條件相關(guān)”,研究者還會(huì)問另一個(gè)問題:如果環(huán)境變了,這個(gè)關(guān)系還穩(wěn)嗎?這類方法的出發(fā)點(diǎn)同樣很直觀。一個(gè)模型也許能在當(dāng)前數(shù)據(jù)里預(yù)測得很好,但它利用的可能只是某個(gè)環(huán)境特有的相關(guān)。只有那些在環(huán)境變化之后仍然保持穩(wěn)定的關(guān)系,才更有機(jī)會(huì)接近機(jī)制本身。沿著這條思路,一個(gè)經(jīng)典的方法叫不變因果預(yù)測(Invariant Causal Prediction, ICP)。它利用不同環(huán)境中預(yù)測關(guān)系是否保持不變,去尋找目標(biāo)變量的直接因果父節(jié)點(diǎn)的候選集合,并在滿足相應(yīng)假設(shè)時(shí)給出置信區(qū)間。這里的表述要謹(jǐn)慎:它并不是在所有條件下都能直接給出“真值因果”,而是在其模型和不變性假設(shè)成立時(shí),嘗試縮小真正因果變量的范圍。

沿著相近方向,還有錨回歸(Anchor regression)。它的核心目標(biāo)是面對分布偏移時(shí)的穩(wěn)健預(yù)測:在一定條件下,因果參數(shù)會(huì)在新分布中表現(xiàn)出更好的預(yù)測穩(wěn)定性,但 Anchor regression 本身并不等于“已經(jīng)識別出因果效應(yīng)”。它更準(zhǔn)確的定位,是一類把異質(zhì)環(huán)境和穩(wěn)健預(yù)測結(jié)合起來的方法。再往后,還有近年的一些優(yōu)化方法,例如 NegDRO。這些方法試圖把“跨環(huán)境穩(wěn)定性”進(jìn)一步轉(zhuǎn)化為可求解的優(yōu)化目標(biāo),但目前仍屬于快速發(fā)展中的方向。和 PC 算法相比,這條路線依賴的不是條件獨(dú)立結(jié)構(gòu),而是環(huán)境變化下的機(jī)制穩(wěn)定性。兩者并不是誰取代誰,而是在使用不同類型的因果信息。一個(gè)更關(guān)注“控制以后還在不在”,一個(gè)更關(guān)注“換個(gè)環(huán)境之后還穩(wěn)不穩(wěn)”。對于真正復(fù)雜的問題,這兩類信息常常是互補(bǔ)的,而不是非此即彼。

6

從顯著關(guān)系到因果判斷,還差哪些證據(jù)

走到這里,其實(shí)就能更清楚地看見:從“統(tǒng)計(jì)關(guān)系顯著”到“因果判斷成立”,中間還隔著不少關(guān)鍵環(huán)節(jié)。

首先,研究者需要弄清楚,這個(gè)關(guān)系是不是可能來自混雜、反向因果、選擇偏差或反饋。其次,還要看,在控制其他變量之后,這個(gè)關(guān)系是否仍然存在;在更換環(huán)境、樣本、類群或分布之后,它是否仍然穩(wěn)定。再往后,如果條件允許,還需要借助實(shí)驗(yàn)、自然實(shí)驗(yàn)、縱向追蹤、穩(wěn)健性檢驗(yàn),甚至領(lǐng)域知識來進(jìn)一步驗(yàn)證。

也就是說,顯著性只是一個(gè)起點(diǎn),而不是一張通往因果結(jié)論的直通車票。一個(gè) p 值再小,也不等于已經(jīng)回答了“如果改變它,會(huì)怎樣”這個(gè)問題。真正成熟的因果判斷,需要的不只是相關(guān)模式本身,而是圍繞這個(gè)模式不斷增加的結(jié)構(gòu)證據(jù)、干預(yù)證據(jù)和穩(wěn)定性證據(jù)。

所以,下次當(dāng)我們再看到一句“X 顯著影響 Y”時(shí),最值得追問的,也許不是它的 p 值到底有多小,而是:這份數(shù)據(jù)真正支持的,只是一條統(tǒng)計(jì)關(guān)系,還是已經(jīng)有了更強(qiáng)的因果證據(jù)?

而科學(xué),恰恰是在這一步步更嚴(yán)格的追問里,慢慢接近答案。

參考文獻(xiàn)

[1] Cornwallis, C. K., & Griffin, A. S. (2024). A guided tour of phylogenetic comparative methods for studying trait evolution. Annual Review of Ecology, Evolution, and Systematics, 55(1), 181–204. https://doi.org/10.1146/annurev-ecolsys-102221-050754

[2] DeCasien, A. R., Williams, S. A., & Higham, J. P. (2017). Primate brain size is predicted by diet but not sociality. Nature Ecology & Evolution, 1, 0112. https://doi.org/10.1038/s41559-017-0112

[3] Dunbar, R. I. M. (1998). The social brain hypothesis. Evolutionary Anthropology, 6(5), 178–190.

[4] Dunbar, R. I. M. (2009). The social brain hypothesis and its implications for social evolution. Annals of Human Biology, 36(5), 562–572. https://doi.org/10.1080/03014460902960289

[5] Glymour, C., Zhang, K., & Spirtes, P. (2019). Review of causal discovery methods based on graphical models. Frontiers in Genetics, 10, 524.

[6] Grabowski, M., Kopperud, B. T., Tsuboi, M., & Hansen, T. F. (2023). Both diet and sociality affect primate brain-size evolution. Systematic Biology, 72(2), 404–418. https://doi.org/10.1093/sysbio/syac075

[7] Kalisch, M., M?chler, M., Colombo, D., Maathuis, M. H., & Bühlmann, P. (2012). Causal inference using graphical models with the R package pcalg. Journal of Statistical Software, 47(11), 1–26. https://doi.org/10.18637/jss.v047.i11

[8] Nogueira, A. R., Pugnana, A., Ruggieri, S., Pedreschi, D., & Gama, J. (2022). Methods and tools for causal discovery and causal inference. WIREs Data Mining and Knowledge Discovery, 12(2), e1449.

[9] Pearl, J., & Mackenzie, D. (2018). The Book of Why: The New Science of Cause and Effect. Basic Books.

[10] Peters, J., Bühlmann, P., & Meinshausen, N. (2016). Causal inference by using invariant prediction: Identification and confidence intervals. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 78(5), 947–1012.

[11] Rothenh?usler, D., Meinshausen, N., Bühlmann, P., & Peters, J. (2021). Anchor regression: Heterogeneous data meet causality. Journal of the Royal Statistical Society: Series B (Statistical Methodology), 83(2), 215–246.

[12] Song, Z., et al. (2025). Parental investment and body temperature explain encephalization in vertebrates. Proceedings of the National Academy of Sciences of the United States of America, 122(45), e2506145122. https://doi.org/10.1073/pnas.2506145122

[13] van Schaik, C. P., Song, Z., Schuppli, C., Drobniak, S. M., Heldstab, S. A., et al. (2023). Extended parental provisioning and variation in vertebrate brain sizes. PLOS Biology, 21(2), e3002016. https://doi.org/10.1371/journal.pbio.3002016

[14] von Hardenberg, A., & Gonzalez-Voyer, A. (2013). Disentangling evolutionary cause-effect relationships with phylogenetic confirmatory path analysis. Evolution, 67(2), 378–387. https://doi.org/10.1111/j.1558-5646.2012.01790.x

[15] Wang, Z., Hu, Y., Bühlmann, P., & Guo, Z. (2024). Causal invariance learning via efficient optimization of a nonconvex objective. arXiv preprint, arXiv:2412.11850. https://doi.org/10.48550/arXiv.2412.11850

本文經(jīng)授權(quán)轉(zhuǎn)載自微信公眾號“ZJU生命演化研究”,原標(biāo)題為《從相關(guān)性到因果:數(shù)據(jù)表象到本質(zhì)機(jī)制的科學(xué)追問》。

注:本文封面圖片來自版權(quán)圖庫,轉(zhuǎn)載使用可能引發(fā)版權(quán)糾紛。



特 別 提 示

1. 進(jìn)入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

2.『返樸』提供按月檢索文章功能。關(guān)注公眾號,回復(fù)四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
龍珠,日本男子花160萬還原布爾瑪19,簡直太絕了!

龍珠,日本男子花160萬還原布爾瑪19,簡直太絕了!

動(dòng)漫心世界
2026-04-21 17:33:31
馬克龍:霍爾木茲海峽再被封,美伊雙方都有責(zé)任

馬克龍:霍爾木茲海峽再被封,美伊雙方都有責(zé)任

看看新聞Knews
2026-04-21 10:52:33
爆!張?zhí)鞇郾恢府?dāng)小三卷入富豪婚變,社媒淪陷,仍分享日常!

爆!張?zhí)鞇郾恢府?dāng)小三卷入富豪婚變,社媒淪陷,仍分享日常!

可樂談情感
2026-04-20 19:57:35
海軍四川艦赴南海開展試驗(yàn)訓(xùn)練

海軍四川艦赴南海開展試驗(yàn)訓(xùn)練

界面新聞
2026-04-21 23:23:46
恒大集團(tuán)許家印牽連的12個(gè)女人

恒大集團(tuán)許家印牽連的12個(gè)女人

地產(chǎn)微資訊
2026-04-21 17:02:14
萬達(dá)女子墜樓!滿頭是血當(dāng)場死亡,網(wǎng)友曝更多,或不止墜樓那簡單

萬達(dá)女子墜樓!滿頭是血當(dāng)場死亡,網(wǎng)友曝更多,或不止墜樓那簡單

呼呼歷史論
2026-04-22 00:54:47
被中方反制打痛了?捷克拒絕議長竄臺(tái),高呼永遠(yuǎn)堅(jiān)定一個(gè)中國原則

被中方反制打痛了?捷克拒絕議長竄臺(tái),高呼永遠(yuǎn)堅(jiān)定一個(gè)中國原則

近史博覽
2026-04-22 04:03:26
86年我在工廠值夜班,半夜撞見廠長媳婦從倉庫出來,她讓我別聲張

86年我在工廠值夜班,半夜撞見廠長媳婦從倉庫出來,她讓我別聲張

千秋文化
2026-04-21 20:11:53
比賴清德還狂的人出現(xiàn)了,如果她當(dāng)選臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

比賴清德還狂的人出現(xiàn)了,如果她當(dāng)選臺(tái)灣領(lǐng)導(dǎo)人,解放軍必定收臺(tái)

芳芳?xì)v史燴
2026-03-29 21:09:31
深圳一行業(yè)巨頭跌停,市值一夜蒸發(fā)超118億

深圳一行業(yè)巨頭跌停,市值一夜蒸發(fā)超118億

南方都市報(bào)
2026-04-21 19:49:48
一夜被吞!四川27家銀行集體解散,釋放啥信號?

一夜被吞!四川27家銀行集體解散,釋放啥信號?

夜深愛雜談
2026-04-21 07:47:30
1960年閻錫山去世,臨終前留下奇怪遺言:我死后你們不要放聲大哭

1960年閻錫山去世,臨終前留下奇怪遺言:我死后你們不要放聲大哭

云霄紀(jì)史觀
2026-04-22 01:31:13
美國、以色列最新表態(tài)

美國、以色列最新表態(tài)

魯中晨報(bào)
2026-04-21 21:44:03
克洛普若執(zhí)教皇馬,第一刀砍向歐冠功勛!26歲王牌遭清洗

克洛普若執(zhí)教皇馬,第一刀砍向歐冠功勛!26歲王牌遭清洗

瀾歸序
2026-04-22 01:12:12
羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個(gè)月

羽毛球女神淪為“生育工具”!韓景楓官宣二胎,距離1胎僅隔5個(gè)月

翰飛觀事
2026-04-20 19:43:28
劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

劉少奇位次何以反超周恩來?長征殘兵營里死守一張底牌

人生錄
2026-04-21 20:24:11
美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

美記:科爾身邊的人告訴我,他幾周前就知道自己要離開勇士了

懂球帝
2026-04-21 15:19:11
我的蛋糕沒了...

我的蛋糕沒了...

果粉之家
2026-04-21 12:36:56
韋德:得知杜蘭特G1不打的時(shí)候,我就知道詹姆斯會(huì)徹底掌控比賽

韋德:得知杜蘭特G1不打的時(shí)候,我就知道詹姆斯會(huì)徹底掌控比賽

懂球帝
2026-04-21 12:07:09
女兒用父親公司賬戶1700萬元打賞主播、拆卡,已前往當(dāng)?shù)嘏沙鏊允?能否以“職務(wù)侵占”立案仍需調(diào)查

女兒用父親公司賬戶1700萬元打賞主播、拆卡,已前往當(dāng)?shù)嘏沙鏊允?能否以“職務(wù)侵占”立案仍需調(diào)查

紅星新聞
2026-04-21 12:54:20
2026-04-22 04:43:00
返樸 incentive-icons
返樸
科學(xué)新媒體“返樸”,科普中國子品牌,倡導(dǎo)“溯源守拙,問學(xué)求新”。
4183文章數(shù) 15891關(guān)注度
往期回顧 全部

科技要聞

創(chuàng)造4萬億帝國、訪華20次,庫克留下了什么

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

頭條要聞

三國取消飛航許可 賴清德無法竄訪斯威士蘭

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

宋承炫曬寶寶B超照,宣布老婆懷孕

財(cái)經(jīng)要聞

現(xiàn)實(shí)是最大的荒誕:千億平臺(tái)的沖突始末

汽車要聞

全新坦克700正式上市 售價(jià)42.8萬-50.8萬元

態(tài)度原創(chuàng)

本地
健康
藝術(shù)
手機(jī)
公開課

本地新聞

春色滿城關(guān)不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

任伯年寫竹,真帶勁

手機(jī)要聞

iOS 26.5 Beta 3新版體驗(yàn):改進(jìn)解鎖流暢度,信號也變好了?

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版