国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

天津大學薛霄團隊:從仿真到解釋:計算實驗框架下的社會模擬器演化

0
分享至


導語

如何用計算實驗揭開復雜社會系統(tǒng)的“因果黑箱”?本文從涌現(xiàn)現(xiàn)象出發(fā),系統(tǒng)梳理復雜性的六大來源,并提出將復雜性形式化為低概率因果事件鏈的新視角。通過區(qū)分橫向/縱向、正向/反向因果,文章構建“ABM + 實驗”的計算實驗框架,打通微觀機制與宏觀效應的分析路徑,形成“描述–解釋–預測”一體化研究范式。以O2O外賣平臺為例,借助LLM驅(qū)動的多主體仿真,成功識別“騎手內(nèi)卷”的生成邏輯與關鍵杠桿,展現(xiàn)計算實驗在平臺治理中的強大解釋力與決策價值。

本篇論文一作薛霄教授為發(fā)起人,報名讀書會加入Agent建模與仿真的前沿探索之旅。

關鍵詞:Agent仿真、社會模擬器、計算實驗、復雜系統(tǒng)因果

ZM丨作者

AI Agent與智能服務實驗室-TJU丨來源


選自:薛霄 著. 《復雜系統(tǒng)的計算實驗方法-從Agent Simulation到Social Simulator》,科學出版社,2025年12月. ISBN:978-7-03-083607-6

1. 摘要

本文圍繞“如何用計算實驗理解與解釋復雜社會系統(tǒng)的因果機制”展開。首先從涌現(xiàn)現(xiàn)象入手,梳理復雜性產(chǎn)生的主要來源,包括規(guī)模與結構、多源噪聲、系統(tǒng)開放性、智能主體的學習與有限理性、強非線性以及不確定性與模糊性,并基于事件函數(shù)與西蒙適應理論,將系統(tǒng)復雜性的涌現(xiàn)形式化為低概率的順序因果事件組合。隨后,文章區(qū)分橫向因果(依賴性因果)與縱向因果(生成性因果),以及正向因果(干預效應)與反向因果(機制解釋),提出計算實驗作為連接兩類因果分析的橋梁:一方面利用 ABM 在人工社會中重構微觀交互過程,另一方面通過“多重世界”的反事實實驗估計宏觀因果效應。為此,文中構建了“計算實驗 = ABM + 實驗”的方法框架和“描述–解釋–預測”一體化設計框架,并給出三層因果分析結構:觀察分析、干預分析與機制分析 。最后以 O2O 外賣平臺為例,構建基于雙層學習演化的多主體實驗系統(tǒng),通過 LLM 驅(qū)動的 Policy Agent 與 Worker Agent 交互,量化并識別“騎手內(nèi)卷”的涌現(xiàn)模式、關鍵影響因素及其生成機制,驗證計算實驗在復雜平臺治理問題中的解釋與決策支持能力。

2. 系統(tǒng)的復雜性理論

復雜性目前沒有統(tǒng)一定義,不同層次的現(xiàn)實(物理、生物、社會、意識)各有不同的復雜性,不能互相替代。本節(jié)從成因出發(fā)做一個分類概述,再重點討論結構復雜性和分布復雜性,相關形式化公式主要參考 Cioffi-Revilla的著作《Introduction to Computational Social Science》。

1.復雜系統(tǒng)的涌現(xiàn)現(xiàn)象

要理解復雜系統(tǒng)中的因果機制,先要認識涌現(xiàn)現(xiàn)象。約亨·弗洛姆把涌現(xiàn)分為四類,如圖1所示:

(1)簡單涌現(xiàn):它涉及單向、自下而上的因果關系,通常表現(xiàn)為基本的統(tǒng)計特征;

(2)弱涌現(xiàn):反映了自上而下的因果關系,即個體行為受到集體規(guī)則的影響,進而形成集體智力的表達;

(3)多重涌現(xiàn):捕捉到了不同因果層之間互動的復雜性,體現(xiàn)了多層次因果關系的相互作用;

(4)強涌現(xiàn):微觀—中觀—宏觀多層次因果統(tǒng)一在一起。


圖1:弗羅姆的涌現(xiàn)分類

理解這些類型的涌現(xiàn)對于復雜系統(tǒng)中的因果推理至關重要。雖然宏觀層面的現(xiàn)象源于微觀層面的機制,但它們可以有效地替代因果推理中微觀層面的描述,這是因果涌現(xiàn)的核心現(xiàn)象。宏觀層面的行為描述更直觀,而微觀層面則包含了系統(tǒng)的所有復雜細節(jié)。然而,微觀層面的因果關系如何與宏觀層面的因果關系相聯(lián)系,仍然是一個有待充分探索的問題,需要解決以下挑戰(zhàn):

挑戰(zhàn) 1:多重影響因素和復雜性的相互關系

復雜系統(tǒng)內(nèi)存在多源噪聲(環(huán)境擾動、內(nèi)部波動、人為誤差),掩蓋了真實因果結構。

源于系統(tǒng)規(guī)模的復雜性:系統(tǒng)組件的數(shù)量代表系統(tǒng)的規(guī)模大小。

源于系統(tǒng)結構的復雜性:系統(tǒng)組件的多樣性和差異性造成了相互關系的多樣性和差異性,這是系統(tǒng)復雜性產(chǎn)生的根本原因。

源于開放性(環(huán)境)的復雜性:封閉系統(tǒng)沒有復雜性,復雜性必定出現(xiàn)于開放系統(tǒng)。開放性也是復雜性產(chǎn)生的重要原因,系統(tǒng)與環(huán)境相互作用的復雜性是系統(tǒng)復雜性的重要表現(xiàn)。

挑戰(zhàn) 2:Agent的學習和適應性,增加了因果識別的復雜性

源于主動性、能動性的復雜性:在簡單系統(tǒng)中,作用者與被作用者、原因與結果界限分明。但在復雜系統(tǒng)中,不同組成個體之間、系統(tǒng)與環(huán)境之間互為因果,相互作用。

源于個體智能的復雜性:由非智能個體構成的系統(tǒng),即使通過自組織產(chǎn)生復雜性,通常也是較為初步的、低級的。這種復雜性總有辦法解決,屬于初級復雜性。由智能個體所構成的系統(tǒng)(如圣塔菲研究的CAS)能夠辨識環(huán)境、預測未來、從經(jīng)驗中學習,進而形成良好的行為規(guī)則,使自身發(fā)生適應性變化,因而必定是復雜的。個體的智能程度越高,系統(tǒng)的復雜性也越高。

源于人類理性的復雜性:以人作為構成要素的系統(tǒng),其行為必須考慮人的理性因素所起的作用。尤其在競爭性系統(tǒng)中,博弈者的理性(智慧、謀略等)是產(chǎn)生復雜性的重要來源。

挑戰(zhàn) 3:從微觀到宏觀層面的涌現(xiàn),掩蓋了潛在的微觀機制

源于非線性的復雜性:事物發(fā)展變化的終極原因是相互作用,但相互作用有線性和非線性之分。線性意味著單一、均勻、不變,不具備產(chǎn)生復雜性的條件。非線性意味著無窮的多樣性、差異性、可變性、非均勻性、奇異性、創(chuàng)新性。非線性自身包含極大的差異性。弱非線性仍不可能產(chǎn)生復雜性,只是作為擾動因素,可用線性模型加微擾的方法有效描述。只有強非線性,才可能產(chǎn)生復雜性。

源于不確定性的復雜性:隨機性是一種重要的不確定性。平穩(wěn)隨機過程屬于簡單系統(tǒng),非平穩(wěn)過程才可能出現(xiàn)復雜性。生命系統(tǒng)、社會系統(tǒng)的組成個體具有智能性,個體之間具有復雜的相互作用,僅靠大數(shù)定律和概率統(tǒng)計方法并不能揭示其本質(zhì)特征。另一種重要的不確定性是模糊性,它既是復雜性的來源,又是復雜性的表現(xiàn)或結果。

2.系統(tǒng)復雜性理論:解釋

理論的基本任務是解釋現(xiàn)象——用因果敘事把前因(誘因)與后果(影響)鏈接起來。系統(tǒng)復雜性理論關注:在給定事實和數(shù)據(jù)下,如何用因果關系解釋“復雜性是怎么出現(xiàn)的”,如表1所示。


表1:系統(tǒng)復雜性的相關概念定義

在形式上,事件函數(shù)可以很詳細地表示出精確因果邏輯,解釋如何產(chǎn)生綜合事件。但是,存在哪些事件函數(shù)?不同事件函數(shù)如何解釋綜合事件的發(fā)生?如何根據(jù)事件函數(shù)確定綜合事件發(fā)生的概率?為了回答這些問題及其他類似問題,就必須在微觀水平上查看系統(tǒng)復雜性的邏輯,根據(jù)順序邏輯和條件邏輯辨識兩種因果解釋模式。根據(jù)西蒙理論的概念和假設(環(huán)境復雜性、目標尋求行為、有限理性、適應性、近乎可分解性),前向因果邏輯的順序樹可用于適應過程和復雜度的模型創(chuàng)建。圖2的模型提供了關于西蒙理論的一階表征。主要結果為Ω空間內(nèi)的各種結果均可通過組合產(chǎn)生。尤其,系統(tǒng)復雜性C的出現(xiàn)最少需要四種必要的順序狀況,具有顯著的低概率;否則就無法成功出現(xiàn)。其他結果(失敗E、E*和E**)發(fā)生概率相對較高,因此總體發(fā)生的概率更高。


圖2:西蒙適應理論和系統(tǒng)復雜性涌現(xiàn)的前進順序因果邏輯樹

3. 復雜系統(tǒng)的因果推理

傳統(tǒng)社會科學多依賴統(tǒng)計模型來識別“變量之間的關系”,強調(diào)“橫向因果”(變量間關聯(lián)),但難以呈現(xiàn)“從微觀到宏觀”的生成過程。因此,ABM提供了一種工具,可以明確模擬可能導致特定依賴關系的因果機制(縱向意義上)。但是,ABM在生成數(shù)據(jù)和論據(jù)方面可能不那么有力,無法說服特定受眾相信ABM真實反映了現(xiàn)實世界中的相關機制。因此,本節(jié)將梳理ABM與因果推理的相關工作,希望闡明二者之間的關系。

1.橫向因果與縱向因果

Casini和Manzo借鑒了Hall的分類體系,將因果理論分為橫向因果(因果推斷)和縱向因果(因果解釋)兩類。在橫向視角下,因果機制被解釋為一組變量的網(wǎng)絡,原因變量通過一系列變量的中介作用而影響結果變量。在縱向視角下,因果機制被設想為一個“復雜系統(tǒng)”,某一個體的行為(或?qū)傩缘母淖儯┠軌蛞l(fā)其他個體的某種行為(或?qū)傩缘母淖儯?,且微觀個體之間的相互作用能夠觸發(fā)系統(tǒng)層面現(xiàn)象或行為的產(chǎn)生,如圖3所示。

橫向因果主要用于宏觀層面,屬于“依賴性因果觀點”,討論的是關聯(lián)性視角下的因果關系,其目的是發(fā)現(xiàn)和界定兩個(或兩種)事件、現(xiàn)象、變量之間是否存在“原因”和“結果”的關系,并評估“原因”對于“結果”的因果效應??v向因果屬于“生成性因果性觀點”,旨在分析“原因”是如何(通過什么樣的路徑,受到什么樣的調(diào)節(jié),經(jīng)歷了何種過程)造成“結果”的,重在揭示從原因到結果的復雜路徑與過程。對于復雜系統(tǒng),我們往往需要還原涌現(xiàn)現(xiàn)象產(chǎn)生的過程才能把握因果機制。


圖3:因果關系研究的抽象框架

橫向因果和縱向因果都存在不可替代的優(yōu)點和不可避免的缺陷。橫向因果能夠通過分析數(shù)據(jù)進行反事實的驗證,但不能體現(xiàn)原因?qū)е陆Y果的過程;縱向因果能夠展示原因?qū)е陆Y果的過程,但難以得到現(xiàn)實數(shù)據(jù)的驗證。橫向因果對縱向因果的實驗設計可以提供方向性指導。這種實驗設計既能夠在關聯(lián)性的因果關系中體現(xiàn)出生成性,也能保證因果機制的穩(wěn)定性和可驗證性??v向因果可以為橫向因果提供機制性解釋。也就是說,橫向因果分析的論斷可以通過實驗進行推演,捕獲因果結構中的時間依賴性和非線性,從而為系統(tǒng)范圍內(nèi)的涌現(xiàn)現(xiàn)象提供一個可能的解釋。

2.正向因果與反向因果

Gelman 區(qū)分了兩種提問方式:

(1)正向因果:問“如果我們做 X,會發(fā)生什么?”,這是關注干預的效果;

(2)反向因果:問“是什么導致了 Y?”,這是從結果回溯原因集合。

在前一種情況下,人們關注一個特定的現(xiàn)象(例如教育),并希望確定其存在、不存在或變化的后果(例如對生育率的影響)。而在后一種情況下,人們觀察到一個給定的結果,并事后想追溯可能導致該結果發(fā)生的各種現(xiàn)象。潛在結果方法正是統(tǒng)計學家和許多經(jīng)濟學家用來處理“正向”或因果效應問題的框架,而實驗被視為解決這種類型因果推斷問題的典型方法。

但在確定了“X 的確對 Y 有效”之后,還要回答一個反向因果問題:“為什么這個干預有效?”,這就進入因果解釋層面,需要構造一個可能原因集,嘗試打開“一階因果依賴”的黑箱:它是否依賴于特定環(huán)境?隨時間推移,效應會不會衰減或反向?

Goldthorpe 進一步指出,因果關系可以從三種角度解釋:

(1)穩(wěn)健依賴:控制一組變量 Z后,X 仍然顯著影響 Y。屬于正向因果的研究范式。研究者基于由調(diào)查、普查、線上爬取等方式獲得的結構化與非結構化的(靜態(tài)的)觀察數(shù)據(jù),求解自變量X與因變量Y之間的反事實關聯(lián)關系f;

(2)結果操縱:通過干預 X觀察 Y的變化,也是正向因果的研究范式。研究者在進行因果推論時所采用的是縱向與橫向相結合的因果視角。在縱向視角的研究中,以控制組作為對比基準,對實驗組的研究對象進行某種干預,觀察當改變X時Y如何變化,并與X不變的情況作對比,這樣就可以對X和Y之間的因果關系做出推斷。

(3)生成過程:構建一個生成機制,說明“怎樣一步一步生成這個結果”,屬于反向因果的研究范式。這一范式采用的是縱向的、生成性的視角,主要采用多主體建模(Agent-based Modeling)為工具。其中Y表示所要解釋的社會現(xiàn)象,X表示若干個主體,主體具有不同的屬性,rule表示主體的行動以及與其他主體的互動規(guī)則,可以通過模擬來展示微觀互動是如何涌現(xiàn)出特定的宏觀現(xiàn)象。

縱觀這些視角,計算實驗最大的優(yōu)勢在于:可以同時支撐“結果操縱”(正向因果)與“生成過程”(反向因果意義上的機制解釋)。

4. 計算實驗與因果分析

1.計算實驗=ABM+實驗

針對ABM在因果推斷領域所面臨的挑戰(zhàn),王飛躍老師2004年系統(tǒng)化地提出ACP方法的基本思想、概念和方法,強調(diào)人工系統(tǒng)與實際系統(tǒng)之間的循環(huán)反饋關系。計算實驗方法是ABM的一種改進擴展,不僅僅是把ABM簡單地作為一種仿真工具,而是把它作為“自主生長培育”實際系統(tǒng)替代版本的“人工社會實驗室”,可以進行各類有關系統(tǒng)行為和決策分析的“反事實實驗”。一方面,計算實驗采用ABM來強調(diào)垂直因果,關注現(xiàn)象的成因、形成過程,賦予ABM所生成的跨層次關聯(lián)信息(微觀機制與宏觀涌現(xiàn)之間的聯(lián)系)以因果意義。另一方面,計算實驗“利用反事實算法構建多重世界”來強調(diào)水平因果,通過實驗機制在模型參數(shù)與宏觀涌現(xiàn)之間建立起概率關系,揭示系統(tǒng)內(nèi)部的模式和規(guī)律, 為實際系統(tǒng)運行的可能情況提供“借鑒”、“預估”和“引導”。由于實驗機制所依據(jù)的虛擬基礎,即Agent的屬性、行為和本地環(huán)境,是其現(xiàn)實世界對應物的翻版。因此,不同分析層面之間建立的概率關系可以被視為現(xiàn)實世界中跨分析層面的反事實聯(lián)系。

計算實驗屬于“生成式解釋”的研究路徑,即通過探求那些可以展示出社會現(xiàn)象如何產(chǎn)生的機制來進行溯因。傳統(tǒng)歸納解釋運用統(tǒng)計方法從數(shù)據(jù)得出一般規(guī)律,這些一般規(guī)律用于處理數(shù)據(jù)并且獨立于數(shù)據(jù)。但是生成解釋是運用微觀交互規(guī)則得出宏觀涌現(xiàn)結構,也就是說一般規(guī)律必然依賴于生成它們的基礎。故而,生成式解釋在方法論上提供了這樣一種理念:“我們?nèi)绾沃馈笔恰拔覀兪欠裰馈钡幕A,這種連通性恰恰是歸納和演繹所缺乏的。生成解釋不同于傳統(tǒng)的演繹或歸納路徑,將傳統(tǒng)均衡分析所忽視的個體差異、局部性互動、規(guī)則的演變放在了討論核心。如圖4所示,計算實驗方法是一個“實驗+推演”的機制探尋動態(tài)模式,包含以下四個核心步驟。


圖4:計算實驗的過程模型

(1)想定準備:計算實驗的第一步就是想定準備,人工社會模型只有被證明與實際場景符合,才可以用于計算實驗。

(2)實驗設計:計算實驗采用復雜系統(tǒng)研究的“多重世界”觀點,即實驗結果被視為一種可能的“現(xiàn)實”,其行為與現(xiàn)實“不同”但“等價”。實驗設計是遵循實驗方法論的,包含初始規(guī)則的設置、模型的檢驗和選擇,要么重現(xiàn)一些真實世界的設置或象,要么構建和觀察可能的世界。

(3)方案推演:計算實驗方案推演是演繹的,是指從Agent的初始配置推導出宏觀規(guī)則的演算過程。ABM 特別適用于生成式推演,其路徑在于將生成過程轉(zhuǎn)換為基于Agent的計算模型,通過計算仿真揭示宏觀規(guī)則的微觀生成機制。

(4)溯因分析:從機制的觀點來看,社會現(xiàn)象以及變量之間的相關性和持續(xù)共變并不能解釋社會現(xiàn)象,而需要用一系列引發(fā)現(xiàn)象變化的Agent及其行為來解釋。

2.計算實驗的設計框架

與傳統(tǒng)的研究路徑相比,計算實驗方法通過生成式推演和生成式實驗,為整合描述性模型、解釋性模型和預測性模型提供了一條獨特的途徑。其核心思想并非依賴宏觀層面的社會規(guī)律來解釋社會現(xiàn)象或識別統(tǒng)計相關因素,而是著重探索社會現(xiàn)象生成的機制。如圖5所示,基于計算實驗設計的綜合建??蚣馨ㄈ齻€模塊:①描述模塊(圖5上方),用于識別系統(tǒng)動態(tài)運行中的影響因素與響應變量;②解釋模塊(圖5兩側),基于析因?qū)嶒炘O計,觀察人工社會在干預(如新策略、參數(shù)變化)條件下的行為;③預測模塊(圖5下方),通過構建元模型,深化對人工社會演化的理解。具體如下:


圖5:計算實驗設計的總體框架

(1)描述模塊:確定影響因素和響應變量:計算實驗利用計算機模擬技術來解決復雜社會系統(tǒng)的生成性解釋問題:異構Agent的分布式局部交互如何自下而上地生成給定的(宏觀)規(guī)則?生成性問題是“如何”而非“為什么”,其答案在于將生成性過程置于基于Agent的人工社會之中。人工社會遵循“簡單一致性”原則,為現(xiàn)實復雜系統(tǒng)提供了整體性描述。一般而言,需重點關注的影響因素可以歸為幾種情況:① 環(huán)境突變導致系統(tǒng)發(fā)生變化,尤其是重大擾動導致的變化;② Agent之間的網(wǎng)絡拓撲結構引發(fā)的系統(tǒng)變化,例如全連接圖、隨機圖、無標度網(wǎng)絡、小世界網(wǎng)絡等;③ 干預策略作用下的系統(tǒng)變化,這在社會系統(tǒng)中尤為常見;④ Agent的種類、屬性、行為等發(fā)生變化,如果系統(tǒng)具有開放性特征,必然有一些新的Agent出現(xiàn),它們的出現(xiàn)會導致系統(tǒng)發(fā)生變化;⑤ 系統(tǒng)噪聲導致系統(tǒng)發(fā)生變化;⑥ 其他情況。如前所述,不僅需關注宏觀涌現(xiàn)現(xiàn)象,更要追溯其背后的成因與可能性,并在此基礎上開展實驗。

(2)解釋模塊:析因?qū)嶒炘O計:實驗過程通??梢孕蜗蟮乜醋魇且粋€轉(zhuǎn)化過程:從多個輸入的組合到具有一個或多個可觀察響應變量的輸出。實驗設計的目的是:① 通過計算實驗確定影響系統(tǒng)輸出的因素集合;② 通過計算實驗確定最有效的可控因素ui,使輸出結果更接近理想水平;③ 通過計算實驗確定可控因素ui的集合,以最小化不可控因素或事件vi對系統(tǒng)的影響。揭示輸入和輸出之間規(guī)律的最基本方法是分析人員或?qū)<抑笇У氖謩幽P吞剿?。它往往會產(chǎn)生偏差,可能會遺漏一些“有趣”的輸入空間未被探索。因此,需要找到一種更系統(tǒng)的方法來發(fā)現(xiàn)輸入和輸出之間的關系:① 對于具有確定性元素和有限值域的物理系統(tǒng),通常采用經(jīng)典實驗設計方法(例如隨機抽樣、全因子和部分因子設計以及中心復合設計)和現(xiàn)代實驗設計方法(例如組篩選設計、空間填充設計)作為工具;② 對于具有眾多不確定因素和隨機值空間的復雜社會系統(tǒng),蒙特卡洛方法和重采樣方法起著重要作用。與傳統(tǒng)實驗相比,計算實驗設計具有以下幾個特點:① 所有的實驗因子易于改變,因而可以設計含有眾多因子和水平的實驗;② 可以在更大的實驗域內(nèi)探索盡可能多的有價值信息;③ 可以使用偽隨機數(shù)并且實驗可控,因此不需要考慮隨機化和區(qū)組化;④更加關注序貫設計,即根據(jù)上一步的實驗結果有針對性地設計下一步的實驗點,進而可以有效地縮小樣本規(guī)模、避免過采樣,有助于提高實驗效率。

(3)預測模塊:人工社會的元模型:在收集輸入和輸出數(shù)據(jù)后,可以進行深入分析以提取支配這些關系的潛在規(guī)則。這種分析的主要目的就是提高預測和控制這些關系的有效能力。通過將元模型的預測與人工社會的演化結果進行比較,可以有效地驗證元模型預測結果的準確性和可靠性。此外,通過將優(yōu)化技術(例如精確或啟發(fā)式方法)與元模型技術相結合,它提供了一種可能的途徑來尋找特定的輸入?yún)?shù)組合,能夠使人工社會模型的輸出最大化或最小化。

3.計算實驗的分析框架

理解復雜系統(tǒng)中的因果機制,既需要識別“因果效應”本身,也需要解釋“因果過程”背后的機制。計算實驗方法正是連接這兩類因果分析的橋梁。通過模擬“人工社會”的運行過程,計算實驗不僅能夠預測變量之間的因果效應(正向因果),也能通過追蹤模擬軌跡和反事實路徑,探究潛在的因果機制(反向因果)。


圖6:計算實驗的因果推理框架

圖6給出了計算實驗的分析框架,闡述了如何使用計算實驗來分析人工社會中的世界模型。整個框架從三個層面進行實驗分析:① 第一層是association(what is?),即給定某個變量,出現(xiàn)結果的概率是多少。②第二層是intervention(what if?),即如果做了什么,結果會怎么樣? ③第三層是mechanism(how is?),即如果這個原因?qū)е铝私Y果,過程是什么?下面,將探討在框架的每個層次上使用的具體技術和方法。

(1)觀察分析(聯(lián)系必然與偶然):觀察分析的核心觀點承認事件未來結果及實現(xiàn)路徑的高度不確定性,具體表現(xiàn)為社會系統(tǒng)的演化具有多重可能性,并受到初始條件及外部因素的影響。觀察分析聚焦于社會系統(tǒng)演化路徑的可能性空間建模,識別出社會系統(tǒng)可能經(jīng)歷的所有狀態(tài)及其發(fā)生的概率分布。這一過程強調(diào)事件演化的不確定性,并通過情景演化數(shù)據(jù)揭示社會系統(tǒng)演化的隨機性與不確定性。

(2)干預分析(聯(lián)系前因與后果):干預分析以隨機對照實驗為手段,通過比較不同“假設”場景中系統(tǒng)演化軌跡的差異,觀察原因變量的改變?nèi)绾我鸾Y果變量的變化,從而挖掘出變量之間穩(wěn)健的結構因果模型。干預分析主要包括如下要素:① 實驗組/對照組:某個場景采取干預措施A;對照場景不采取干預措施A;然后觀察兩個場景演化結果的差別,是否因為做了A而出現(xiàn)B。② 樣本一致性:實驗場景和對照場景的設置完全一樣,證明是干預措施造成了結果的差異,而不是其他因素。③ 隨機抽樣/隨機分組:實驗場景的初始參數(shù)設定可以在參數(shù)取值范圍內(nèi)隨機抽取。通過對照組和實驗組平行運行,最后可以采用平均實驗效果(ATE)來量化干預措施對系統(tǒng)的影響。

(3)機制分析(聯(lián)系微觀與宏觀):這一層次不僅關注客觀世界模型,還重點分析Agent的主觀世界模型。其中Y表示所要解釋的社會現(xiàn)象,X表示若干個主體,主體具有不同的屬性,rule表示Agent的世界模型(World Model),揭示Agent在決策、博弈或行動時的內(nèi)在認知結構及其思維路徑。機制分析認為,Agent采取的行動和Agent的互動是宏觀現(xiàn)象產(chǎn)生的原因,而機制性解釋給出了Agent的行動和互動是如何“一步一步”導致特定現(xiàn)象產(chǎn)生。Agent內(nèi)部的世界模型類似于“打開黑盒,變成白盒”的過程,通過分析主體行為軌跡與思維鏈條,來理解微觀層面上的個體如何導致宏觀層面上的涌現(xiàn)現(xiàn)象。這里,LLM是一種非常強大的工具,能夠幫助獲取Agent的推理邏輯與行為意圖。

5. 案例研究

隨著移動互聯(lián)網(wǎng)和共享經(jīng)濟的發(fā)展,O2O (Online to Offline) 服務生態(tài)系統(tǒng)成為一種新型服務要素集成模式,使得“數(shù)字控制下的勞動秩序”成為可能,雖然極大地提升了勞動效率,但是也催生出了一系列社會問題,本案例計劃采用“治理策略+計算實驗”方法,對于互聯(lián)網(wǎng)O2O服務生態(tài)進行研究,挖掘“平臺經(jīng)濟”背后的運行規(guī)律,并探索如何設計有效的治理策略來兼顧效率與公平。

1. 實驗場景與建模

基于博弈調(diào)控思路,我們構建了一種基于雙層學習演化框架的實驗系統(tǒng)。其具體結構如圖7所示,雙層學習演化框架包括 “內(nèi)部”循環(huán)和“外部”循環(huán)。Policy Agent表示平臺模塊,可以根據(jù)系統(tǒng)指標不斷調(diào)整策略以優(yōu)化系統(tǒng)效能,既要兼顧個體利益,同時又要保證系統(tǒng)平穩(wěn)發(fā)展;實驗系統(tǒng)中的Worker Agent則表示騎手主體,具有主觀能動性,可以通過學習來調(diào)整自身行為以最大化個體效能。在平臺算法和實驗系統(tǒng)之間有一個雙層學習演化的循環(huán)反饋過程:在當前治理策略影響下,Worker Agent經(jīng)過學習演化會影響系統(tǒng)效能指標;Policy Agent根據(jù)指標變化來學習調(diào)整治理策略,進而影響Worker Agent的認知與行為;最終,經(jīng)過反復迭代循環(huán),達到一種動態(tài)平衡狀態(tài)。


圖7:基于雙層學習演化的治理策略調(diào)優(yōu)框架

表2給出了具體配送場景與計算實驗系統(tǒng)的映射關系。


表2:現(xiàn)實世界與計算實驗系統(tǒng)之間的映射關系

2. 實驗目標與設置

本研究旨在探討O2O實驗平臺中騎手Agent的內(nèi)卷現(xiàn)象,實驗目標有三個:① RQ1:能否觀察發(fā)現(xiàn)系統(tǒng)中涌現(xiàn)的現(xiàn)象?② RQ2:能否干預系統(tǒng)涌現(xiàn)的影響因素?③ RQ3:能否分析涌現(xiàn)出現(xiàn)的根本原因以解釋社會模擬中的涌現(xiàn)機制?

所有實驗中的LLM均使用本地部署的 DeepSeek-R1-Distill-Qwen-32B-FP8-Dynamic 模型完成,并且溫度參數(shù)設置為 0 以確保實驗的可重復性。在實驗環(huán)境中,我們構建了一個包含五種Agent類型的多Agent系統(tǒng):商家、送貨員、客戶、政府和平臺。我們?yōu)楸狙芯吭O立了100名騎手Agent。物理環(huán)境是一個基于網(wǎng)格的地圖,模擬一個有10個商業(yè)區(qū)的虛擬城市。騎手Agent的獎勵功能旨在平衡多個目標,包括最小化工作時間,最大化完成訂單的數(shù)量,以及降低勞動力成本。這些目標的權重也有所不同,以反映不同的決策優(yōu)先事項。騎手Agent通過大型語言模型(LLMs)擁有智能,允許它們自主學習和決策。這些決策包括選擇商業(yè)區(qū)、挑選訂單和執(zhí)行隨機游走策略。在模擬過程中,這10個Agent不斷地與環(huán)境交互。模擬運行時長3600步,這代表著一個月的周期。

為確保實驗的真實性和有效性,實驗將來自Zomato平臺的真實世界數(shù)據(jù)(包含多個城市的外賣訂單數(shù)據(jù)),對跨多個城市的外賣訂單進行了模擬系統(tǒng)的基準測試。關鍵比較指標包括騎手每日的平均有效工作時長,以及工作時長與訂單量之間的關系。圖7-10(b) 比較了真實數(shù)據(jù)集和系統(tǒng)模擬中騎手的每日平均有效工作時長,即配送訂單所花費的時間,不包括等待等活動的時間。結果顯示,模擬得到的平均工作時長為 4.05 小時,與真實觀測值 4.02 小時高度一致,平均絕對誤差(MAE)為 0.05 小時,均方根誤差(RMSE)為 0.06 小時,均表明偏差極小。此外,皮爾遜相關系數(shù) r = 0.98 顯示模擬值與實際值之間具有很強的線性相關性。這些結果共同表明,所提出的模型在重現(xiàn)真實世界工作時長分布方面具有準確性和可靠性。圖7-10(c) 展示了騎手Agent的工作時長與接單總數(shù)之間的關系,一般工作時長越長,接到的訂單就越多。灰色的點代表 1320 名真實騎手的數(shù)據(jù),而橙色的點則對應模擬中的100 個騎手Agent的數(shù)據(jù)。模擬數(shù)據(jù)與真實數(shù)據(jù)之間的高度相似性驗證了該實驗設置的準確性和可靠性。


圖8:計算實驗系統(tǒng)與現(xiàn)實世界的數(shù)據(jù)集的比較

2. 實驗目標與設置

實驗分析共包含三個層次:① 觀察分析,基于內(nèi)卷指數(shù)識別潛在的內(nèi)卷現(xiàn)象,并對騎手Agent在30天內(nèi)的行為軌跡進行分析;②干預分析,實施三種平臺調(diào)控策略:智能水平調(diào)節(jié)、交互模式優(yōu)化以及訂單數(shù)量控制;③ 機制分析,分析Agent意圖與行為之間的內(nèi)在聯(lián)系,深入闡釋系統(tǒng)涌現(xiàn)現(xiàn)象。

觀察分析(RQ1):

本研究采納了重復實驗方法,為了排除偶然因素的干擾,在相同的參數(shù)條件下進行了十次實驗。如圖9所示,圖9(a)表示內(nèi)卷水平的實驗分布,在模擬的高度競爭環(huán)境下,有75%的實驗結果顯示出高度內(nèi)卷狀態(tài),表明內(nèi)卷效應的高度一致性;圖9(b)展示各實驗類型的內(nèi)卷程度隨時間的變化,不同類型的實驗均表現(xiàn)出內(nèi)卷程度隨時間推移而上升,并最終趨于平穩(wěn);同時,一次實驗結果表現(xiàn)出低度內(nèi)卷,差異較大,該例外可歸因于三類偶然擾動:初始騎手空間分布的臨時最優(yōu)、路徑規(guī)劃算法中偽隨機擾動導致的臨時最優(yōu)路徑生成,以及訂單被分配至低密度區(qū)域所致的競爭減少。


圖9:實驗內(nèi)卷程度分析

如圖10所示,針對高內(nèi)卷程度的實驗,分析了騎手Agent的活動范圍隨時間的變化情況。圖中顏色深淺表示騎手的分布狀況,騎手Agent由隨機分布逐步演化為向商店、用戶等位置聚集。這一過程反映了騎手的內(nèi)卷現(xiàn)象。


圖10:騎手 Agent 活動范圍的熱力圖

干預分析(RQ2):

針對內(nèi)卷現(xiàn)象,這個階段構建并開展了三個因素干預實驗,旨在揭示其內(nèi)在作用機制。實驗主要圍繞三個核心變量對內(nèi)卷現(xiàn)象的影響路徑展開探討,包括智能水平調(diào)節(jié)(因素A)、交互方式轉(zhuǎn)變(因素B)以及訂單數(shù)量變動(因素C)。

實驗結果如圖 11(a) 所示的箱型圖可視化分析,在“智能水平調(diào)節(jié)”維度上,高、中、低智能組在內(nèi)卷程度方面未表現(xiàn)出顯著的統(tǒng)計差異,其對應的內(nèi)卷指數(shù)均處于高度內(nèi)卷區(qū)間(68.87–72.09)。這一結果表明,在當前實驗設定下,智能水平的提升對緩解系統(tǒng)內(nèi)卷效應的作用較為有限。如圖11(b) 所示,“交互方式”(因素B)所引發(fā)的系統(tǒng)行為表現(xiàn)出明顯的異質(zhì)性特征。引入新型交互機制后,實驗組在不同交互強度下的內(nèi)卷程度顯著上升,從70.42增加至84.79,表明交互程度的提升在某種程度上加劇了系統(tǒng)內(nèi)卷。如圖11(c) 所示,訂單數(shù)量的變化(因素C)亦對內(nèi)卷程度產(chǎn)生顯著影響。隨著訂單數(shù)量的持續(xù)增加,內(nèi)卷指數(shù)由80.32逐步下降至24.76,實現(xiàn)了從高度內(nèi)卷向低度內(nèi)卷的轉(zhuǎn)變,進一步驗證了資源充足性(即訂單量)在系統(tǒng)有序運行與內(nèi)卷緩解中的關鍵調(diào)節(jié)作用。進一步分析影響因素與內(nèi)卷程度的變化,如圖11(d)所示,最終通過線性相關計算的結構方程模型揭示了交互方式變化和訂單量是影響實驗結果的兩個最關鍵因素,其標準化路徑系數(shù)分別為 0.45 和 0.50。


圖11:干預分析的結果

機制分析(RQ3):

通過對騎手Agent意圖序列的聚類分析(如圖12(a-c)所示),實驗識別出多個具有代表性的意圖類型,且隨時間演化,聚類結構由初始的單一形態(tài)逐步演化為多樣化的多簇分布。進一步,對系統(tǒng)時序演化過程中進行的相關性分析表明,在對內(nèi)卷現(xiàn)象產(chǎn)生影響方面,行為和意圖之間存在著相關性。如圖12(d-f)所示:商區(qū)更換、接單等因素對于風險規(guī)避、焦慮等意圖的影響更大(相關性更高),同時隨著時間變化逐漸加大。如圖7-13紅色框選區(qū)域所示,這兩類意圖亦與“商區(qū)選擇”和“工時延長”等典型內(nèi)卷行為高度相關,尤其是風險規(guī)避意圖,在區(qū)域選擇與工作時長方面的相關系數(shù)分別達到0.40和0.45,進一步表明個體意圖在內(nèi)卷行為形成中的關鍵作用。

如圖12(g) 所示,采用基于?;鶊D的流動可視化方法對細粒度的行為轉(zhuǎn)變進行了追蹤。在為期30天的觀察窗口中,騎手Agent的決策意圖經(jīng)歷了三個階段:最初為遵循規(guī)則階段,約在第15天出現(xiàn)以焦慮驅(qū)動的行為上升(占比提升至 24%),最終則以風險規(guī)避決策為主導(達 64%)。與此相對應,行為模式從“以休息為主”轉(zhuǎn)變?yōu)椤胺e極搶單”,最終趨于“風險規(guī)避”模式。

為揭示這些模式背后的關鍵機制,評估了三種干預情境。在“增強交互”情境下(圖12(h)),所有Agent趨于選擇風險規(guī)避路徑;在“提升智能”情境下(圖12(i)),風險規(guī)避意圖占比進一步上升,表明更強的認知能力強化了謹慎決策;而在“提高訂單密度”情境中(圖 12(k)),風險意識型Agent比例下降至 61%,說明更重的工作負荷降低了對風險的敏感性。這些結果表明,交互動態(tài)與環(huán)境壓力共同驅(qū)動內(nèi)卷現(xiàn)象的發(fā)展。

基于三個層次的分析,得出以下結論:① 通過觀察分析可知,O2O系統(tǒng)中Agent的效能指標逐漸呈現(xiàn)內(nèi)卷的現(xiàn)象,Agent的行為在時間推移中表現(xiàn)出日益趨同的趨勢。② 通過干預分析可知,在焦慮主導階段及時引入如訂單平衡機制等調(diào)控策略,能夠有效緩解過度競爭,提升系統(tǒng)整體性能與穩(wěn)定性。③ 通過機制分析可知,“訂單稀缺與焦慮擴散通過激發(fā)風險規(guī)避意圖,進而促使跨區(qū)搶單、延長工作時長等競爭性行為,從而驅(qū)動騎手內(nèi)卷。


圖12:干預分析的結果

6. 結語

本文的中心工作,是在“復雜性–因果性–計算實驗”之間搭建一套統(tǒng)一的方法論通道:在理論層面,將復雜性視為由智能主體博弈和適應所觸發(fā)的低概率綜合事件,用事件函數(shù)與順序因果邏輯樹刻畫“復雜性如何涌現(xiàn)”;在方法層面,通過橫向與縱向、正向與反向因果的區(qū)分,明確統(tǒng)計因果與生成性因果的分工與互補關系,并提出“ABM +實驗”的計算實驗框架,形成觀察–干預–機制三層分析結構;在技術層面,給出“想定準備–實驗設計–方案推演–溯因分析”以及“描述–解釋–預測”的計算實驗流程,強調(diào)利用人工社會持續(xù)生成數(shù)據(jù)、構建元模型與世界模型;在應用層面,通過 O2O 平臺騎手內(nèi)卷案例表明:在資源約束與平臺策略共同作用下,系統(tǒng)會自發(fā)進入“高效但高壓”的內(nèi)卷均衡;提升個體智能并不能自動緩解內(nèi)卷,而訂單總量與交互結構等宏觀條件才是關鍵調(diào)控杠桿。

整體來看,本文將復雜系統(tǒng)研究從“以相關性分析為主的統(tǒng)計描述范式”推進到“以可生成機制為基礎的因果解釋范式”,為今后在社會治理、戰(zhàn)略博弈、服務生態(tài)、災害應急、無人蜂群等應用場景中開展具備可解釋性、可干預性與可預測性的計算實驗提供了系統(tǒng)化的方法基礎。

「大模型時代下的Agent建模與仿真」讀書會

集智俱樂部聯(lián)合山東工商學院副教授高德華、天津大學教授薛霄、北京師范大學教授張江、國防科技大學博士研究生曾利共同發(fā)起。讀書會自2025年7月8日開始,每周二晚上7:30-9:30進行,現(xiàn)讀書會已結束,支持查看課程回放。掃碼加入Agent建模與仿真的前沿探索之旅,一起共學、共創(chuàng)、共建、共享「大模型時代下的Agent建模與仿真」社區(qū),共同暢想大模型時代人工社會的未來圖景!

核心問題

Agent建模與仿真是什么,核心技術發(fā)生了怎樣的演變?

大模型時代,Agent建模與仿真會給復雜系統(tǒng)理論帶來哪些突破?

大模型如何賦能Agent實現(xiàn)自主思考與動態(tài)適應?

大模型驅(qū)動的Agent交互會涌現(xiàn)出什么新型的社會現(xiàn)象?

Agent建模與仿真如何改變金融、心理、管理、軍事等領域的研究范式?

你將收獲

梳理Agent建模與仿真的歷史發(fā)展脈絡與方法論;

掌握一套理解、分析、控制、預測復雜系統(tǒng)的計算實驗框架;

掌握基于多主體強化學習的復雜系統(tǒng)優(yōu)化方法;

領略領域前沿學者的研究體系與科研路徑。

詳情請見:

1.

2.

3.

4.

5.

6.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
阿森納0-0悶平利物浦!5連勝被終結,仍6分領跑英超,三叉戟啞火

阿森納0-0悶平利物浦!5連勝被終結,仍6分領跑英超,三叉戟啞火

侃球熊弟
2026-01-09 05:25:59
勇士能用庫明加換來墨菲?ESPN曬三方交易方案:還得搭上三個首輪

勇士能用庫明加換來墨菲?ESPN曬三方交易方案:還得搭上三個首輪

羅說NBA
2026-01-08 21:30:38
不會裁掉弗格!上海男籃將其合同轉(zhuǎn)正,需要他的季后賽經(jīng)驗

不會裁掉弗格!上海男籃將其合同轉(zhuǎn)正,需要他的季后賽經(jīng)驗

籃球大陸
2026-01-09 16:24:00
下周,可能真的要來了

下周,可能真的要來了

張春林
2026-01-09 16:03:19
2026土葬新規(guī):深埋、不留墳頭、不立碑!

2026土葬新規(guī):深埋、不留墳頭、不立碑!

達文西看世界
2026-01-09 14:12:49
小楊生煎、清美要成老字號了?曾被移出的老半齋也回來了!2025年上海老字號名錄正在公示

小楊生煎、清美要成老字號了?曾被移出的老半齋也回來了!2025年上海老字號名錄正在公示

縱相新聞
2026-01-08 21:49:20
研究生教人騎車兩年賺27萬,當事人:市場需求大

研究生教人騎車兩年賺27萬,當事人:市場需求大

南國今報
2026-01-08 22:11:08
事發(fā)上海地鐵!男子弄丟5萬元婚戒,找到時戴在別人手上摘不下來……

事發(fā)上海地鐵!男子弄丟5萬元婚戒,找到時戴在別人手上摘不下來……

環(huán)球網(wǎng)資訊
2026-01-09 14:39:17
“和平意志-2026”海上聯(lián)演將在南非舉行

“和平意志-2026”海上聯(lián)演將在南非舉行

界面新聞
2026-01-09 16:38:48
67歲老人燒柴取暖被罰8000塊,法庭上哭吼:我燒柴怎么就違法了?

67歲老人燒柴取暖被罰8000塊,法庭上哭吼:我燒柴怎么就違法了?

青青會講故事
2026-01-08 15:49:23
0:0悶平伊拉克!安東尼奧一敗筆改變比賽走勢 不該冷落中場天才

0:0悶平伊拉克!安東尼奧一敗筆改變比賽走勢 不該冷落中場天才

零度眼看球
2026-01-09 11:26:16
若有一天中日開戰(zhàn),日退役少將預言三大后果,日本唯一生機曝光?

若有一天中日開戰(zhàn),日退役少將預言三大后果,日本唯一生機曝光?

比利
2025-12-26 20:59:23
老鷹拒助火箭續(xù)約18.8分新援,范喬丹用意明顯

老鷹拒助火箭續(xù)約18.8分新援,范喬丹用意明顯

嘴角上翹
2026-01-09 16:29:21
特斯拉宣布延長部分地區(qū)保修時間,五年不限公里

特斯拉宣布延長部分地區(qū)保修時間,五年不限公里

XCiOS俱樂部
2026-01-09 15:32:29
因車禍僅剩1條腿,女子9年遭數(shù)次家暴無處逃,生娃后彩禮也被要回

因車禍僅剩1條腿,女子9年遭數(shù)次家暴無處逃,生娃后彩禮也被要回

游者走天下
2026-01-08 10:24:20
梁靜茹突然關閉社交媒體賬號

梁靜茹突然關閉社交媒體賬號

大象新聞
2026-01-08 12:21:06
馮提莫瘦50斤變紙片人,自曝肚皮松成“沙皮狗”:這是減肥送的?

馮提莫瘦50斤變紙片人,自曝肚皮松成“沙皮狗”:這是減肥送的?

湘村大余
2026-01-07 16:31:08
醫(yī)學的盡頭真是玄學嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

醫(yī)學的盡頭真是玄學嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

帶你感受人間冷暖
2025-12-31 00:20:05
北京出租車亂象:外地司機成主力,公司“割韭菜”式管理何時休?

北京出租車亂象:外地司機成主力,公司“割韭菜”式管理何時休?

劉哥談體育
2026-01-09 00:44:17
英國一只長壽小貓30歲了,跟它主人同歲,從不錯過任何一頓飯!

英國一只長壽小貓30歲了,跟它主人同歲,從不錯過任何一頓飯!

貍貓之一的動物圈
2026-01-06 10:55:08
2026-01-09 18:48:49
集智俱樂部 incentive-icons
集智俱樂部
科普人工智能相關知識技能
5596文章數(shù) 4661關注度
往期回顧 全部

科技要聞

市場偏愛MiniMax:開盤漲42%,市值超700億

頭條要聞

特朗普稱美必須"擁有"整個格陵蘭 英法德迅速統(tǒng)一戰(zhàn)線

頭條要聞

特朗普稱美必須"擁有"整個格陵蘭 英法德迅速統(tǒng)一戰(zhàn)線

體育要聞

金元時代最后的外援,來中國8年了

娛樂要聞

關曉彤鹿晗風波后露面 不受影響狀態(tài)佳

財經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

助跑三年的奇瑞 接下來是加速還是起跳?

態(tài)度原創(chuàng)

數(shù)碼
家居
手機
本地
公開課

數(shù)碼要聞

RK推出大配列燈箱三模機械鍵盤K99,299元起

家居要聞

木色留白 演繹現(xiàn)代自由

手機要聞

京東“游戲愛好者每周手機銷量榜”上線 華為Mate 80位列榜首

本地新聞

云游內(nèi)蒙|“包”你再來?一座在硬核里釀出詩意的城

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版