国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

句子級溯源+生成式歸因,C2-Cite重塑大模型可信度

0
分享至



在人工智能快速發(fā)展的今天,大語言模型已經(jīng)深入到我們工作和生活的方方面面。然而,如何讓AI生成的內(nèi)容更加可信、可追溯,一直是學(xué)術(shù)界和工業(yè)界關(guān)注的焦點(diǎn)問題。想象一下,當(dāng)你向ChatGPT提問時,它不僅給出答案,還能像學(xué)術(shù)論文一樣標(biāo)注每句話的信息來源——這就是"溯源大語言模型"要解決的核心問題。

北郵百家AI團(tuán)隊(duì)聯(lián)合小米大模型團(tuán)隊(duì)提出的溯源大模型C2-Cite,首創(chuàng)上下文感知的歸因生成技術(shù),不僅能讓大模型在生成內(nèi)容時自動標(biāo)注精準(zhǔn)的信息來源,更能確保生成內(nèi)容與引用的外部知識高度語義對齊,實(shí)現(xiàn)每一處表述都有溯源依據(jù)、與參考來源深度協(xié)同,從根本上解決大模型生成內(nèi)容的可信度問題。該工作已被國際頂級會議WSDM 2026收錄。C2-Cite針對現(xiàn)有歸因模型存在的關(guān)鍵缺陷,通過引入"上下文感知"機(jī)制,讓引用標(biāo)記從被動的占位符轉(zhuǎn)變?yōu)閹в猩舷挛恼Z義的特殊令牌,顯著提升了引用質(zhì)量和模型回答準(zhǔn)確性。



  • 論文標(biāo)題:

C2-Cite:Contextual-Aware Citation Generation for Attributed Large Language Models

  • 論文鏈接:

https://github.com/BAI-LAB/c2cite/blob/main/paper_wsdm_c2cite.pdf

  • 代碼倉庫:

https://github.com/BAI-LAB/c2cite

引言

在信息爆炸的時代,大語言模型雖然能夠生成流暢的文本,但"幻覺"問題(即生成虛假或不準(zhǔn)確的內(nèi)容)始終困擾著研究者。為了增強(qiáng)模型輸出的可信度,研究人員提出了歸因技術(shù)——在生成內(nèi)容中添加明確的引用標(biāo)記(如[1]、[2]),將每句話鏈接到具體的信息源。然而現(xiàn)有歸因模型存在顯著缺陷:

1.技術(shù)路徑存在固有局限:上下文學(xué)習(xí)歸因(P-ICL/I-ICL)依賴提示工程或迭代檢索,耗時且泛化性弱;指令微調(diào)歸因過度依賴高質(zhì)量訓(xùn)練數(shù)據(jù),缺乏對引用上下文的主動關(guān)聯(lián),大大削弱大模型的溯源能力;事后歸因(Post-Hoc)采用兩階段處理,難以精確到句子級別,缺乏內(nèi)在歸因能力。

2.引用標(biāo)記淪為“通用占位符”:現(xiàn)有模型未賦予引用標(biāo)記(如 [i])上下文語義,僅將其視為無意義符號,導(dǎo)致引用與所指內(nèi)容脫節(jié)、知識整合效果差;

3.引用質(zhì)量與回答準(zhǔn)確性失衡:部分模型雖能提升引用精準(zhǔn)度,但會破壞回答的語義連貫性和正確性;另一部分模型則因引用混亂,難以支撐回答可信度;

這些問題導(dǎo)致現(xiàn)有模型要么引用錯誤/ 虛構(gòu)、溯源失效,要么回答邏輯斷裂、準(zhǔn)確性下滑,難以同時滿足 “引用可信” 與 “回答有效” 的核心需求。

C2-Cite溯源機(jī)制

為解決上述缺陷,北郵百家AI團(tuán)隊(duì)聯(lián)合小米提出上下文感知的溯源大模型框架(C2-Cite),核心思路是通過“上下文語義融入” 讓引用標(biāo)記從被動占位符轉(zhuǎn)變?yōu)閹в忻鞔_語義指向的主動知識指針,具體包含三大關(guān)鍵組件:

1.上下文感知嵌入機(jī)制(Contextual-Aware Embedding):將多令牌引用標(biāo)記(如“[i]”)標(biāo)準(zhǔn)化為單一引用符號令牌(如“?>”),并通過均值池化計算對應(yīng)檢索文檔的語義嵌入,替換傳統(tǒng)無意義占位符嵌入,使引用標(biāo)記攜帶所指文檔的語義信息;

2.上下文引用對齊機(jī)制Contextual Citation Alignment:引入引用路由器(二進(jìn)制分類器)區(qū)分默認(rèn)令牌與引用令牌,分別優(yōu)化兩類令牌的損失函數(shù)—— 默認(rèn)令牌采用交叉熵?fù)p失保證回答流暢性,引用令牌通過語義相似度匹配實(shí)現(xiàn)與檢索文檔的精準(zhǔn)對齊;

3.上下文注意力增強(qiáng)機(jī)制:通過距離衰減系數(shù)和注意力約束,放大后續(xù)生成令牌對先前引用令牌的關(guān)注度,維持引用與內(nèi)容的語義連貫性,避免因引用插入導(dǎo)致回答邏輯斷裂。

模型最終損失函數(shù)為默認(rèn)損失、引用對齊損失、路由器損失與注意力增強(qiáng)損失的加權(quán)和,確保引用質(zhì)量與回答準(zhǔn)確性的協(xié)同優(yōu)化。



實(shí)驗(yàn)

研究團(tuán)隊(duì)在ALCE基準(zhǔn)測試的三個數(shù)據(jù)集(ASQA、ELI5、QAMPARI)上進(jìn)行了全面評估,對比了多種主流歸因方法

3.1 主實(shí)驗(yàn)結(jié)果



實(shí)驗(yàn)結(jié)果令人振奮:

  • 引用質(zhì)量大幅提升:C2-Cite++在引用F1分?jǐn)?shù)上平均提升5.8%
  • 回答準(zhǔn)確性顯著增強(qiáng):在回答正確性指標(biāo)上平均提升17.4%
  • 泛化能力強(qiáng):在不同質(zhì)量的訓(xùn)練數(shù)據(jù)(SynSciQA 系列)上均表現(xiàn)穩(wěn)定,即使使用普通訓(xùn)練數(shù)據(jù)也能超越依賴高質(zhì)量數(shù)據(jù)的傳統(tǒng)微調(diào)模型。

3.2 效率分析

在保證效果的同時,C2-Cite++還展現(xiàn)出卓越的計算效率。吞吐量(每秒處理樣本數(shù))測試顯示,相比需要多輪迭代的方法(如Blueprint),C2-Cite++實(shí)現(xiàn)了最高的處理速度,在實(shí)際應(yīng)用中具有明顯優(yōu)勢。



3.3溯源生成模型中注意力模式的轉(zhuǎn)變

注意力熱力圖可視化,直觀展示了C2-Cite的工作機(jī)制。在原生LLM中,引用符號前后的句子幾乎沒有交互;而在C2-Cite中,后續(xù)句子對前文的注意力顯著增強(qiáng),形成了緊密的語義連接。這種"跨引用的語義橋梁"正是模型生成高質(zhì)量溯源內(nèi)容的關(guān)鍵。



總結(jié)

C2-Cite框架通過"上下文感知"這一核心理念,成功解決了現(xiàn)有歸因大語言模型的關(guān)鍵痛點(diǎn):

  • 從符號到語義:將引用標(biāo)記從被動占位符轉(zhuǎn)化為主動知識指針
  • 精準(zhǔn)對齊:通過路由機(jī)制確保引用編號與文檔內(nèi)容的準(zhǔn)確匹配
  • 語義連貫:利用注意力增強(qiáng)保持引用前后內(nèi)容的流暢性
  • 雙重優(yōu)化:同時提升引用質(zhì)量和回答準(zhǔn)確性,而非顧此失彼

最后,僅僅優(yōu)化訓(xùn)練數(shù)據(jù)是不夠的,大模型的溯源能力需設(shè)計有效的學(xué)習(xí)機(jī)制。相比于復(fù)雜的數(shù)據(jù)合成流程,C2-Cite通過其"上下文感知"的設(shè)計思想,在內(nèi)容生成的過程依賴可靠的引用知識庫,為構(gòu)建更加可靠、透明的AI溯源系統(tǒng)提供了重要的技術(shù)路徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
前英超裁判:加布里埃爾得感謝哈蘭德,后者順勢倒下就是紅牌

前英超裁判:加布里埃爾得感謝哈蘭德,后者順勢倒下就是紅牌

懂球帝
2026-04-20 08:00:07
世錦賽戰(zhàn)報:16強(qiáng)決出5席!中國2勝2負(fù)1領(lǐng)先,世界亞軍4-10一輪游

世錦賽戰(zhàn)報:16強(qiáng)決出5席!中國2勝2負(fù)1領(lǐng)先,世界亞軍4-10一輪游

球場沒跑道
2026-04-20 05:38:54
39歲前國腳現(xiàn)狀:定居美國踢野球,早已財富自由,有2個可愛女兒

39歲前國腳現(xiàn)狀:定居美國踢野球,早已財富自由,有2個可愛女兒

攬星河的筆記
2026-04-14 15:18:30
天安門前的華表柱,是用來干什么的?看完不禁感嘆古人的智慧

天安門前的華表柱,是用來干什么的?看完不禁感嘆古人的智慧

抽象派大師
2026-04-19 15:45:34
貝森特通告全球,將對中國二級制裁,話音剛落,中國被曝美債余額

貝森特通告全球,將對中國二級制裁,話音剛落,中國被曝美債余額

浮光驚掠影
2026-04-19 10:01:06
若沒有此人,中國歷史或?qū)⒏膶?!晚年離休后享受什么待遇?

若沒有此人,中國歷史或?qū)⒏膶?!晚年離休后享受什么待遇?

史之銘
2026-04-19 15:49:20
瑞典:國王拒絕與澤連斯基握手的說法,是“錯誤且丑陋的”。俄媒在這個問題上斷章取義!

瑞典:國王拒絕與澤連斯基握手的說法,是“錯誤且丑陋的”。俄媒在這個問題上斷章取義!

李未熟擒話2
2026-04-19 17:08:59
4月19日最新油價,國際油價大降21.8%,國內(nèi)汽柴油“顯著”下跌中

4月19日最新油價,國際油價大降21.8%,國內(nèi)汽柴油“顯著”下跌中

豬友巴巴
2026-04-19 17:30:03
斯諾克世錦賽:丁俊暉首??!土豆哥單桿70分追平,張安達(dá)優(yōu)勢縮水

斯諾克世錦賽:丁俊暉首??!土豆哥單桿70分追平,張安達(dá)優(yōu)勢縮水

劉姚堯的文字城堡
2026-04-19 18:05:31
樹倒猢猻散!武亮直播哭紅眼眶,20余天的人事動蕩,讓他心力憔悴

樹倒猢猻散!武亮直播哭紅眼眶,20余天的人事動蕩,讓他心力憔悴

火山詩話
2026-04-20 06:31:57
55歲上海炒股冠軍罕見發(fā)聲:如果本金有20W,建議死磕這五條鐵律

55歲上海炒股冠軍罕見發(fā)聲:如果本金有20W,建議死磕這五條鐵律

股經(jīng)縱橫談
2026-04-19 19:03:09
“鳥巢”要拆?花34億建成的奧運(yùn)地標(biāo),如今是賺了還是賠了?

“鳥巢”要拆?花34億建成的奧運(yùn)地標(biāo),如今是賺了還是賠了?

拳擊時空
2026-04-20 06:18:44
都說孔子周游列國,可地圖一攤開,這老爺子基本就沒出過河南省

都說孔子周游列國,可地圖一攤開,這老爺子基本就沒出過河南省

長風(fēng)文史
2026-04-18 16:39:15
“絕對good!”河南男子在美國擺攤賣磨刀器:義烏進(jìn)價1塊賣5美金,月入1萬美金

“絕對good!”河南男子在美國擺攤賣磨刀器:義烏進(jìn)價1塊賣5美金,月入1萬美金

瀟湘晨報
2026-04-19 11:48:20
黎筍長子曾坦言:越南當(dāng)年敢打中國有3個原因,結(jié)果發(fā)現(xiàn)全是錯覺

黎筍長子曾坦言:越南當(dāng)年敢打中國有3個原因,結(jié)果發(fā)現(xiàn)全是錯覺

顧史
2026-04-18 09:17:19
71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

71.5%!歷史性暴跌,以貸養(yǎng)貸的泡沫崩了

月滿大江流
2026-04-16 13:54:38
1910年,孫中山原配和三個孩子合影,容貌憔悴,命運(yùn)坎坷!

1910年,孫中山原配和三個孩子合影,容貌憔悴,命運(yùn)坎坷!

史之銘
2026-04-19 17:44:23
天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

天文學(xué)家彭羅斯:人類的死亡只是宇宙的幻象,生命是不可能終結(jié)的

心中的麥田
2026-03-06 19:27:32
25歲女孩下樓梯時低頭玩手機(jī),踩空摔倒致腰椎爆裂性骨折,術(shù)前下肢癱瘓大小便失禁:我不會這輩子就完了吧?醫(yī)生:小事引發(fā)災(zāi)難性后果

25歲女孩下樓梯時低頭玩手機(jī),踩空摔倒致腰椎爆裂性骨折,術(shù)前下肢癱瘓大小便失禁:我不會這輩子就完了吧?醫(yī)生:小事引發(fā)災(zāi)難性后果

大風(fēng)新聞
2026-04-19 10:14:13
隨著41歲C羅破門+利雅得勝利4-0,亞冠二級4強(qiáng)已誕生3席

隨著41歲C羅破門+利雅得勝利4-0,亞冠二級4強(qiáng)已誕生3席

側(cè)身凌空斬
2026-04-20 00:01:29
2026-04-20 09:08:49
機(jī)器之心Pro incentive-icons
機(jī)器之心Pro
專業(yè)的人工智能媒體
12795文章數(shù) 142632關(guān)注度
往期回顧 全部

科技要聞

藍(lán)色起源一級火箭完美回收 客戶衛(wèi)星未入軌

頭條要聞

牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發(fā)飆了

頭條要聞

牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發(fā)飆了

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

財經(jīng)要聞

月之暗面IPO迷局

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

健康
家居
房產(chǎn)
手機(jī)
時尚

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

家居要聞

法式線條 時光靜淌

房產(chǎn)要聞

官宣簽約最強(qiáng)城更!??跇鞘?,突然殺入神秘房企!

手機(jī)要聞

紅米K100系列再次曝光:BOSE揚(yáng)聲器+超強(qiáng)馬達(dá),沖高不靠風(fēng)扇!

今年最流行的衣服竟然是它?高級又氣質(zhì)!

無障礙瀏覽 進(jìn)入關(guān)懷版