国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI打廣告后,如何成為爆款?CMU提出AutoGEO解密流量密碼

0
分享至



AI 搜索引擎正逐漸取代傳統(tǒng)搜索入口,「問 AI」已經(jīng)成為日常習(xí)慣。隨著 OpenAI 宣布在 ChatGPT 中引入商業(yè)推薦,搜索與內(nèi)容分發(fā)的邊界正在被重新定義。在這樣的環(huán)境下,你的內(nèi)容能否在 AI 搜索中成為「爆款」,不再只取決于標題和流量,而是更大程度取決于 AI 本身的引用偏好。

你不只是和其他網(wǎng)頁爭排名,而是在爭奪被AI「采納進答案」的份額。被引用的網(wǎng)頁未必最權(quán)威、也未必最早發(fā)布,它往往只是有更「適合被拼進回答」的寫法。

卡內(nèi)基梅隆大學(xué)的研究團隊發(fā)表在 ICLR 2026 的這篇論文把這種新流量密碼解碼得很直白。

論文、代碼、模型參數(shù)、試用 Demo 見

Github。



  • 論文標題:What Generative Search Engines Like and How to Optimize Web Content Cooperatively
  • https://github.com/cxcscmu/AutoGEO
  • Github:

01 GEO:從 ranking 變成

「visibility in answers」


傳統(tǒng)搜索的基本動作是「檢索 + 排序」:給你一串鏈接,用戶自己點擊閱讀。

生成式搜索引擎(Generative Engines,GE),例如 Google AI Overview、ChatGPT,正在形成新的流量規(guī)則。這類引擎的基本動作通常是「檢索 + 綜合 + 生成」,先檢索候選文檔,再讓 LLM 把內(nèi)容整合成一段答案,順帶附上引用來源。

這帶來一個結(jié)構(gòu)性變化:內(nèi)容的曝光不再等于「排第幾」,而是等于在答案中被寫進多少、寫在多靠前的位置、以怎樣的方式被引用。也因此,過去那種「寫得更 SEO」未必等于「更容易被生成式引擎吸收」。

于是出現(xiàn)了Generative Engine Optimization(GEO),優(yōu)化網(wǎng)頁內(nèi)容以提高被 AI「采納進答案」的份額。但現(xiàn)有的 GEO 多靠人工啟發(fā),比如加統(tǒng)計、關(guān)鍵詞策略、強調(diào)流暢等,依靠直覺和經(jīng)驗。

更麻煩的是:如果你為了被引用而改寫,可能會傷害生成式引擎輸出的可靠性與效用。這就是論文不斷強調(diào)的「合作式(Cooperative)」立場:優(yōu)化可見性,不能以犧牲引擎效用為代價。

02 AutoGEO:用最大反差樣本,

把偏好從玄學(xué)變成規(guī)則集


這篇論文的核心貢獻是提出 AutoGEO:先從大量「可見性有差異」的對比證據(jù)里,自動抽取生成式引擎偏好規(guī)則;再用這些規(guī)則去改寫網(wǎng)頁,并且把對引擎效用(Generative engine utility,GEU)的影響納入評估。他們還訓(xùn)練出一個小模型 AutoGEO Mini,推理成本只有 API 方案的 ~0.0071x。



AutoGEO:規(guī)則發(fā)現(xiàn) -> 規(guī)則驅(qū)動改寫(API / 小模型)的整體框架。

AutoGEO 的第一步不是改寫網(wǎng)頁,而是學(xué)習(xí)「口味」。作者把生成式引擎抽象為:對每個 query,引擎檢索候選網(wǎng)頁集合,再用 LLM 生成答案。隨后計算每個候選網(wǎng)頁在答案中的可見性分數(shù)。可見性分數(shù)沿用 GEO 系列客觀指標衡量:不僅看引用字數(shù)(Word),還看引用位置權(quán)重(Pos),以及綜合指標(Overall)。

關(guān)鍵設(shè)計在于「證據(jù)選擇」:對每個 query,他們不做平均對比,而是挑一對可見性差距最大的網(wǎng)頁。使用這樣一對一個被大量吸收、一個幾乎沒被用的文檔,也就最容易看出偏好差異的「判別特征」。

接下來是四段式 LLM 處理步驟,把海量對比樣本壓縮成可執(zhí)行規(guī)則:

  • Explainer:對比兩篇文檔與最終答案,生成自然語言解釋(它們哪里不同、為何可能導(dǎo)致引用差異)。
  • Extractor:把解釋提煉成結(jié)構(gòu)化 insights(偏好因素的要點化表達)。
  • Merger:把成千上萬條 insights 合并成候選規(guī)則。為了可擴展性,論文設(shè)計了 Hierarchical merging,解決「上萬樣本 -> 穩(wěn)定規(guī)則」的合并瓶頸。
  • Filter:過濾掉噪聲、歧義與不穩(wěn)定規(guī)則,得到最終規(guī)則集。


03 怎么用:

即插即用與超低成本可部署


AutoGEO 的第二步才是改寫:讓網(wǎng)頁更符合規(guī)則,從而更可能被生成式引擎引用。

路線 A:AutoGEO API(Prompt-based,即插即用)

把規(guī)則集直接嵌入 prompt 的「Quality Guidelines」,調(diào)用強 LLM API 如 Gemini、GPT 完成重寫。優(yōu)點是無需訓(xùn)練、部署快;缺點是成本和吞吐受 API 限制。



路線 B:AutoGEO Mini(RL-based 小模型,超低成本可部署)

作者微調(diào)小模型做同樣的改寫,并用強化學(xué)習(xí)把「可見性提升」與「合作式約束」綁定在一起。

  • Cold start:先用 AutoGEO API 做 Teacher 生成改寫數(shù)據(jù),對小模型做 SFT,避免 RL 初期發(fā)散。

  • GRPO 強化學(xué)習(xí):同一文檔采樣一組候選改寫,按獎勵學(xué)習(xí)。獎勵由三部分組成:Outcome reward(改寫是否提升可見性)、Rule reward(是否滿足抽取到的規(guī)則)以及Semantic reward(語義是否忠實原文)。

04 怎么評估「有效且不作惡」


這篇論文的評估不只刷可見性指標,還顯式評估引擎效用(Utility)是否被破壞。論文實驗涵蓋三個數(shù)據(jù)集GEO-Bench、Researchy-GEO、E-commerce,分別測試 AutoGEO 在不同領(lǐng)域、不同意圖環(huán)境中的性能。

同時,實驗考慮基于多種前沿 LLM的 generative engine,包含 Gemini、GPT、Claude。

實驗指標主要分兩類:

  • GEO:度量網(wǎng)頁在答案中的可見性,沿用 GEO 的三類指標 Word / Pos / Overall;

  • GEU:衡量合作程度,也即答案質(zhì)量,度量生成式引擎答案與真實答案的相關(guān)性、忠實性與質(zhì)量。

實驗結(jié)果表明,AutoGEO API 與 AutoGEO Mini 在多個設(shè)置下顯著提升可見性指標,尤其 AutoGEO API 的提升幅度很大,比最強的基線模型高 50.99%。



三大數(shù)據(jù)集上的總體對比:AutoGEO API / AutoGEO Mini 顯著優(yōu)于基線。

論文把合作式的承諾落在 GEU 指標上:在大幅提升 GEO 指標的同時,GEU 多數(shù)情況下與 Vanilla 接近。

這點很關(guān)鍵:GEO 如果只看「我被引用了多少」,會不可避免把互聯(lián)網(wǎng)推向噪聲與操縱;但如果把 GEU 納入硬指標,至少為「優(yōu)化的邊界」提供了可討論的標準。



不同引擎下,可見性(GEO)與效用(GEU)并列對比。

05 發(fā)現(xiàn):規(guī)則并不通用


規(guī)則既有共識,也有碎片化風險。

如下圖 (a),論文顯示不同 LLM 引擎之間偏好規(guī)則重疊度不低,說明存在「通用型好寫法」;但仍有 engine-specific 的獨特規(guī)則。更劇烈的是圖 (b) domain shift:從開放域數(shù)據(jù)集遷移到電商意圖,規(guī)則重疊顯著下降;并且電商更偏好 actionable guidance(可操作步驟、建議),研究類更偏好 in-depth explanation(機制、原因、背景的解釋深度)。



不同領(lǐng)域 / 任務(wù)下的共通規(guī)則與獨特規(guī)則示例:一套寫法可能跨域失靈。

這對內(nèi)容生態(tài)是一個直接的信號:未來可能出現(xiàn)「同一頁面多版本」,分別迎合不同引擎,甚至按領(lǐng)域意圖維護不同寫作模板。

06 小結(jié)


AutoGEO 給內(nèi)容方打開了一扇門:偏好可以被抽取、規(guī)則可以被更新、改寫可以被訓(xùn)練、成本可以被壓到極低。

生成式搜索時代的一個新現(xiàn)實是:你寫給人看的網(wǎng)頁,可能首先要通過「答案機器的消化系統(tǒng)」。下一步怎么走,決定互聯(lián)網(wǎng)會更透明,還是更像一場模型與模型之間的軍備競賽。接下來真正的競爭不僅在內(nèi)容方,也在引擎與生態(tài)治理:

  • 當大量網(wǎng)頁開始「為引用而寫」,引擎還能否區(qū)分「更有信息量」與「更像會被引用的信息」?

  • 如果平臺開始頻繁更新偏好以對抗被規(guī)?;?,是否會出現(xiàn)一場持續(xù)的「規(guī)則 - 反規(guī)則」軍備競賽?

AutoGEO 把 GEO 從玄學(xué)推進到工程,也把生成式搜索的下一輪博弈,提前公開了。

作者簡介


本文作者來自于卡內(nèi)基梅隆大學(xué)計算機學(xué)院語言技術(shù)研究所 CX Research Group,指導(dǎo)老師是 Chenyan Xiong 教授。組內(nèi)研究聚焦于語言模型,主要包括基礎(chǔ)模型訓(xùn)練,與深度研究、RAG 有關(guān)的信息檢索和生成,以及語言模型的應(yīng)用。團隊主頁:https://www.cs.cmu.edu/~cxcscmu/。歡迎大家關(guān)注我們團隊的最新研究成果!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
女子實名舉報某團外賣:不上大額券就讓我變成“凌晨營業(yè)”,你們真黑!

女子實名舉報某團外賣:不上大額券就讓我變成“凌晨營業(yè)”,你們真黑!

回旋鏢
2026-03-06 21:13:59
感謝勇士!80分啊!庫明加,這次真爆了

感謝勇士!80分??!庫明加,這次真爆了

體育新角度
2026-03-07 17:08:12
可以基本確定,伊朗已經(jīng)贏了

可以基本確定,伊朗已經(jīng)贏了

大樹鄉(xiāng)談
2026-03-06 23:32:06
迪拜機場重新開放 國航北京-迪拜航班安全到達

迪拜機場重新開放 國航北京-迪拜航班安全到達

財聯(lián)社
2026-03-07 17:43:08
墻倒眾人推!多人再錘張杰出軌,拿謝娜當跳板,薛之謙才是大贏家

墻倒眾人推!多人再錘張杰出軌,拿謝娜當跳板,薛之謙才是大贏家

離離言幾許
2026-03-05 12:33:31
重力炸彈即將大規(guī)模上場,波斯面臨更大的壓力

重力炸彈即將大規(guī)模上場,波斯面臨更大的壓力

高博新視野
2026-03-06 17:49:29
假消息看多了,大腦真的會廢掉——

假消息看多了,大腦真的會廢掉——

心理提升課堂
2026-03-07 09:36:17
今早,黿頭渚擠爆了!

今早,黿頭渚擠爆了!

江南晚報
2026-03-07 12:49:09
哭窮風波僅2天,前夫赫子銘接連爆料,沒給何潔留一絲“體面”

哭窮風波僅2天,前夫赫子銘接連爆料,沒給何潔留一絲“體面”

汪鏞的創(chuàng)業(yè)之路
2026-03-07 12:46:04
伊朗總統(tǒng)向鄰國致歉:不再攻擊鄰國

伊朗總統(tǒng)向鄰國致歉:不再攻擊鄰國

每日經(jīng)濟新聞
2026-03-07 16:12:23
邁阿密國際訪白宮引爭議,主帥:以為只討論足球

邁阿密國際訪白宮引爭議,主帥:以為只討論足球

體壇周報
2026-03-07 14:44:11
鐵礦到了!儲量44億噸大礦直運中國,澳大利亞為何開始緊張?

鐵礦到了!儲量44億噸大礦直運中國,澳大利亞為何開始緊張?

胖福的小木屋
2026-03-06 16:39:08
俄羅斯被曝向伊朗提供情報,包括美軍艦船和飛機的定位,白宮回應(yīng)!美國準備部署第三艘航母,緊急批準對以色列超1.5億美元軍售

俄羅斯被曝向伊朗提供情報,包括美軍艦船和飛機的定位,白宮回應(yīng)!美國準備部署第三艘航母,緊急批準對以色列超1.5億美元軍售

每日經(jīng)濟新聞
2026-03-07 13:18:09
周濤衣領(lǐng)都開到這了誰還頂?shù)淖?>
    </a>
        <h3>
      <a href=草莓解說體育
2026-03-07 15:19:23
文旅部部長:有外國游客購買40箱中國貨離境退稅,被航司罰款后發(fā)現(xiàn)還是劃算,手機無人機已成“中國特產(chǎn)”

文旅部部長:有外國游客購買40箱中國貨離境退稅,被航司罰款后發(fā)現(xiàn)還是劃算,手機無人機已成“中國特產(chǎn)”

極目新聞
2026-03-07 12:57:58
一份“煮熟的三文魚”火了,原來低認知的家長,真能搞出人命!

一份“煮熟的三文魚”火了,原來低認知的家長,真能搞出人命!

妍妍教育日記
2026-03-07 08:45:06
寧夏大學(xué)教授:為什么哈梅內(nèi)伊不慌張?

寧夏大學(xué)教授:為什么哈梅內(nèi)伊不慌張?

必記本
2026-03-06 18:21:35
項立剛質(zhì)問莫言不為伊朗兒童說話,項立剛為中國患兒捐款了嗎?

項立剛質(zhì)問莫言不為伊朗兒童說話,項立剛為中國患兒捐款了嗎?

書寫者
2026-03-06 19:33:38
1230人遇難!美國5天燒200億,終于承認:伊朗無人機真攔不住

1230人遇難!美國5天燒200億,終于承認:伊朗無人機真攔不住

近史博覽
2026-03-07 01:20:35
對伊朗而言,勝利的定義不是打贏,而是“活下去”并持續(xù)消耗美國

對伊朗而言,勝利的定義不是打贏,而是“活下去”并持續(xù)消耗美國

識局Insight
2026-03-06 20:34:56
2026-03-07 17:55:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12430文章數(shù) 142578關(guān)注度
往期回顧 全部

科技要聞

OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

頭條要聞

中國貨船"鐵娘子"號通過霍爾木茲海峽 大量船舶仍滯留

頭條要聞

中國貨船"鐵娘子"號通過霍爾木茲海峽 大量船舶仍滯留

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

周杰倫田馥甄的“JH戀” 被扒得底朝天

財經(jīng)要聞

針對"不敢休、不讓休"怪圈 國家出手了

汽車要聞

逃離ICU,上汽通用“止血”企穩(wěn)

態(tài)度原創(chuàng)

藝術(shù)
旅游
健康
公開課
軍事航空

藝術(shù)要聞

《圣教序》真跡終于找到!1903字清晰無損

旅游要聞

哈尼梯田水滿田疇 游客盡享“天空之鏡”

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美第三個航母打擊群據(jù)稱準備部署至中東

無障礙瀏覽 進入關(guān)懷版