国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

一個(gè)被忽視的Prompt技巧,居然是復(fù)制+粘貼。

0
分享至

前兩天,我在網(wǎng)上發(fā)現(xiàn)了一個(gè)關(guān)于很有趣Prompt技巧。

就是,通過(guò)重復(fù)輸入提示詞,可以將非推理類大模型的準(zhǔn)確率,從21.33%提高到97.33%。

這個(gè)技巧,出自Google的一篇好玩的新論文。


叫《Prompt Repetition Improves Non-Reasoning LLMs》。

翻譯過(guò)來(lái)就是:

重復(fù)你的問(wèn)題,能讓AI變得更聰明。

聽(tīng)著是不是非常抽象,其實(shí)巨簡(jiǎn)單。

比如你以前問(wèn)AI:“梵蒂岡的那個(gè)圣伯多祿大教堂門口有幾根柱子?”

現(xiàn)在,你可以改成問(wèn):“梵蒂岡的那個(gè)圣伯多祿大教堂門口有幾根柱子?梵蒂岡的那個(gè)圣伯多祿大教堂門口有幾根柱子?”

對(duì),不是我多復(fù)制了一遍,其實(shí),這個(gè)Prompt技巧,就是把問(wèn)題,重復(fù)一遍,也就是傳說(shuō)的CV大法。

Ctrl C + Ctrl V。

就這,根據(jù)Google的實(shí)驗(yàn),他就能讓AI回答正確的概率,就會(huì)有顯著的提升。

在70個(gè)不同的測(cè)試任務(wù)中,這個(gè)簡(jiǎn)單的復(fù)制粘貼大法,贏了47次,一次都沒(méi)輸過(guò)。而且性能提升是肉眼可見(jiàn)的,在某些任務(wù)上,準(zhǔn)確率甚至能從21%直接飆到97%。


真的,當(dāng)我第一次看到這個(gè)結(jié)論的時(shí)候,我的表情,是這樣的:

( ′??)?(._.`)????

這感覺(jué),就像你千辛萬(wàn)苦爬上喜馬拉雅山頂,想求見(jiàn)傳說(shuō)中的武林宗師,結(jié)果宗師摸著胡子告訴你,天下第一的武功秘籍,就五個(gè)字:“大力出奇跡”

尼瑪。

充滿了B級(jí)片的荒誕感。

但你先別急著笑。

我花了一點(diǎn)時(shí)間,把這篇看著簡(jiǎn)單的論文,以及它背后的一些原理琢磨了一下之后,我覺(jué)得,這玩意,是真的有點(diǎn)意思和道理。

先說(shuō)說(shuō)Google的這個(gè)實(shí)驗(yàn)。

他們找了七個(gè)現(xiàn)在市面上最常見(jiàn)的一線非模型,Gemini 2.0 Flash跟 Flash Lite,GPT-4o和4o-mini,Claude 3 Haiku、3.7 Sonnet,再加一個(gè)DeepSeek V3,全部用官方 API,老老實(shí)實(shí)在各種基準(zhǔn)上測(cè)了一輪。

這里需要注意一下,這種Prompt技巧,幾乎都是對(duì)非推理模型有用,DeepSeek V3就是非推理模型,DeepSeek R1就是推理模型。


當(dāng)你開(kāi)了深度思考,有這個(gè)正在思考的,有這種思維鏈的,就是推理模型。

非推理模型和推理模型有好有壞,核心區(qū)別自然就是速度和準(zhǔn)確性,推理模型很多時(shí)候速度太慢了。

比如我經(jīng)常讓GPT 5.2 Thinking幫我干個(gè)活或者搜個(gè)東西,思考一下,就是8分鐘過(guò)去了。。。


但是好處就是準(zhǔn)。

非推理模型,沒(méi)有思考,上來(lái)就是干活,速度非常快,但是相對(duì)于的,就是經(jīng)常不準(zhǔn)。

而現(xiàn)在這個(gè)復(fù)制大法,可以讓你的非推理模型在速度不變的情況下,準(zhǔn)確性飆升,所以,在很多場(chǎng)景下,還是非常有用的。

說(shuō)回實(shí)驗(yàn),他們找了7個(gè)模型測(cè)試,測(cè)的內(nèi)容也都耳熟能詳,ARC、OpenBookQA、GSM8K、MMLU-Pro、MATH等等一些常見(jiàn)的測(cè)試集,還有他們自己設(shè)計(jì)的兩個(gè)怪東西,NameIndex和MiddleMatch。

NameIndex叫姓名索引法,大概就是給模型50個(gè)名字的列表,問(wèn)它第25個(gè)是誰(shuí)。


MiddleMatch就是中間匹配法,就是給模型一個(gè)會(huì)隨機(jī)重復(fù)且包含多個(gè)名字的列表,問(wèn)他兩個(gè)字符之間的那個(gè)名字叫啥。


講道理他們?cè)O(shè)計(jì)的這兩個(gè)小測(cè)試,還是挺有趣的。

然后呢,他們就做了一件看起來(lái)特別沒(méi)有技術(shù)含量的事情。

以前我們問(wèn)模型,是這樣問(wèn)的:

<問(wèn)題>

他們變成這樣然后去對(duì)比:

<問(wèn)題> <問(wèn)題>

一模一樣,再來(lái)一遍。

中間不加解釋,不說(shuō)please,不說(shuō)think step by step,不加別的Prompt,不貼示例,就真的只是在原問(wèn)題后面連著又粘了一次。


然后成功率就暴漲,就是我們開(kāi)頭說(shuō)的數(shù)據(jù),他們自己的原話是:

“據(jù)此標(biāo)準(zhǔn),提示重復(fù)在70個(gè)基準(zhǔn)模型組合中贏得了47個(gè),0個(gè)失敗。值得 注意的是,所有測(cè)試模型的性能都得到了改善?!?/strong>

在 70 組原始提示詞 vs 復(fù)制一遍的對(duì)比里,這個(gè)土味招數(shù)贏了 47 次,平了 23 次,一次都沒(méi)輸。

非常離譜。

他們還根據(jù)這個(gè)復(fù)制粘貼大法,搞了一些衍伸Prompt技巧,比如重復(fù)三遍啥的,發(fā)現(xiàn)效果也會(huì)同樣變好。

為啥復(fù)制一遍,會(huì)有效果呢?

論文里面給了一個(gè)很工程的解釋,大概就是大模型訓(xùn)練的時(shí)候,是“因果語(yǔ)言模型”,也就是那種從左往右一個(gè)詞一個(gè)詞預(yù)測(cè)的風(fēng)格。

當(dāng)前這個(gè)token,只能看到之前的那些,沒(méi)法提前看到后面的。

所以,當(dāng)你把問(wèn)題重復(fù)一遍,比如從Q變成Q1Q2,那么Q2里的每一個(gè)字,在計(jì)算的時(shí)候,就能回頭看到Q1里的所有內(nèi)容。

等于給了AI一次“回頭看、再思考”的機(jī)會(huì)。

聽(tīng)著很難理解對(duì)吧。

我還是用大白話舉個(gè)例子。

現(xiàn)在,你給AI一個(gè)選擇題,這個(gè)選擇題可能會(huì)有點(diǎn)繞:

哪一個(gè)選項(xiàng)會(huì)改變畫(huà)面?只輸出 A 或 B

如果你現(xiàn)在是AI,你就是一個(gè)類似于在看視頻字幕的人,當(dāng)你讀到 A、B 的時(shí)候,你還不知道當(dāng)前畫(huà)面到底誰(shuí)在左誰(shuí)在右。你對(duì)A、B的第一印象就會(huì)很空,像是兩個(gè)差不多的句子。

等你讀到后面的場(chǎng)景說(shuō)明,你當(dāng)然知道答案該怎么選,但那個(gè)字幕已經(jīng)過(guò)去了,你又沒(méi)法往回拉進(jìn)度條,已經(jīng)沒(méi)法回頭重新讀一遍A、B來(lái)更新第一印象了。

那我們現(xiàn)在按照論文的做法,把整段復(fù)制一遍。

哪一個(gè)選項(xiàng)會(huì)改變畫(huà)面?只輸出 A 或 B

第二遍的A、B出現(xiàn)時(shí),其實(shí)已經(jīng)包含了第一遍的完整信息,所以模型這次讀到選項(xiàng)時(shí),腦子里的小卡片會(huì)帶著場(chǎng)景條件一起生成。

于是它在最后輸出A或B時(shí),能直接調(diào)用一份更懂題的選項(xiàng)表征,準(zhǔn)確率就更容易上去。

就很像你第一次看《流浪地球2》或者《盜夢(mèng)空間》,可能第一次很多地方?jīng)]看懂,但是當(dāng)你第二次看的時(shí)候,你一定會(huì)有更加全面、更加新的領(lǐng)悟。

這就是重復(fù)的力量。

重復(fù),其實(shí)就是給我們,給AI,多一次重來(lái)的機(jī)會(huì)。

而這種Prompt技巧,之所謂對(duì)DeepSeek R1這種推理模型沒(méi)啥用,其實(shí)原因也特別簡(jiǎn)單,很多通過(guò)RL微調(diào)出來(lái)的會(huì)推理的模型,其實(shí)已經(jīng)自己學(xué)會(huì)這個(gè)技巧了。

你讓它推理的時(shí)候,它第一反應(yīng)經(jīng)常就是先把問(wèn)題復(fù)述一遍。

你可以仔細(xì)回想一下很多模型的回答開(kāi)頭:

“題目問(wèn)的是……”

“我們需要求解的是……”

“首先我們需要理解題目給出的條件……”

本質(zhì)上,它已經(jīng)在自動(dòng)多抄一遍題目,給自己重新排了次版。


我說(shuō)實(shí)話,我讀這個(gè)小短文的時(shí)候,一直有一個(gè)特別強(qiáng)烈的感覺(jué):

我們一直以來(lái),對(duì)Prompt工程的想象,一直都太浪漫了。

總覺(jué)得好的提示詞,應(yīng)該是:

結(jié)構(gòu)清晰,層層遞進(jìn),有role、有 rule、有context、有format,有點(diǎn)像咨詢公司做的 PPT,一頁(yè)一頁(yè)講邏輯,最后拋給模型一個(gè)完美的問(wèn)題。

過(guò)去兩年,大模型相關(guān)的內(nèi)容里,Prompt也經(jīng)常被講成一種玄學(xué)。

寫(xiě)提示詞像下咒語(yǔ)一樣,要講究格式、口氣、敬語(yǔ),要學(xué)一堆咒語(yǔ)模板,甚至要背prompt手冊(cè)。

我其實(shí)一直都不太提倡,所以前段時(shí)間,還寫(xiě)了我自己的所謂的Prommpt心法:

但其實(shí)說(shuō)真的,對(duì)很多純粹的問(wèn)答場(chǎng)景,尤其是短問(wèn)題,模型壓根不需要你在提示詞上搞太多花活。

你只要安安靜靜,把題目再重復(fù)一遍,就已經(jīng)是一個(gè)極其強(qiáng)力的優(yōu)化。

Google論文里面的未來(lái)方向,也寫(xiě)了一些。

比如:把重復(fù)提示這件事,寫(xiě)進(jìn)模型的訓(xùn)練流程里,讓模型從預(yù)訓(xùn)練或者微調(diào)階段就習(xí)慣這種結(jié)構(gòu);或者只在 KV cache 里保留第二遍的提示,讓推理階段的性能完全不受影響;或者只重復(fù)提示詞的一部分,而不是整段全文;甚至還可以考慮在多模態(tài)里重復(fù),比如圖像、視頻。

我們總是希望用復(fù)雜的語(yǔ)言解決問(wèn)題,結(jié)果發(fā)現(xiàn),有時(shí)候最有效的是那句順嘴又重復(fù)的話。

這件事其實(shí)跟很多我們熟悉的領(lǐng)域一樣。

人類社會(huì)其實(shí)一直在用復(fù)制粘貼這個(gè)技能,只不過(guò)給它起了很多體面的名字:

復(fù)述、強(qiáng)調(diào)、排比、朗誦、詠唱、抄經(jīng)、背誦、晨讀、開(kāi)大會(huì)、宣誓、校訓(xùn)等等。

我倒是突然想起一個(gè)很私人化的畫(huà)面。

有一陣我數(shù)據(jù)確實(shí)不是很好,感覺(jué)內(nèi)容怎么寫(xiě)都沒(méi)人看,方向也有問(wèn)題,然后本來(lái)情緒特別糟糕,還有一堆其他的項(xiàng)目管理的事、各種意外發(fā)生、然后身體也不太好。

那天跟朋友聊微信,實(shí)在沒(méi)崩住,哭訴了幾句。

對(duì)方只發(fā)了一句特別簡(jiǎn)單的話:

“你已經(jīng)做得很好了?!?/p>

我回了一個(gè)“哈哈哈,哪有”。

過(guò)了幾分鐘,他又發(fā)了一遍,還是同一句。

大概又隔了十幾分鐘,他第三次發(fā)過(guò)來(lái):

“你已經(jīng)做得很好了,真的。”

那一瞬間,我突然就沒(méi)繃住。

人類的很多情感,其實(shí)都是靠重復(fù)才能構(gòu)筑的。

從這個(gè)角度看,復(fù)制粘貼這事,好像也沒(méi)那么卑微。

愛(ài)一個(gè)人是日常的復(fù)制粘貼,專業(yè)是一輩子的復(fù)制粘貼,寫(xiě)作是對(duì)一些想法一遍又一遍的復(fù)制粘貼,

直到有一天,這些東西都不需要你刻意想起,它們自動(dòng)從你的手指和眼神里長(zhǎng)出來(lái)。

AI 的世界,很大一塊其實(shí)就是壓縮過(guò)的人的世界。

當(dāng)你下一次在終端里敲下那一長(zhǎng)串Prompt的時(shí)候,也許可以在末尾多敲一次 Ctrl+V。

同樣,當(dāng)你下一次覺(jué)得人生很亂的時(shí)候,也許可以找一兩句你真心認(rèn)同的話,寫(xiě)在記事本、手機(jī)備忘錄、貼在桌邊墻上,反復(fù)去看。

從一堆token里看到真正的重點(diǎn),需要的是幾次重復(fù)后的清晰。

而從一地雞毛里看到一點(diǎn)點(diǎn)意義,生活,很多時(shí)候也是這樣。

高山之流水。

萬(wàn)物皆重復(fù)。

以上,既然看到這里了,如果覺(jué)得不錯(cuò),隨手點(diǎn)個(gè)贊、在看、轉(zhuǎn)發(fā)三連吧,如果想第一時(shí)間收到推送,也可以給我個(gè)星標(biāo)?~謝謝你看我的文章,我們,下次再見(jiàn)。

>/ 作者:卡茲克

>/ 投稿或爆料,請(qǐng)聯(lián)系郵箱:wzglyay@virxact.com

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美伊沖突再次升級(jí),全球股市失血,油價(jià)金價(jià)還能漲多久?|商業(yè)微史記

美伊沖突再次升級(jí),全球股市失血,油價(jià)金價(jià)還能漲多久?|商業(yè)微史記

界面新聞
2026-03-02 15:51:05
誰(shuí)能想到她已經(jīng)62了,說(shuō)18都有人信,怎么做到這么好的狀態(tài)的

誰(shuí)能想到她已經(jīng)62了,說(shuō)18都有人信,怎么做到這么好的狀態(tài)的

白宸侃片
2026-02-11 11:56:19
媒體人:不了解楊瀚森場(chǎng)下訓(xùn)練情況,但英語(yǔ)進(jìn)步速度讓人憂慮

媒體人:不了解楊瀚森場(chǎng)下訓(xùn)練情況,但英語(yǔ)進(jìn)步速度讓人憂慮

懂球帝
2026-03-02 13:29:16
2月車市,再給新能源汽車潑一大盆冷水,涼透了

2月車市,再給新能源汽車潑一大盆冷水,涼透了

互聯(lián)網(wǎng).亂侃秀
2026-03-02 10:06:29
醫(yī)生提醒:無(wú)論多壞的肺,只要常吃這5樣,肺一天比一天好

醫(yī)生提醒:無(wú)論多壞的肺,只要常吃這5樣,肺一天比一天好

路醫(yī)生健康科普
2026-02-28 23:20:03
一個(gè)美國(guó)人在網(wǎng)上發(fā)帖:為什么中國(guó)人覺(jué)得美國(guó)才是他們的家呢

一個(gè)美國(guó)人在網(wǎng)上發(fā)帖:為什么中國(guó)人覺(jué)得美國(guó)才是他們的家呢

賤議你讀史
2026-02-23 00:35:40
春節(jié)剛過(guò)完,茅臺(tái)價(jià)格又跌下來(lái)了

春節(jié)剛過(guò)完,茅臺(tái)價(jià)格又跌下來(lái)了

深水財(cái)經(jīng)社
2026-03-02 20:35:04
英國(guó)曾阻止美軍使用迪戈加西亞基地打擊伊朗,特朗普抱怨:斯塔默“花太長(zhǎng)時(shí)間”改變主意

英國(guó)曾阻止美軍使用迪戈加西亞基地打擊伊朗,特朗普抱怨:斯塔默“花太長(zhǎng)時(shí)間”改變主意

環(huán)球網(wǎng)資訊
2026-03-02 21:27:19
52中21!布朗尼真有本事!NBA最勵(lì)志的球二代

52中21!布朗尼真有本事!NBA最勵(lì)志的球二代

籃球?qū)崙?zhàn)寶典
2026-03-02 21:40:48
美軍用AI殺死了哈梅內(nèi)伊?很抱歉,大家都被營(yíng)銷號(hào)騙了

美軍用AI殺死了哈梅內(nèi)伊?很抱歉,大家都被營(yíng)銷號(hào)騙了

互聯(lián)網(wǎng)大觀
2026-03-01 19:29:49
美國(guó)十大領(lǐng)域全球領(lǐng)跑,差距還在拉大,正視實(shí)力才是真清醒!

美國(guó)十大領(lǐng)域全球領(lǐng)跑,差距還在拉大,正視實(shí)力才是真清醒!

保德全
2026-02-03 19:30:03
關(guān)窗!關(guān)窗!即將抵達(dá)江蘇

關(guān)窗!關(guān)窗!即將抵達(dá)江蘇

最江陰
2026-03-02 14:33:29
兩套房,我為何不賣房換大屋?一位婆婆的清醒賬本

兩套房,我為何不賣房換大屋?一位婆婆的清醒賬本

言言說(shuō)
2026-03-01 20:46:04
中國(guó)藝人被困中東!黃渤驚險(xiǎn)逃離,玄子一家7000租車,周雨彤回京

中國(guó)藝人被困中東!黃渤驚險(xiǎn)逃離,玄子一家7000租車,周雨彤回京

潮鹿逐夢(mèng)
2026-03-02 22:48:22
2026年竟還有60Hz手機(jī)!iPhone 17e引爭(zhēng)議 網(wǎng)友吐槽:除了處理器一無(wú)是處

2026年竟還有60Hz手機(jī)!iPhone 17e引爭(zhēng)議 網(wǎng)友吐槽:除了處理器一無(wú)是處

快科技
2026-03-03 00:14:05
CCTV5直播!中國(guó)男籃VS日本時(shí)間敲定,3大猛將回歸,雙殺希望大了

CCTV5直播!中國(guó)男籃VS日本時(shí)間敲定,3大猛將回歸,雙殺希望大了

何老師呀
2026-03-02 23:50:09
欠中國(guó)的錢,委內(nèi)瑞拉不還了?美財(cái)長(zhǎng):中國(guó)已無(wú)法繼續(xù)獲得委石油

欠中國(guó)的錢,委內(nèi)瑞拉不還了?美財(cái)長(zhǎng):中國(guó)已無(wú)法繼續(xù)獲得委石油

萌城少年強(qiáng)
2026-01-22 12:47:40
把頂級(jí)外線大閘白送給了騎士,真不知道國(guó)王到底在想些什么?

把頂級(jí)外線大閘白送給了騎士,真不知道國(guó)王到底在想些什么?

稻谷與小麥
2026-03-02 22:40:20
糖尿病人出現(xiàn)這6種情況,必須馬上住院,否則生命可能有危險(xiǎn)

糖尿病人出現(xiàn)這6種情況,必須馬上住院,否則生命可能有危險(xiǎn)

健康之光
2026-03-02 19:40:03
明明手上沒(méi)權(quán),為什么內(nèi)賈德還非死不可?真相遠(yuǎn)非復(fù)仇那么簡(jiǎn)單

明明手上沒(méi)權(quán),為什么內(nèi)賈德還非死不可?真相遠(yuǎn)非復(fù)仇那么簡(jiǎn)單

李健政觀察
2026-03-02 11:51:27
2026-03-03 02:32:49
數(shù)字生命卡茲克 incentive-icons
數(shù)字生命卡茲克
反復(fù)橫跳于不同的AI領(lǐng)域,努力分享一些很酷的AI干貨
465文章數(shù) 553關(guān)注度
往期回顧 全部

科技要聞

蘋果中國(guó)官網(wǎng)上線iPhone 17e,4499元起

頭條要聞

中國(guó)留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

頭條要聞

中國(guó)留學(xué)生:很多人得知哈梅內(nèi)伊身亡后 決定盡快撤離

體育要聞

“想要我簽名嗎” 梅西逆轉(zhuǎn)后嘲諷對(duì)手主帥

娛樂(lè)要聞

李亞鵬與哥哥和解 只有一條真心話短信

財(cái)經(jīng)要聞

油價(jià)飆升 美伊沖突將如何攪動(dòng)全球經(jīng)濟(jì)

汽車要聞

國(guó)民SUV再添一員 瑞虎7L靜態(tài)體驗(yàn)

態(tài)度原創(chuàng)

教育
藝術(shù)
旅游
家居
手機(jī)

教育要聞

特別猛,但在留學(xué)生心中存在感很低的英國(guó)大學(xué)!

藝術(shù)要聞

這四位老人的花鳥(niǎo)畫(huà),竟讓人欲罷不能!

旅游要聞

熱度飆升!非遺、冰雪…禹州元宵“文旅大餐”承包圓滿佳節(jié)!

家居要聞

萬(wàn)物互聯(lián) 享科技福祉

手機(jī)要聞

iPhone 17e發(fā)布:4499元起,e系列首次搭載靈動(dòng)島

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版