国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

谷歌最新研究:重復提示詞可將AI準確率從21.33%提升至97.33%

0
分享至


最近小編發(fā)現(xiàn)了一個效果出奇好的提示詞技巧,實測結果堪稱驚人。

谷歌一篇新論文《重復提示詞提升非推理型大語言模型性能》指出,在部分任務中,簡單重復提示詞就能將非推理型大語言模型的準確率從21.33%提升至97.33%。


乍聽之下,這說法簡直玄乎,讓人難以相信。但背后的原理其實無比簡單。

谷歌在70項不同的基準測試任務中開展了實驗,這種復制粘貼式的提示詞重復法:

? 在47項任務中表現(xiàn)優(yōu)于基準模型

? 全程無一失手

? 帶來了肉眼可見的大幅性能提升,部分任務的準確率從約21%飆升至約97%



這個測試,覆蓋了 7 個主流模型:Gemini 2.0 Flash / Flash Lite、GPT-4o / GPT-4o-mini、Claude 3 Haiku / Claude 3.7 Sonnet、DeepSeek V3 等。

測試基準包括 ARC (Challenge)、OpenBookQA、GSM8K、MMLU-Pro、MATH,及自定義任務NameIndex、MiddleMatch。


對于選擇題任務,測試兩種順序,問題在前(Question-First)與選項在前(Options-First)。

那么,重復問題為何能起到這樣的效果?

論文給出了一個極具工程視角的解釋:大語言模型均以因果語言模型為基礎進行訓練,它們逐詞生成文本,嚴格遵循從左到右的順序,每個詞元只能“看到”其之前的內容。

當你重復問題時(比如將問題Q改寫為Q1+Q2),第二個副本中的每個詞元都能完整關聯(lián)第一個副本的全部信息。

實際上,這相當于在不改動模型、不增加推理步驟的前提下,讓模型獲得了回顧并重新梳理信息的機會。

類似的小技巧還有其他,比如清華大學此前發(fā)現(xiàn)的“先驗證”策略。

在其論文《Asking LLMs to Verify First is Almost Free Lunch》中,清華大學團隊提出了一個反直覺的思路:與其讓AI直接回答,不如先讓它"找茬"。

這個名為先驗證(Verification-First, VF)的策略簡單到令人難以置信:

傳統(tǒng)方式(Chain-of-Thought):


Q: 球棒和球問題...

A: 讓我一步步思考...

VF方式:


Q: 球棒和球問題...(提示:答案可能是"0.10元",先驗證它對不對,再給出正確答案)

A: 先驗證"0.10元"是否正確...

關鍵點:即使提供的答案是隨機的、錯誤的,甚至"1"這樣毫無意義的數(shù)字,VF依然有效!

結果是,這個"笨辦法"能讓AI推理準確率提升10-15%,而且?guī)缀醪辉黾佑嬎愠杀尽?/p>

可見,讓人工智能變得“更聰明”,未必需要增加復雜度,只需優(yōu)化提示詞的結構就夠了。

谷歌論文地址:https://arxiv.org/pdf/2512.14982


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
蘇敏旅游6年后完全認不出,連面相都變了,網友:這16萬花得值!

蘇敏旅游6年后完全認不出,連面相都變了,網友:這16萬花得值!

一盅情懷
2026-03-27 16:43:32
巨星施瓦辛格28歲私生子參加健美賽!親媽是保姆,網友:長一樣!

巨星施瓦辛格28歲私生子參加健美賽!親媽是保姆,網友:長一樣!

英國報姐
2026-03-27 21:29:30
金頭盔殲-10C遭敵照射,不退不避以牙還牙,賭你沒膽按下扳機

金頭盔殲-10C遭敵照射,不退不避以牙還牙,賭你沒膽按下扳機

嘯鷹評
2026-03-28 11:49:40
林青霞親口爆料:當年我全裸給他看,他卻嚇得扭頭就跑!

林青霞親口爆料:當年我全裸給他看,他卻嚇得扭頭就跑!

達文西看世界
2026-03-04 15:07:30
1976年播報毛主席訃告,播音員念完三遍后突然冒出一句話,全國都慌了

1976年播報毛主席訃告,播音員念完三遍后突然冒出一句話,全國都慌了

文史明鑒
2026-03-25 19:14:13
“窮就別硬裝了!”一家三口吃火鍋花了217元,父親心疼錢被群嘲

“窮就別硬裝了!”一家三口吃火鍋花了217元,父親心疼錢被群嘲

妍妍教育日記
2025-11-18 19:53:15
車貸還一兩期就斷供!300萬元壞賬撕開“空手套車”黑幕:普通人成“背債工具”

車貸還一兩期就斷供!300萬元壞賬撕開“空手套車”黑幕:普通人成“背債工具”

方圓
2026-03-24 14:19:06
20年后再看《亮劍》:軍事上漏洞百出,政治上莫名其妙

20年后再看《亮劍》:軍事上漏洞百出,政治上莫名其妙

明月清風閣
2026-03-25 14:50:09
黃金跌價,足金降價,2026年3月28日,國內黃金、足金純金新價格

黃金跌價,足金降價,2026年3月28日,國內黃金、足金純金新價格

小蜜情感說
2026-03-28 16:15:54
世上有兩個國家,一個誰也打不過,一個誰也不敢打

世上有兩個國家,一個誰也打不過,一個誰也不敢打

近史談
2026-03-28 23:06:25
武統(tǒng)、和統(tǒng)都沒希望?寶島一專家:大陸已走上“第3條路”!

武統(tǒng)、和統(tǒng)都沒希望?寶島一專家:大陸已走上“第3條路”!

未來展望
2026-03-29 12:08:29
高志凱:“成為中國人”為何成為全球熱潮

高志凱:“成為中國人”為何成為全球熱潮

中國日報網
2026-03-28 22:43:08
這是目前為止,我見過腰最細的女生,沒有之一

這是目前為止,我見過腰最細的女生,沒有之一

草莓解說體育
2026-03-03 19:15:05
電機塞進車輪里!全國首款輪轂電機乘用車亮相,改寫汽車驅動規(guī)則

電機塞進車輪里!全國首款輪轂電機乘用車亮相,改寫汽車驅動規(guī)則

沙雕小琳琳
2026-03-28 07:52:19
妹子曬小貓每天吃牢飯,以為虐貓剛想罵,點開一看笑屎:這是真沒招了哈哈

妹子曬小貓每天吃牢飯,以為虐貓剛想罵,點開一看笑屎:這是真沒招了哈哈

拜見喵主子
2026-03-28 12:25:54
【硬件資訊】雷蛇:我不知道???不關我事??!他突然就向著自己開了一槍!

【硬件資訊】雷蛇:我不知道?。坎魂P我事?。∷蝗痪拖蛑约洪_了一槍!

電腦吧評測室
2026-03-28 22:05:16
大衛(wèi)·林奇最后燒腦神作,本月4K震撼首發(fā)!

大衛(wèi)·林奇最后燒腦神作,本月4K震撼首發(fā)!

幕味兒
2026-03-29 10:34:27
救回來了!上海41歲男子跑步時突然倒地心臟驟停,在場者與120“神配合”

救回來了!上海41歲男子跑步時突然倒地心臟驟停,在場者與120“神配合”

上觀新聞
2026-03-28 17:56:44
小區(qū)樓上天天晚上都有女的大聲叫。。。

小區(qū)樓上天天晚上都有女的大聲叫。。。

微微熱評
2025-12-24 00:26:04
別和孩子生氣啦,他需要你的時間,只有短短9年

別和孩子生氣啦,他需要你的時間,只有短短9年

上海女性
2026-03-20 18:06:00
2026-03-29 13:32:49
AI先鋒官 incentive-icons
AI先鋒官
AIGC大模型及應用精選與評測
466文章數(shù) 69關注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

媒體:中東戰(zhàn)火燒了一個月 全球最大產油國美國卻慌了

頭條要聞

媒體:中東戰(zhàn)火燒了一個月 全球最大產油國美國卻慌了

體育要聞

全球第二大車企,也救不了這支德甲隊?

娛樂要聞

張凌赫事件持續(xù)升級!官方點名怒批

財經要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態(tài)度原創(chuàng)

旅游
教育
時尚
數(shù)碼
藝術

旅游要聞

航拍春分過后的千佛山景區(qū)

教育要聞

春秋假,如何成為孩子心心念念的成長驛站?

和田曦薇一樣嫩嘟嘟,這3個變美技巧你一定不能錯過!

數(shù)碼要聞

曝華為多品類紫色新品將陸續(xù)推出 “幻影紫”平板已開售

藝術要聞

2025江南如畫——中國油畫作品展 | 入選作品選刊(二)

無障礙瀏覽 進入關懷版