国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌看了都沉默:自家「黑科技」火了,但為啥研發(fā)團(tuán)隊(duì)一無所知?

果然對王嘉爾的人脈一無所知

0
分享至

  

  新智元報(bào)道

  編輯:KingHZ

  【新智元導(dǎo)讀】當(dāng)整個(gè)科技圈都在為「谷歌黑魔法」集體高潮時(shí),真相恐給了所有人一記耳光。那套被捧上神壇的「并行驗(yàn)證循環(huán)」,不過是社交網(wǎng)絡(luò)上AI生成的「賽博跳大神」。

  如果說之前的AI模型是在模擬人類的思考,那么Gemini 3 Flash就是在模擬人類的「直覺」。

  3倍于Gemini 2.5 Pro的速度,卻擁有超越Pro級的推理能力。

  更離譜的是,它的智力竟然在某些基準(zhǔn)測試超越了自家的Pro大哥。

  

  但目前為止,依然沒人能說明白:Flash憑為什么比Pro還要「聰明」。

  谷歌DeepMind到底有啥黑魔法?

  「林子打了,什么鳥都有」,以至于X上網(wǎng)友Jainam Parmar爆料:

  AlphaGo團(tuán)隊(duì)根本不使用思維鏈。

  他們采用并行驗(yàn)證循環(huán)機(jī)制。

  這套方法正在碾壓你聽說過的所有「高級推理」技術(shù)。

  

  成千上萬的網(wǎng)友瀏覽過這個(gè)帖子。

  這靠譜嗎?這有沒有可能是「以訛傳訛」、用AI生成的「假新聞」?

  如果是假新聞,難道只是因?yàn)椤窪eepMind碾壓同行的推理」這樣的噱頭嗎?

  

  我們先看一下推文到底講了啥。

  谷歌DeepMind的黑科技?

  首先,這位「萬能的網(wǎng)友」直擊CoT命門,解釋了為什么Chain-of-Thought很糟糕。

  當(dāng)前的AI推理是線性的:

  思考步驟1→步驟2→步驟3。

  但這并不是專家級問題解決者的思維方式。

  然后,他寫道:「DeepMind分析了他們的AlphaGo團(tuán)隊(duì)是如何應(yīng)對復(fù)雜問題的,結(jié)果發(fā)現(xiàn)了一件非常驚人的事情。」

  

  并行驗(yàn)證循環(huán)(Parallel Verification Loops):

  專家型思考者并不會(huì)沿著一條冗長的推理鏈一路走到底,而是同時(shí)運(yùn)行多個(gè)驗(yàn)證循環(huán)。

  他們會(huì)提出一個(gè)解決方案,用約束條件去檢驗(yàn)它;必要時(shí)回退;同時(shí)探索其他可能的路徑——這些過程是并行發(fā)生的。

  而Chain-of-Thought做不到這一點(diǎn)。

  

  架構(gòu)上的差異(The ArchitectureDifference):

  傳統(tǒng)的思維鏈:A→B→C→D(線性)

  DeepMind的框架:A→[B1,B2,B3]→分別驗(yàn)證→精煉→迭代

  這就好比是在一條路上一直往前走,而另一種方式則是同時(shí)探索整棵決策樹。

  

  結(jié)果非??鋸垼?/strong>

  在復(fù)雜推理基準(zhǔn)測試中:

  相比標(biāo)準(zhǔn)的Chain-of-Thought,性能提升37%

  捕捉邏輯錯(cuò)誤的能力提升52%

  收斂到正確解的速度快了3倍

  這不是小幅優(yōu)化,而是架構(gòu)層面的飛躍。

  

  它實(shí)際是如何運(yùn)作的

  步驟1:同時(shí)生成多個(gè)候選解決方案

  步驟2:每個(gè)方案各自運(yùn)行一套驗(yàn)證循環(huán)

  步驟3:不同方案之間進(jìn)行交叉驗(yàn)證

  步驟4:剪除較弱的分支,強(qiáng)化更有潛力的路徑

  步驟5:持續(xù)迭代,直到收斂

  

  自我糾錯(cuò)優(yōu)勢:

  這才是殺手級特性:系統(tǒng)在給出最終答案之前,就能發(fā)現(xiàn)并糾正自己的錯(cuò)誤。

  傳統(tǒng)的CoT(思維鏈)是按步驟順序「提交」的,只要其中一步出錯(cuò),后面就全盤皆輸。

  而并行驗(yàn)證允許在不中斷整體流程的情況下回溯和修正,而不必從頭再來。

  

  對訓(xùn)練方式的影響:

  他們不只是測試了這種方法,而是直接用這一框架來訓(xùn)練模型。

  模型學(xué)會(huì)了:

  提出多個(gè)假設(shè)

  讓這些假設(shè)相互檢驗(yàn)

  通過驗(yàn)證逐步建立置信度

  盡早剪除錯(cuò)誤或低質(zhì)量的推理路徑

  

  現(xiàn)實(shí)世界中的應(yīng)用:

  這一框架在以下場景中表現(xiàn)尤為強(qiáng)大:

  數(shù)學(xué)證明(一步出錯(cuò),整體就會(huì)崩塌)

  代碼調(diào)試(可能同時(shí)存在多個(gè)潛在Bug)

  戰(zhàn)略規(guī)劃(需要探索復(fù)雜的決策樹)

  科學(xué)推理(假設(shè)提出與驗(yàn)證)

  凡是正確性優(yōu)先于速度的地方,它都具備壓倒性優(yōu)勢。

  

  如果你正在構(gòu)建AI智能體或推理系統(tǒng),Chain-of-Thought已經(jīng)過時(shí)了。

  未來屬于并行驗(yàn)證(Parallel Verification)

  生成多條路徑。

  對它們進(jìn)行測試。

  讓最優(yōu)解自然浮現(xiàn)。

  這正是AlphaGo擊敗世界冠軍的方式。

  這也是推理真正運(yùn)作的方式。

  疑點(diǎn)重重,被AI襲擊的一天?

  在這些描述中,「并行驗(yàn)證」簡直就是為數(shù)學(xué)證明和代碼調(diào)試量身定制的終極武器。

  凡是追求正確性的場景,它似乎都能實(shí)現(xiàn)降維打擊。

  這套理論聽起來是不是太完美了?簡直就像是DeepMind真的把人類直覺代碼化了一樣。

  但恰恰是這種「過度的完美」和「極具煽動(dòng)性」的文風(fēng),引起了業(yè)內(nèi)人士的警覺。

  當(dāng)成千上萬的網(wǎng)友還在為這套「黑魔法」轉(zhuǎn)發(fā)點(diǎn)贊時(shí),冷靜下來的人們開始追問一個(gè)最基本的問題:

  這套東西,到底是誰說的?

  發(fā)帖的Jainam Parmar,也不是什么AI研究領(lǐng)域的大牛,也不是谷歌DeepMind的員工。

  他也沒有明確給出DeepMind的可信的源鏈接。

  他說的靠譜嗎?

  即使DeepMind放緩發(fā)布世界知名的研究成果,以便在AI競賽中贏得先機(jī)。

  

  但DeepMind仍在發(fā)布他們的研究成果。

  

  去年11月初,谷歌DeepMind團(tuán)隊(duì)還發(fā)布了號稱解決「可持續(xù)學(xué)習(xí)」難題的新的機(jī)器學(xué)習(xí)范式──嵌套學(xué)習(xí)(nested learning)。

  

  原推文那種藏頭露尾、吊人胃口的寫作風(fēng)格,令人不喜,甚至部分網(wǎng)友懷疑,帖子壓根就是大模型生成的!

  

  熟悉DeepMind研究工作的網(wǎng)友,則認(rèn)為帖子在故弄玄虛,甚至歪曲原意!

  

  

  更有網(wǎng)友毫不客氣地指出,發(fā)帖人就是蹭熱度,半年前他還在鼓吹「CoT就是下一代推理技術(shù)」。

  

  

  

  還有更關(guān)鍵的證據(jù),之后,另一網(wǎng)友Chris Laub發(fā)布了一模一樣的內(nèi)容:

  

  帖子底下,也有網(wǎng)友懷疑,這就是誘導(dǎo)人點(diǎn)擊的AI垃圾!

  

  

  

  事實(shí)上,CoT早不是什么先進(jìn)技術(shù)。

  長思維鏈和短思維鏈截然不同。

  長思維鏈,有三大關(guān)鍵特征: 深度推理、廣泛探索和可行的反思。

  這些特征使得模型能夠處理更復(fù)雜的任務(wù),并且與較淺的短思維鏈相比,產(chǎn)生更高效、更連貫的結(jié)果。

  

  回到問題本身:Gemini 3Flash 到底憑什么更聰明?

  至少目前,沒有任何可靠證據(jù)表明DeepMind已將「并行驗(yàn)證循環(huán)」作為核心推理框架,全面取代Chain-of-Thought。

  相反,這場風(fēng)波更像一次典型的 AI 輿論實(shí)驗(yàn)—— 當(dāng)模型表現(xiàn)出現(xiàn)異常躍遷,人們總是更愿意相信「黑魔法」,而不是漸進(jìn)式優(yōu)化。

  真正值得警惕的,也許不是CoT是否過時(shí),而是我們是否過度迷信單一解釋。

  推理的未來,未必只有一條路,但謠言,往往只需要一條推文。

  參考資料:

  https://github.com/LightChen233/Awesome-Long-Chain-of-Thought-Reasoning

  https://x.com/iruletheworldmo/status/2007550905177256071

  https://x.com/aiwithjainam/status/2005629090943193552

  https://x.com/ChrisLaubAI/status/2006668516280197287

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
小楊生煎、清美要成老字號了?曾被移出的老半齋也回來了!2025年上海老字號名錄正在公示

小楊生煎、清美要成老字號了?曾被移出的老半齋也回來了!2025年上海老字號名錄正在公示

縱相新聞
2026-01-08 21:49:20
特斯拉宣布延長部分地區(qū)保修時(shí)間,五年不限公里

特斯拉宣布延長部分地區(qū)保修時(shí)間,五年不限公里

XCiOS俱樂部
2026-01-09 15:32:29
成龍?jiān)谌嗣袢請?bào)撰文

成龍?jiān)谌嗣袢請?bào)撰文

澎湃新聞
2026-01-08 11:56:23
王騰:新公司薪資福利基本看齊大廠 已收到幾百份簡歷

王騰:新公司薪資福利基本看齊大廠 已收到幾百份簡歷

快科技
2026-01-09 15:53:04
梁靜茹突然關(guān)閉社交媒體賬號

梁靜茹突然關(guān)閉社交媒體賬號

大象新聞
2026-01-08 12:21:06
他是任期最長的江蘇省長,1967年被奪權(quán),1980年又擔(dān)任江蘇省長

他是任期最長的江蘇省長,1967年被奪權(quán),1980年又擔(dān)任江蘇省長

嘆為觀止易
2026-01-08 15:59:17
張靈甫之子張道宇:成富商后回國與母定居上海,其子長相酷似父親

張靈甫之子張道宇:成富商后回國與母定居上海,其子長相酷似父親

歷史龍?jiān)w
2026-01-09 10:40:06
又轟下38+10+10!抱歉威少:你從歷史第二變成了歷史第三

又轟下38+10+10!抱歉威少:你從歷史第二變成了歷史第三

籃球大視野
2026-01-08 17:43:43
春晚彩排名單被曝僅4天,讓人擔(dān)心的事就發(fā)生了,網(wǎng)友:沒人了?

春晚彩排名單被曝僅4天,讓人擔(dān)心的事就發(fā)生了,網(wǎng)友:沒人了?

妙知
2026-01-08 19:53:48
跨年僅3天,具俊曄撕破汪小菲面子,馬筱梅悲慘出局!

跨年僅3天,具俊曄撕破汪小菲面子,馬筱梅悲慘出局!

瓜汁橘長Dr
2026-01-07 17:20:23
67歲老人燒柴取暖被罰8000塊,法庭上哭吼:我燒柴怎么就違法了?

67歲老人燒柴取暖被罰8000塊,法庭上哭吼:我燒柴怎么就違法了?

青青會(huì)講故事
2026-01-08 15:49:23
經(jīng)典恐怖片確認(rèn)引進(jìn)中國內(nèi)地!網(wǎng)友:曾經(jīng)的陰影

經(jīng)典恐怖片確認(rèn)引進(jìn)中國內(nèi)地!網(wǎng)友:曾經(jīng)的陰影

環(huán)球網(wǎng)資訊
2026-01-07 10:02:21
老鷹拒助火箭續(xù)約18.8分新援,范喬丹用意明顯

老鷹拒助火箭續(xù)約18.8分新援,范喬丹用意明顯

嘴角上翹
2026-01-09 16:29:21
北京出租車亂象:外地司機(jī)成主力,公司“割韭菜”式管理何時(shí)休?

北京出租車亂象:外地司機(jī)成主力,公司“割韭菜”式管理何時(shí)休?

劉哥談體育
2026-01-09 00:44:17
因車禍僅剩1條腿,女子9年遭數(shù)次家暴無處逃,生娃后彩禮也被要回

因車禍僅剩1條腿,女子9年遭數(shù)次家暴無處逃,生娃后彩禮也被要回

游者走天下
2026-01-08 10:24:20
癌癥去世的人越來越多!建議:2不喝、3不吃、1堅(jiān)持,別馬虎了!

癌癥去世的人越來越多!建議:2不喝、3不吃、1堅(jiān)持,別馬虎了!

鬼菜生活
2026-01-07 09:58:31
值得珍藏:商業(yè)航天+國產(chǎn)算力+機(jī)器人+全球第一的企業(yè)+6G產(chǎn)業(yè)鏈等

值得珍藏:商業(yè)航天+國產(chǎn)算力+機(jī)器人+全球第一的企業(yè)+6G產(chǎn)業(yè)鏈等

Thurman在昆明
2026-01-08 10:06:36
俄稱控制一居民點(diǎn) 烏稱前線態(tài)勢嚴(yán)峻

俄稱控制一居民點(diǎn) 烏稱前線態(tài)勢嚴(yán)峻

財(cái)聯(lián)社
2026-01-09 06:58:11
流浪柬埔寨20歲女子新進(jìn)展:給她打八萬過去,說回來后會(huì)好好做人

流浪柬埔寨20歲女子新進(jìn)展:給她打八萬過去,說回來后會(huì)好好做人

江山揮筆
2026-01-08 16:33:57
每名格陵蘭居民或能得到1萬至10萬美元 白宮“購島”方案流出

每名格陵蘭居民或能得到1萬至10萬美元 白宮“購島”方案流出

新京報(bào)
2026-01-09 08:36:04
2026-01-09 18:47:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14294文章數(shù) 66451關(guān)注度
往期回顧 全部

科技要聞

市場偏愛MiniMax:開盤漲42%,市值超700億

頭條要聞

特朗普稱美必須"擁有"整個(gè)格陵蘭 英法德迅速統(tǒng)一戰(zhàn)線

頭條要聞

特朗普稱美必須"擁有"整個(gè)格陵蘭 英法德迅速統(tǒng)一戰(zhàn)線

體育要聞

金元時(shí)代最后的外援,來中國8年了

娛樂要聞

關(guān)曉彤鹿晗風(fēng)波后露面 不受影響狀態(tài)佳

財(cái)經(jīng)要聞

投資必看!瑞銀李萌給出3大核心配置建議

汽車要聞

助跑三年的奇瑞 接下來是加速還是起跳?

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
教育
數(shù)碼
軍事航空

藝術(shù)要聞

Sean Yoro:街頭藝術(shù)界的“沖浪高手”

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

教育要聞

北航首位,以實(shí)踐成果獲授博士學(xué)位

數(shù)碼要聞

RK推出大配列燈箱三模機(jī)械鍵盤K99,299元起

軍事要聞

特朗普:已開始從委石油資源中賺錢

無障礙瀏覽 進(jìn)入關(guān)懷版