国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

有300億美元也未必“再造GPT-4”?尤洋長(zhǎng)文:AI增長(zhǎng)瓶頸的真相

0
分享至

允中 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

2026年將至,ChatGPT發(fā)布三周年,但關(guān)于“AI瓶頸期”的焦慮正達(dá)到頂峰。

當(dāng)全行業(yè)都在討論如何通過量化、蒸餾來“省錢”時(shí),新加坡國(guó)立大學(xué)校長(zhǎng)青年教授、潞晨科技創(chuàng)始人尤洋卻提出了一個(gè)更為本質(zhì)的拷問:

如果給你300億美元預(yù)算,今天我們真的能訓(xùn)出比GPT-4強(qiáng)出幾個(gè)維度的模型嗎?

在《智能增長(zhǎng)的瓶頸》一文中,尤洋教授一針見血地指出:

  • 當(dāng)前智能增長(zhǎng)的瓶頸,本質(zhì)上是我們現(xiàn)有的技術(shù)范式,已經(jīng)快要“消化”不動(dòng)持續(xù)增長(zhǎng)的算力了。

他提出了幾個(gè)顛覆常規(guī)認(rèn)知的硬核觀點(diǎn):

  • 智能的本質(zhì)是能源轉(zhuǎn)化:過去10年,AI的本質(zhì)是將電力通過計(jì)算轉(zhuǎn)化為可復(fù)用的智能,而轉(zhuǎn)化效率正面臨大考。
  • Transformer的秘密:它之所以勝出,并非因?yàn)楦袢四X,而是因?yàn)樗且慌_(tái)“偽裝成神經(jīng)網(wǎng)絡(luò)的并行計(jì)算機(jī)”,完美契合了英偉達(dá)GPU的堆料邏輯。
  • 效率不等于智能:Mamba等新架構(gòu)提升了吞吐量,但在“算力轉(zhuǎn)智能”的終極上限上,它們真的比Transformer更強(qiáng)嗎?
  • 未來的出路:拋棄Adam優(yōu)化器?回歸高精度計(jì)算(FP32/64)?

從電影制作到地震時(shí)間預(yù)測(cè),我們離真正的AGI還有多遠(yuǎn)?……



這篇深度長(zhǎng)文,或許能帶你穿透“降本增效”的迷霧,直達(dá)算力與智能最底層的邏輯。

一起來看。

智能的核心不是解釋,而是預(yù)測(cè)

什么是智能?

尤洋沒有照搬任何形式化或哲學(xué)化的“智能定義”。

相反,他采用了一種非常工程化、面向能力評(píng)估的處理方式,通過一組可驗(yàn)證、可實(shí)踐的判斷標(biāo)準(zhǔn)來刻畫智能的邊界:

  • 在關(guān)鍵人生決策上,是否愿意完全聽從AI;
  • 在高風(fēng)險(xiǎn)、高不確定性領(lǐng)域,是否敢讓AI替代專家;
  • 在創(chuàng)作層面,是否已經(jīng)無法分辨作品是否由AI生成;

這些例子背后,指向的是同一個(gè)核心能力:即對(duì)未來狀態(tài)進(jìn)行預(yù)測(cè),并為預(yù)測(cè)結(jié)果承擔(dān)實(shí)際后果的能力



這一鋒利的判斷,不僅解釋了為什么Next-Token Prediction能在過去幾年成為事實(shí)上的“智能發(fā)動(dòng)機(jī)”,也解釋了為何許多“在封閉評(píng)測(cè)中表現(xiàn)出色”的系統(tǒng),一旦進(jìn)入真實(shí)世界就迅速暴露短板——

它們往往擅長(zhǎng)組織與解釋已有信息,卻難以在不確定環(huán)境中對(duì)未來做出穩(wěn)定、可執(zhí)行的判斷。

當(dāng)然,需要強(qiáng)調(diào)的是,將智能高度凝聚為“預(yù)測(cè)”,更像是在給智能劃定一個(gè)工程上可對(duì)齊算力投入的核心能力維度,而非窮盡智能的全部?jī)?nèi)涵。

這是一個(gè)足夠清晰也足夠有解釋力的硬核視角。而規(guī)劃、因果建模以及長(zhǎng)期一致性等能力,是否能夠完全被還原為預(yù)測(cè)問題,仍然是一個(gè)開放議題。

但當(dāng)我們把智能簡(jiǎn)化為預(yù)測(cè)能力時(shí),下一步的問題自然落到:算力是如何轉(zhuǎn)化為這種能力的?

預(yù)訓(xùn)練、SFT、RL之爭(zhēng),本質(zhì)上是“算力分配”問題

過去幾年,行業(yè)對(duì)訓(xùn)練范式的討論,常常被“方法論優(yōu)越感”主導(dǎo);但如果把目標(biāo)限定為單位算力能換來多少智能,那么范式本身就不再神秘,而變成了一種算力使用策略。

不同于主流敘事,尤洋在文章中直接把預(yù)訓(xùn)練、微調(diào)、強(qiáng)化學(xué)習(xí)三者拉到統(tǒng)一層面,即三者本質(zhì)上都是在計(jì)算梯度,更新參數(shù)。



文章指出,當(dāng)前模型的主要智能來源,依然是預(yù)訓(xùn)練階段——不是因?yàn)樗奥斆鳌,而是因(yàn)樗?strong>消耗了最多的能源與計(jì)算

從智能增長(zhǎng)角度看,這三者參數(shù)更新發(fā)生的頻率與更新所消耗的算力規(guī)模確有不同,但是通過視角的轉(zhuǎn)換,智能增長(zhǎng)的討論就從方法論之爭(zhēng),轉(zhuǎn)向了一個(gè)更樸素,也更殘酷的問題——

在算力持續(xù)投入的前提下,我們是否還能穩(wěn)定地?fù)Q取能力增長(zhǎng)?

Transformer的勝出,不只是算法勝利

為了回答這個(gè)問題,這篇文章回溯了過去十年大模型快速進(jìn)化的原因。尤洋指出,這一輪智能躍遷的成立,依賴于三件事情同時(shí)發(fā)生:

  • 一是GPU體系在硬件層面持續(xù)提供指數(shù)級(jí)增長(zhǎng)的并行算力;
  • 二是Transformer架構(gòu)在計(jì)算結(jié)構(gòu)上天然支持大規(guī)模并行,能夠充分“吃下”這些算力;
  • 三是Next-Token Prediction這一訓(xùn)練目標(biāo)為模型提供了近乎無限、且高度統(tǒng)一的學(xué)習(xí)信號(hào)。

因此,Transformer的成功,并不僅僅是算法層面的勝利,更源于模型架構(gòu)與硬件體系高度匹配的系統(tǒng)性結(jié)果

在這三者共同作用下,算力增長(zhǎng)、模型規(guī)模擴(kuò)大與能力提升之間形成了一條相對(duì)穩(wěn)定的正反饋鏈路。

需要注意的是,這一范式的有效性,也在一定程度上受益于語言任務(wù)本身的結(jié)構(gòu)特性:語言高度符號(hào)化、序列化,且評(píng)測(cè)體系與訓(xùn)練目標(biāo)高度一致。

這使得算力增長(zhǎng)、模型規(guī)模擴(kuò)大與能力提升之間,在這一階段形成了一條相對(duì)穩(wěn)定的正反饋鏈路。

也正是在這一歷史條件下,從GPT-1、GPT-2到GPT-3,再到ChatGPT,智能水平得以沿著同一范式持續(xù)抬升。

這也自然引出了后文的核心問題:

當(dāng)算力繼續(xù)增長(zhǎng)時(shí),我們是否還擁有同樣可擴(kuò)展的范式?

真正的瓶頸,并不是算力停了,而是算力“吃不動(dòng)”了

尤洋在文中提出了一個(gè)非常具體、也非?刹僮鞯臉(biāo)準(zhǔn)來判斷智能的瓶頸:

  • 當(dāng)一次訓(xùn)練的FLOPS從10^n變成10^{n+3}時(shí),我們是否還能穩(wěn)定地獲得顯著更強(qiáng)的模型?

如果答案開始變得不確定,那么問題就不在于“算力是否繼續(xù)增長(zhǎng)”,而在于:

  • 現(xiàn)有范式對(duì)新增算力的吸收效率是否下降;
  • 計(jì)算規(guī)模的擴(kuò)大,是否被通信、同步和系統(tǒng)開銷所抵消。

這也是文章里反復(fù)強(qiáng)調(diào)FLOPS的原因:

Token數(shù)、參數(shù)量、推理速度,往往會(huì)混合效率與商業(yè)因素;而FLOPS才是最底層、也最難被包裝或美化的算力尺度

在這個(gè)意義上,所謂“瓶頸”,并不是紅利消失,而是算力增長(zhǎng)與智能增長(zhǎng)之間的映射關(guān)系開始松動(dòng)

更值得一提的是,尤洋在文章中刻意把討論從“效率優(yōu)化”里拎出來,換了一個(gè)更接近一線大廠決策的場(chǎng)景:

假設(shè)今天Google拍給你一張“300億美元預(yù)算”的支票,給你半年DDL——在這種極限訓(xùn)練目標(biāo)下,你還會(huì)優(yōu)先選擇Mamba這類“吞吐量更高”的架構(gòu)嗎?

未必。因?yàn)橥掏铝拷鉀Q的是“同等智能更便宜”,不自動(dòng)等價(jià)于“同等成本更聰明”。

真正的難點(diǎn)變成:我們到底有沒有一種擴(kuò)展性更強(qiáng)的架構(gòu)或Loss函數(shù),能把新增算力更穩(wěn)定地“吃進(jìn)去”,并把它轉(zhuǎn)換成可兌現(xiàn)的能力增量?

那么如何能在單位時(shí)間內(nèi)吃下更多算力,并真正將它轉(zhuǎn)化為智能呢?

未來未定,問題的答案可能在多個(gè)探索區(qū)間內(nèi)

在正式回答算力轉(zhuǎn)化智能的問題之前,尤洋還對(duì)硬件與基礎(chǔ)設(shè)施層面進(jìn)行了深入的探討。

他根據(jù)自身多年的從業(yè)經(jīng)驗(yàn)得出,計(jì)算開銷/通信開銷的比值,必須維持或提升,這樣才能在繼續(xù)堆疊GPU的情況下,線性地?fù)Q來更多智能。

因此,未來AI基礎(chǔ)設(shè)施的核心目標(biāo),應(yīng)該關(guān)注并行計(jì)算體系在軟硬件層面的整體擴(kuò)展性,而不僅僅是單點(diǎn)芯片性能。

在這一基礎(chǔ)上,尤洋最后提出了多個(gè)探索方向,比如更高精度、高階優(yōu)化器,更可擴(kuò)展的架構(gòu)或者Loss函數(shù),更多epoch與更深度的超參數(shù)探索。

這些探索方向,都在試圖回答同一個(gè)命題——如何讓模型在“吃掉”萬億級(jí)投入的同時(shí),吐出等比例增強(qiáng)的智能?

對(duì)于智能的進(jìn)一步增長(zhǎng)而言,真正重要的,是在極端算力條件下持續(xù)變強(qiáng)的能力——這也意味著,預(yù)訓(xùn)練所能承載的智能增長(zhǎng)空間,可能還遠(yuǎn)未走到盡頭。

回到最初討論的問題,算力到底還能不能繼續(xù)轉(zhuǎn)化為智能?

尤洋并未給出斷言,但邏輯已經(jīng)清晰:

  • 只要我們還能找到更高效組織計(jì)算的方式,智能的上限就遠(yuǎn)未到來。

原文傳送門:

https://zhuanlan.zhihu.com/p/1989100535295538013

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
突發(fā)暴跌!全線跳水

突發(fā)暴跌!全線跳水

證券時(shí)報(bào)
2025-12-31 14:27:02
狂勝41分,快船5連勝破紀(jì)錄!小卡兩戰(zhàn)88分還在進(jìn)化 哈登喜笑顏開

狂勝41分,快船5連勝破紀(jì)錄!小卡兩戰(zhàn)88分還在進(jìn)化 哈登喜笑顏開

鍋?zhàn)踊@球
2025-12-31 16:36:16
俄方稱烏方襲擊普京官邸,中方回應(yīng)

俄方稱烏方襲擊普京官邸,中方回應(yīng)

中國(guó)青年報(bào)
2025-12-30 21:00:11
林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,妻子、父母也有責(zé)任

林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,妻子、父母也有責(zé)任

細(xì)品名人
2025-12-31 07:34:46
錯(cuò)失4年8400萬美元,東契奇調(diào)侃施羅德:你真該簽湖人那份合同的

錯(cuò)失4年8400萬美元,東契奇調(diào)侃施羅德:你真該簽湖人那份合同的

懂球帝
2025-12-31 12:46:11
白嫖攝影師后續(xù):?jiǎn)挝粋鏖_已社死,朋友曝更多,白嫖只是冰山一角

白嫖攝影師后續(xù):?jiǎn)挝粋鏖_已社死,朋友曝更多,白嫖只是冰山一角

天天熱點(diǎn)見聞
2025-12-31 06:36:45
成都繞城高速夜間突發(fā)連環(huán)車禍,目擊者稱多人送醫(yī);交警回應(yīng):事故已處置完成,道路當(dāng)晚恢復(fù)暢通

成都繞城高速夜間突發(fā)連環(huán)車禍,目擊者稱多人送醫(yī);交警回應(yīng):事故已處置完成,道路當(dāng)晚恢復(fù)暢通

大風(fēng)新聞
2025-12-31 15:45:04
庭審直擊:上海一出納13年掏空公司3500萬,花超百萬養(yǎng)流浪貓

庭審直擊:上海一出納13年掏空公司3500萬,花超百萬養(yǎng)流浪貓

上觀新聞
2025-12-31 15:21:04
圍島第二天,王毅外長(zhǎng)發(fā)聲,演習(xí)就是針對(duì)美國(guó),特朗普罕見說軟話

圍島第二天,王毅外長(zhǎng)發(fā)聲,演習(xí)就是針對(duì)美國(guó),特朗普罕見說軟話

博覽歷史
2025-12-31 09:59:48
一個(gè)國(guó)家正在崩塌:伊朗女孩扔掉頭巾,如同大清朝開始剪辮子

一個(gè)國(guó)家正在崩塌:伊朗女孩扔掉頭巾,如同大清朝開始剪辮子

老范談史
2025-12-29 15:59:06
2026國(guó)補(bǔ)來了!汽車消費(fèi)補(bǔ)貼由“定額”改為“按比例”(附對(duì)照表)

2026國(guó)補(bǔ)來了!汽車消費(fèi)補(bǔ)貼由“定額”改為“按比例”(附對(duì)照表)

每日經(jīng)濟(jì)新聞
2025-12-31 09:14:06
人來世間到底是干什么的?你一定要看一看

人來世間到底是干什么的?你一定要看一看

金沛的國(guó)學(xué)筆記
2025-12-29 17:44:07
上海市紀(jì)委監(jiān)委公開通報(bào)五起違反中央八項(xiàng)規(guī)定精神典型問題

上海市紀(jì)委監(jiān)委公開通報(bào)五起違反中央八項(xiàng)規(guī)定精神典型問題

澎湃新聞
2025-12-31 14:24:12
打假“斬殺線”——“饑寒交迫的美國(guó)”

打假“斬殺線”——“饑寒交迫的美國(guó)”

老頭和你隨便聊聊
2025-12-30 13:33:00
確認(rèn)了,是江蘇籍女演員白鹿

確認(rèn)了,是江蘇籍女演員白鹿

最江陰
2025-12-30 15:10:28
最新!法國(guó)、英國(guó)、加拿大、丹麥、芬蘭等十國(guó)外長(zhǎng)發(fā)布聯(lián)合聲明

最新!法國(guó)、英國(guó)、加拿大、丹麥、芬蘭等十國(guó)外長(zhǎng)發(fā)布聯(lián)合聲明

每日經(jīng)濟(jì)新聞
2025-12-31 07:50:06
又一波人賬戶歸零,因?yàn)槿齻(gè)漲停追進(jìn)去出不來了,還有一天退市!

又一波人賬戶歸零,因?yàn)槿齻(gè)漲停追進(jìn)去出不來了,還有一天退市!

財(cái)經(jīng)智多星
2025-12-30 15:23:35
元旦到了,別再說“元旦快樂”,太土!教你19句祝福語,好聽不俗

元旦到了,別再說“元旦快樂”,太土!教你19句祝福語,好聽不俗

狼小妖
2025-12-31 00:13:10
南博的事還沒水落石出,川博又來了!

南博的事還沒水落石出,川博又來了!

深度報(bào)
2025-12-29 22:55:49
羅永浩凌晨發(fā)文稱患ADHD:如換藥失敗,或不能用鍛煉徹底改善體能問題,將不再舉辦大型活動(dòng);此前其“科技春晚”遲到40多分鐘才出現(xiàn)引熱議

羅永浩凌晨發(fā)文稱患ADHD:如換藥失敗,或不能用鍛煉徹底改善體能問題,將不再舉辦大型活動(dòng);此前其“科技春晚”遲到40多分鐘才出現(xiàn)引熱議

極目新聞
2025-12-31 07:52:11
2025-12-31 16:51:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
11951文章數(shù) 176355關(guān)注度
往期回顧 全部

科技要聞

老羅,演砸了,也封神了?

頭條要聞

美國(guó)防部稱中國(guó)大陸對(duì)臺(tái)有"四種軍事方案" 國(guó)臺(tái)辦回應(yīng)

頭條要聞

美國(guó)防部稱中國(guó)大陸對(duì)臺(tái)有"四種軍事方案" 國(guó)臺(tái)辦回應(yīng)

體育要聞

2025全球射手榜:姆巴佩66球 梅西第6C羅第9

娛樂要聞

告別2025年!大S、方大同離世青春退場(chǎng)

財(cái)經(jīng)要聞

高培勇:分配制度改革是提振消費(fèi)的抓手

汽車要聞

凱迪拉克純電中型SUV 售價(jià)不足24萬/33寸曲面屏

態(tài)度原創(chuàng)

家居
時(shí)尚
健康
房產(chǎn)
數(shù)碼

家居要聞

無形有行 自然與靈感詩(shī)意

今年冬天流行的“倒三角”穿法,時(shí)髦又高級(jí)!

元旦舉家出行,注意防流感

房產(chǎn)要聞

終于等來了!2026年首個(gè)買房大利好

數(shù)碼要聞

甩開那根礙事的線!藍(lán)寶石NITRO+氮?jiǎng)覴X 9070 XT顯卡評(píng)測(cè):背插供電釋放超380W 燈光無遮擋更絢麗

無障礙瀏覽 進(jìn)入關(guān)懷版