国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

AI 大神 Karpathy 2025 年度總結(jié)刷屏:AI 既是天才也是智障,這 6 個(gè)轉(zhuǎn)折最關(guān)鍵

0
分享至

最近各種年度回顧陸續(xù)上線, OpenAI 的前聯(lián)合創(chuàng)始人 Andrej Karpathy 也交出了自己對(duì)大模型的年度總結(jié)。


就在今年早些時(shí)候,,提出了不少新的觀點(diǎn):

  • 軟件 3.0 已來(lái): 從最初的人寫代碼(1.0),到喂數(shù)據(jù)訓(xùn)練模型(2.0),現(xiàn)在我們進(jìn)入了直接對(duì)模型「念咒語(yǔ)」(Prompt)的 3.0 時(shí)代。

  • LLM 是新操作系統(tǒng): 它是一個(gè)負(fù)責(zé)調(diào)度內(nèi)存(Context Window)和 CPU(推理算力)的復(fù)雜 OS。

  • Agent 的十年: 別指望 AI Agent 一年就成熟,從 99% 到 99.999% 的可靠性,我們需要走上十年。

Karpathy 今天這篇《2025 年度總結(jié)》,他再次向我我們剖析了這一年 AI 究竟長(zhǎng)出了什么樣的「腦子」。

以下是對(duì) Karpathy 年度總結(jié)的精譯,APPSO 在不改變?cè)獾幕A(chǔ)上做了更多通俗解讀。

如果想看原文可以點(diǎn)擊

https://karpathy.bearblog.dev/year-in-review-2025/

太長(zhǎng)不看版:

2025 年既讓人興奮,又有點(diǎn)讓人措手不及。

LLM 正在作為一種新型智能涌現(xiàn),它同時(shí)比我預(yù)期的要聰明得多,也比我預(yù)期的要笨得多。

無(wú)論如何,它們極其有用。我認(rèn)為即使以目前的能力,行業(yè)甚至還沒(méi)挖掘出其潛力的 10%。同時(shí),還有太多的想法可以嘗試,從概念上講,這個(gè)領(lǐng)域感覺(jué)依然廣闊。

正如我今年早些時(shí)候提到的,我同時(shí)(看起有點(diǎn)矛盾)相信:我們將看到持續(xù)快速的進(jìn)步,但前方仍有大量艱苦的工作要做。

系好安全帶,我們要發(fā)車了。

1. RLVR:教 AI 像做奧數(shù)題一樣「思考」

在解釋這個(gè)復(fù)雜的基礎(chǔ)概念之前,先看看以前大模型訓(xùn)練是怎么做的?

在 2025 年初,各大實(shí)驗(yàn)室訓(xùn)練 LLM 的「老三樣」配方非常穩(wěn)定:

1.預(yù)訓(xùn)練(Pretraining):像 GPT-3 那樣,讓 AI 讀遍全網(wǎng)文章,學(xué)會(huì)說(shuō)話。

2.監(jiān)督微調(diào)(SFT):找人寫好標(biāo)準(zhǔn)答案,教 AI 怎么回答問(wèn)題。

3.人類反饋強(qiáng)化學(xué)習(xí)(RLHF):讓 AI 生成幾個(gè)答案,人來(lái)打分,教它討人喜歡。

現(xiàn)在發(fā)生了什么變化?

2025 年,我們?cè)谶@個(gè)配方里加了一味猛藥:RLVR(從可驗(yàn)證獎(jiǎng)勵(lì)中進(jìn)行強(qiáng)化學(xué)習(xí))。

這是什么意思?

簡(jiǎn)單來(lái)說(shuō),就是不再讓人來(lái)打分(人太慢且主觀),反而讓 AI 去做那些「有標(biāo)準(zhǔn)答案」的任務(wù),比如數(shù)學(xué)題或?qū)懘a。對(duì)就是對(duì),錯(cuò)就是錯(cuò),機(jī)器能自動(dòng)驗(yàn)證。

在數(shù)百萬(wàn)次的自我博弈和試錯(cuò)中,模型自發(fā)地演化出了看似「推理」的策略。它們學(xué)會(huì)了先把大問(wèn)題拆解成小步驟,甚至學(xué)會(huì)了「回過(guò)頭來(lái)檢查」這種高級(jí)技巧(參考 DeepSeek R1 論文)。

核心對(duì)比:

舊范式(RLHF): 像是教小孩寫作文。因?yàn)闆](méi)有標(biāo)準(zhǔn)答案,AI 很難知道自己哪一步想錯(cuò)了,只能模仿人類的語(yǔ)氣。

新范式(RLVR): 像是把 AI 關(guān)進(jìn)奧數(shù)訓(xùn)練營(yíng)。不用教它具體怎么想,只要給它足夠多的題和對(duì)錯(cuò)反饋,它自己就能摸索出解題套路。

這一招太好用了,以至于 2025 年大部分算力都被這只「吞金獸」吃掉了。

結(jié)果就是:模型并沒(méi)有變大,但訓(xùn)練時(shí)間變長(zhǎng)了。 我們還獲得了一個(gè)新旋鈕:讓 AI 思考得久一點(diǎn)。OpenAI 的 o1 是開(kāi)端,而 o3 則是真正的拐點(diǎn)。

2. 幽靈 vs 動(dòng)物:AI 不是「電子寵物」

2025 年,我和整個(gè)行業(yè)終于從直覺(jué)上理解了 LLM 智能的「形狀」。

一個(gè)驚悚的比喻:我們不是在像養(yǎng)成寵物一樣訓(xùn)練模型,我們是在「召喚幽靈」。

為什么這么說(shuō)?

因?yàn)?AI 的一切都和生物不同。人類的大腦是為了在叢林里活下來(lái)、為了繁衍后代而優(yōu)化的;而 LLM 的大腦是為了模仿人類文字、在數(shù)學(xué)題里拿分、在競(jìng)技場(chǎng)里騙贊而優(yōu)化的。

參差不齊的智能(Jagged Intelligence):正是因?yàn)?RLVR(可驗(yàn)證獎(jiǎng)勵(lì))的存在,AI 的能力在某些領(lǐng)域(如數(shù)學(xué)、編程)會(huì)突然飆升成刺狀。這就導(dǎo)致了一種極其滑稽的現(xiàn)象:

它同時(shí)是一個(gè)絕世天才(秒解高數(shù)題);

又是一個(gè)智障小學(xué)生(會(huì)被簡(jiǎn)單的邏輯陷阱騙得團(tuán)團(tuán)轉(zhuǎn))。


這里 Karpathy 引用了一張梗圖:人類智能是圓潤(rùn)的藍(lán)色圓圈,AI 智能是像海膽一樣滿是尖刺的紅色圖形。這很形象.

這也解釋了為什么我對(duì)現(xiàn)在的「跑分榜單」(Benchmarks)失去了信任。

什么是「刷榜」的本質(zhì)?

既然榜單是可驗(yàn)證的,那就可以用 RLVR 針對(duì)性訓(xùn)練。現(xiàn)在的實(shí)驗(yàn)室都在搞「應(yīng)試教育」,把 AI 的能力尖刺專門往考題上長(zhǎng)。「在測(cè)試集上訓(xùn)練」已經(jīng)不僅僅是作弊,而成了一門新的藝術(shù)形式。

3. Cursor:不僅是編輯器,更是「包工頭」


Cursor 今年的爆火,揭示了一個(gè)新真相:LLM 應(yīng)用層比我們想象的要厚。

大家開(kāi)始談?wù)摗羔t(yī)療界的 Cursor」、「法律界的 Cursor」。這些應(yīng)用到底做了什么?

上下文工程師: 幫你整理好所有背景資料喂給 AI。

工頭: 在后臺(tái)偷偷指揮多個(gè) LLM 干活,把復(fù)雜任務(wù)拆解,還要幫你省錢。

遙控器: 給你一個(gè)調(diào)節(jié)「自主性」的滑塊,決定放手讓 AI 干多少。

預(yù)測(cè):大模型實(shí)驗(yàn)室(如 OpenAI)會(huì)負(fù)責(zé)培養(yǎng)「全科大學(xué)生」;而應(yīng)用開(kāi)發(fā)商(如 Cursor)則負(fù)責(zé)給這些學(xué)生提供私有數(shù)據(jù)和工具,把他們組建成「專業(yè)施工隊(duì)」。

4. Claude Code:住在你電腦里的「賽博幽靈」


Claude Code (CC) 的出現(xiàn)讓我眼前一亮。它不僅僅是一個(gè)能寫代碼的 Agent(智能體),更重要的是:它活在你的電腦里。

對(duì)比來(lái)看,我認(rèn)為 OpenAI 搞錯(cuò)了方向。

OpenAI 早期的 Agent 都在云端跑(ChatGPT),離你的真實(shí)環(huán)境太遠(yuǎn)。雖然云端智能體聽(tīng)起來(lái)像是 AGI 的終局,但在當(dāng)前這個(gè)「參差不齊」的過(guò)渡階段,本地才是王道。

為什么本地很重要?

因?yàn)槟愕拇a、你的配置、你的密鑰、你的混亂環(huán)境,都在本地。Anthropic(Claude 的母公司)搞對(duì)了優(yōu)先級(jí),他們把 AI 塞進(jìn)了一個(gè)小小的命令行界面(CLI)里。

它不再是你瀏覽器里的一個(gè)網(wǎng)頁(yè)(像 Google 那樣),它變成了一個(gè)寄宿在你電腦里的「賽博幽靈」,隨時(shí)準(zhǔn)備幫你干活。這才是未來(lái) AI 交互的樣子。

5. Vibe Coding

什么是 Vibe Coding?

這是我在推特上隨口造的一個(gè)詞(居然火了):意思是寫代碼不再需要你真的懂語(yǔ)法,你只需要用英語(yǔ)描述你的「意圖」和「感覺(jué)」,剩下的交給 AI。

這帶來(lái)了什么改變?

對(duì)于普通人: 編程的門檻徹底消失了。

對(duì)于專家: 代碼變得像紙巾一樣「廉價(jià)、一次性、用完即棄」。

舉個(gè)例子,我為了找一個(gè) Bug,可能會(huì)讓 AI 現(xiàn)場(chǎng)寫一個(gè)專門的 App 來(lái)測(cè)試,測(cè)完就刪。放在以前,為了找個(gè) Bug 專門寫個(gè) App?瘋了吧!但在 2025 年,代碼是免費(fèi)的。

Vibe Coding 將會(huì)徹底重塑軟件行業(yè),也會(huì)改寫程序員的招聘 JD。

6. Nano Banana:基于大模型的 GUI 要來(lái)了


為什么現(xiàn)在的 AI 交互很反人類?

不管是 ChatGPT 還是 Claude,我們還在用「打字」跟它們聊天。這就像 80 年代還在用 DOS 命令行的黑底白字。

事實(shí)是: 計(jì)算機(jī)喜歡文本,但人類討厭讀文本。人類是視覺(jué)動(dòng)物,我們喜歡看圖、看表、看視頻。

Google Gemini Nano banana(這是一個(gè)虛構(gòu)的模型代號(hào),指代某種多模態(tài)交互模型)是 2025 年的另一個(gè)范式轉(zhuǎn)變。它暗示了未來(lái)的 LLM GUI(大模型圖形界面) 是什么樣子的。

未來(lái)的 AI 不應(yīng)該給你吐一堆字,它應(yīng)該直接給你畫一張圖、生成一個(gè)網(wǎng)頁(yè)、彈出一個(gè)交互面板。

這不僅僅是「畫圖」,而是將文本生成、邏輯推理和視覺(jué)表達(dá)糾纏在一起的混合能力。

歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知

我們正在招募伙伴

簡(jiǎn)歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
12生肖小人拼命想遠(yuǎn)離的3個(gè)生肖,財(cái)運(yùn)事業(yè)雙旺,惹不起

12生肖小人拼命想遠(yuǎn)離的3個(gè)生肖,財(cái)運(yùn)事業(yè)雙旺,惹不起

毅談生肖
2026-01-05 17:17:56
真是太雞肋了!火箭甚至都不敢讓第三中鋒多打一會(huì)兒?

真是太雞肋了!火箭甚至都不敢讓第三中鋒多打一會(huì)兒?

稻谷與小麥
2026-01-06 19:00:41
馬杜羅被綁后,中國(guó)牽頭金磚干大事,多國(guó)艦隊(duì)集結(jié),要?jiǎng)诱娓窳耍?>
    </a>
        <h3>
      <a href=愛(ài)吃醋的貓咪
2026-01-06 20:38:12
傅作義原本擬授上將,毛主席沒(méi)點(diǎn)頭,最終周總理親自找傅說(shuō)明原因

傅作義原本擬授上將,毛主席沒(méi)點(diǎn)頭,最終周總理親自找傅說(shuō)明原因

歷史龍?jiān)w
2026-01-05 08:55:07
破案!遭神仙球絕殺,杜鋒卻暴怒質(zhì)問(wèn)裁判原因找到,球迷說(shuō)出實(shí)情

破案!遭神仙球絕殺,杜鋒卻暴怒質(zhì)問(wèn)裁判原因找到,球迷說(shuō)出實(shí)情

后仰大風(fēng)車
2026-01-05 23:18:43
美國(guó)衰落,就是一個(gè)巨大的謊言

美國(guó)衰落,就是一個(gè)巨大的謊言

楓冷慕詩(shī)
2026-01-06 12:28:30
云盡孝8年后:她被加拿大市長(zhǎng)拋棄,樣貌大變,遇到國(guó)人慌忙躲避

云盡孝8年后:她被加拿大市長(zhǎng)拋棄,樣貌大變,遇到國(guó)人慌忙躲避

歸客歷史
2025-12-29 09:03:35
美國(guó)下個(gè)目標(biāo)公開(kāi),不是伊朗或古巴,盟友聽(tīng)后感覺(jué)天塌了

美國(guó)下個(gè)目標(biāo)公開(kāi),不是伊朗或古巴,盟友聽(tīng)后感覺(jué)天塌了

歷史有些冷
2026-01-05 21:00:07
國(guó)羽4勝1負(fù)!世界第1收退賽禮,混雙00后逆轉(zhuǎn),男雙組合1輪游!

國(guó)羽4勝1負(fù)!世界第1收退賽禮,混雙00后逆轉(zhuǎn),男雙組合1輪游!

劉姚堯的文字城堡
2026-01-06 14:40:28
羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

瓜汁橘長(zhǎng)Dr
2025-12-29 11:29:56
高市新年首次喊中國(guó)對(duì)話,不到24小時(shí),中方用對(duì)日反制作出回應(yīng)

高市新年首次喊中國(guó)對(duì)話,不到24小時(shí),中方用對(duì)日反制作出回應(yīng)

時(shí)時(shí)有聊
2026-01-06 20:52:09
房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費(fèi),80塊錢就能搞定

房產(chǎn)證上的人去世了,繼承別再花大幾千的公證費(fèi),80塊錢就能搞定

室內(nèi)設(shè)計(jì)師有料兒
2025-12-07 16:05:28
李小孩的“小綠瓶”,在國(guó)博很沒(méi)存在感,為何永久禁止出境?

李小孩的“小綠瓶”,在國(guó)博很沒(méi)存在感,為何永久禁止出境?

收藏大視界
2026-01-04 17:32:26
在美國(guó)的馬杜羅沒(méi)想到,副總統(tǒng)只扛了一天,就帶領(lǐng)全國(guó)人民投降了

在美國(guó)的馬杜羅沒(méi)想到,副總統(tǒng)只扛了一天,就帶領(lǐng)全國(guó)人民投降了

瞳哥視界
2026-01-05 21:45:48
70歲成龍談母親離世:用盡辦法難阻求死

70歲成龍談母親離世:用盡辦法難阻求死

楓塵余往逝
2026-01-06 07:12:22
中國(guó)海警亮出最新海報(bào),登船扣押海馬斯?賴清德喊出兩個(gè)“不”

中國(guó)海警亮出最新海報(bào),登船扣押海馬斯?賴清德喊出兩個(gè)“不”

趣生活
2026-01-06 20:55:32
余承東親臨廣汽番禺總部,與廣汽簽署華為終端全面合作

余承東親臨廣汽番禺總部,與廣汽簽署華為終端全面合作

汽車說(shuō)刊
2026-01-05 21:36:03
美國(guó)破防也沒(méi)轍,抓捕馬杜羅不到24小時(shí),中國(guó)牽頭辦金磚聯(lián)合軍演

美國(guó)破防也沒(méi)轍,抓捕馬杜羅不到24小時(shí),中國(guó)牽頭辦金磚聯(lián)合軍演

說(shuō)歷史的老牢
2026-01-05 11:06:35
【荷蘭】荷蘭電網(wǎng)運(yùn)營(yíng)商:對(duì)智能電表中的中國(guó)部件無(wú)需過(guò)度擔(dān)憂

【荷蘭】荷蘭電網(wǎng)運(yùn)營(yíng)商:對(duì)智能電表中的中國(guó)部件無(wú)需過(guò)度擔(dān)憂

一網(wǎng)荷蘭
2026-01-06 02:07:41
誰(shuí)會(huì)是下一個(gè)委內(nèi)瑞拉?起底美國(guó)軍事干涉顛覆的黑手

誰(shuí)會(huì)是下一個(gè)委內(nèi)瑞拉?起底美國(guó)軍事干涉顛覆的黑手

澎湃新聞
2026-01-06 15:14:12
2026-01-06 21:52:49
AppSo incentive-icons
AppSo
讓智能手機(jī)更好用的秘密
5992文章數(shù) 26739關(guān)注度
往期回顧 全部

科技要聞

速看!黃仁勛萬(wàn)字實(shí)錄:甩出"物理AI"王牌

頭條要聞

媒體:美軍跨國(guó)突擊委 與4年前俄軍行動(dòng)形成鮮明對(duì)比

頭條要聞

媒體:美軍跨國(guó)突擊委 與4年前俄軍行動(dòng)形成鮮明對(duì)比

體育要聞

從NBA最菜首發(fā)控衛(wèi),到NBA最強(qiáng)喬治

娛樂(lè)要聞

2026年央視春晚彩排照曝光!

財(cái)經(jīng)要聞

價(jià)格跳水、轉(zhuǎn)型不易 陳華也難救茅臺(tái)?

汽車要聞

摩登出街潮品 實(shí)拍奇瑞QQ冰淇淋女王版

態(tài)度原創(chuàng)

游戲
教育
時(shí)尚
房產(chǎn)
軍事航空

前R星總監(jiān)直言:GTA離開(kāi)美國(guó)不現(xiàn)實(shí)!

教育要聞

收藏!2025中國(guó)高校在山東最低錄取分?jǐn)?shù)(含普通計(jì)劃和中外合作)

冬天,“大衣”是中年女人的穿搭剛需,這樣搭配時(shí)髦提氣質(zhì)

房產(chǎn)要聞

爆發(fā)!三亞開(kāi)年超千畝城更計(jì)劃曝光,香港城砸下100億!

軍事要聞

美稱對(duì)“占領(lǐng)”委內(nèi)瑞拉保留選擇權(quán)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版