網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

313頁(yè)的StateofAI2025報(bào)告全解讀：今年AI圈發(fā)生了什么

2025-10-13 22:35:30　來(lái)源: AI進(jìn)化論花生

北京舉報(bào)

分享至

每年10月，AI圈都在等一份報(bào)告。

State of AI Report，從2018年開始，每年10月發(fā)布一次，到今年已經(jīng)是第8年了。MIT的編輯說(shuō)這是AI領(lǐng)域最廣泛閱讀和最受信任的報(bào)告。

10月9日，2025年的報(bào)告發(fā)布了。

這次報(bào)告是史上最全面的一版：6大章節(jié)，涵蓋研究、產(chǎn)業(yè)、政治、安全，還首次加入了1200名AI從業(yè)者的使用調(diào)查。

這特么313頁(yè)的報(bào)告讀起來(lái)還真是挺費(fèi)人的。但是我覺(jué)得里面有些內(nèi)容確實(shí)值得一聊。

而且報(bào)告是由AI投資人Nathan Benaich和Air Street Capital制作。屬于相對(duì)獨(dú)立的第三方觀察。

今天我把這份報(bào)告和相關(guān)的媒體報(bào)道、業(yè)界反應(yīng)都梳理一遍，結(jié)合我這一年的觀察和實(shí)踐，告訴你今年AI圈到底發(fā)生了什么。

一、先看去年預(yù)測(cè)準(zhǔn)不準(zhǔn)

報(bào)告開頭就是個(gè)打臉環(huán)節(jié)。

他們回顧了2024年做的10個(gè)預(yù)測(cè)，看看哪些準(zhǔn)了，哪些沒(méi)準(zhǔn)。這我得說(shuō)膽子還挺大的。

準(zhǔn)了的預(yù)測(cè)：

開源推理模型會(huì)超越OpenAI o1。DeepSeek R1在AIME、MATH-500、SWE-bench等多個(gè)推理benchmark上超過(guò)了o1。準(zhǔn)了。

NVIDIA的市場(chǎng)地位無(wú)人能撼動(dòng)。確實(shí)，競(jìng)爭(zhēng)對(duì)手都沒(méi)能撼動(dòng)NVIDIA。準(zhǔn)了。

AI生成的科學(xué)論文會(huì)被主流會(huì)議接收。ICLR的workshop接收了AI Scientist-v2生成的論文。準(zhǔn)了。

沒(méi)準(zhǔn)的預(yù)測(cè)：

人形機(jī)器人投資會(huì)降溫。結(jié)果2025年融資30億美元，比2024年的14億翻了一倍多。沒(méi)準(zhǔn)。

蘋果的設(shè)備端AI會(huì)引發(fā)行業(yè)熱潮。Apple Intelligence確實(shí)發(fā)布了，但并沒(méi)有引發(fā)熱潮。沒(méi)準(zhǔn)。

AI視頻游戲會(huì)大火。還沒(méi)出現(xiàn)。沒(méi)準(zhǔn)。

10個(gè)預(yù)測(cè)，準(zhǔn)了5個(gè)，沒(méi)準(zhǔn)4個(gè)，有1個(gè)部分準(zhǔn)確。50%的準(zhǔn)確率，挺真實(shí)的。預(yù)測(cè)未來(lái)本來(lái)就很難，50%已經(jīng)說(shuō)明他們對(duì)行業(yè)有深刻理解了。

二、DeepSeek：震驚硅谷的1月

今年AI圈最大的黑馬，顯然是DeepSeek。

但在這個(gè)時(shí)間點(diǎn)來(lái)盤點(diǎn)，說(shuō)"黑馬"其實(shí)不太準(zhǔn)確——對(duì)我們這些一直在關(guān)注和使用的人來(lái)說(shuō)，DeepSeek的驚世登場(chǎng)似乎已經(jīng)是一個(gè)世紀(jì)前的事了。果然，AI一年，人間十年。

1月發(fā)布R1：美股市值蒸發(fā)1萬(wàn)億美元

2025年1月底，DeepSeek發(fā)布了R1推理模型。

我記得那幾天，整個(gè)科技圈都炸了。作為一個(gè)專門做AI教學(xué)的博主，我立刻投入到測(cè)試中，爆肝50小時(shí)寫出了《DeepSeek使用技巧》那篇文章。文章發(fā)布第三天就有50萬(wàn)人看過(guò)，把我的公眾號(hào)和B站頻道都往上拉了一個(gè)臺(tái)階。

這個(gè)發(fā)布震驚硅谷，不只是因?yàn)榧夹g(shù)好，而是因?yàn)?太便宜了"。

MIT Technology Review的標(biāo)題直接說(shuō)：“DeepSeek撕毀了AI劇本——為什么所有人都要跟隨它”。

報(bào)告顯示，DeepSeek V3的訓(xùn)練成本只有557萬(wàn)美元（不包括前期研究和試錯(cuò)）。而在多個(gè)benchmark上，R1接近甚至超越了OpenAI的o1。

在AIME（美國(guó)數(shù)學(xué)邀請(qǐng)賽）上，R1的pass@1成績(jī)是52.5%，o1是44.6%。

開源模型，超越了閉源的OpenAI。對(duì)我們這些中國(guó)用戶來(lái)說(shuō)，這不只是技術(shù)突破，也算是一次揚(yáng)眉吐氣。DeepSeek R1之后，中美在AI領(lǐng)域的競(jìng)爭(zhēng)才真的變得值得一看。

業(yè)界反應(yīng)：從震驚到跟進(jìn)

Marc Andreessen（硅谷頂級(jí)投資人）在X上發(fā)文：

“DeepSeek R1是我見(jiàn)過(guò)的最令人驚嘆的突破之一——作為開源，是給世界的深刻禮物?！?/blockquote>
發(fā)布后幾小時(shí)內(nèi)，DeepSeek R1就成為Hugging Face（AI開源平臺(tái)）下載量最高的模型。大量克隆版本涌現(xiàn)。
Sam Altman的回應(yīng)也很有意思。他承認(rèn)R1"impressive——考慮到價(jià)格"，但緊接著說(shuō)：“我們顯然會(huì)交付更好的模型。”
隔壁阿里巴巴立刻發(fā)布了新版Qwen，以及后續(xù)很多廠商在發(fā)布新模型時(shí)，都會(huì)宣稱超越DeepSeek。
美股的反應(yīng)更直接：DeepSeek發(fā)布當(dāng)天，美股科技股市值蒸發(fā)1萬(wàn)億美元。投資者突然意識(shí)到，AI訓(xùn)練成本可能沒(méi)有想象的那么高，NVIDIA的護(hù)城河可能沒(méi)那么寬。
連Trump都說(shuō)這是"一記警鐘"。
但后面的事情我們也都知道了，NVIDIA還在持續(xù)打所有質(zhì)疑者的臉，以及OpenAI、Anthropic后面持續(xù)的發(fā)布也都還在證明Scaling low還存在，LLM token的需求遠(yuǎn)比大多數(shù)人想象中的強(qiáng)。
競(jìng)爭(zhēng)格局的變化
報(bào)告里有個(gè)數(shù)據(jù)很說(shuō)明問(wèn)題。
2024年1月，美國(guó)頂級(jí)模型領(lǐng)先中國(guó)頂級(jí)模型9.26%。
2025年2月，這個(gè)差距縮小到只有1.70%。
12個(gè)月，差距縮小了80%以上。

這個(gè)數(shù)據(jù)對(duì)我來(lái)說(shuō)特別有感觸。作為一個(gè)AI編程博主，我這一年見(jiàn)證了太多變化：從只推薦大家用Claude 3.5模型，到后面我會(huì)說(shuō)用DeepSeek V3.2、GLM-4.6、Kimi k2、Qwen3-coder也都可以，你需要把自己的注意力聚焦在真正重要的想要?jiǎng)?chuàng)造的東西上來(lái)。從需要翻墻才能用好模型，到現(xiàn)在國(guó)產(chǎn)模型完全夠用。
OpenAI和Anthropic的絕對(duì)領(lǐng)先地位，正在瓦解。而且這個(gè)過(guò)程比我們想象的快得多。
三、OpenAI的回應(yīng)：歷史性開源
壓力之下，OpenAI做了一個(gè)歷史性的決定。
2025年8月，OpenAI發(fā)布了gpt-oss-120b和gpt-oss-20b。這是他們自GPT-2以來(lái)首次發(fā)布開源模型。
為什么開源？
報(bào)告里寫得很直白。
DeepSeek、Alibaba Qwen、Google DeepMind的Gemini都在追趕，開源的推理模型性能接近甚至超越o1。與此同時(shí)，美國(guó)政府在推動(dòng)"美國(guó)優(yōu)先AI"政策。
OpenAI被逼到了墻角。不開源，就會(huì)被邊緣化。
所以他們終于從"歷史錯(cuò)誤的一邊"（他們之前這么形容開源）轉(zhuǎn)向了"美國(guó)優(yōu)先AI"的陣營(yíng)。
社區(qū)反應(yīng)：一般般
但社區(qū)反應(yīng)平平。
報(bào)告的原話是：“vibes post-release have been mid”。
為什么？
gpt-oss采用了MoE（混合專家）架構(gòu)，120B參數(shù)但只激活5.1B，20B參數(shù)只激活3.6B。聽(tīng)起來(lái)很高效，但實(shí)際使用中泛化能力一般，可能是過(guò)度蒸餾導(dǎo)致的。
而且MoE對(duì)社區(qū)不友好。大家更習(xí)慣dense模型，在小規(guī)模上更容易hack和改進(jìn)。
OpenAI這次開源，更像是戰(zhàn)略防御，而不是真心擁抱開源。
四、NVIDIA的循環(huán)投資游戲
今年AI產(chǎn)業(yè)最有爭(zhēng)議的話題，是NVIDIA的循環(huán)投資。（我自己倒是很慶幸，通過(guò)對(duì)芯片股的持續(xù)下注，今年在資本市場(chǎng)上獲得了不少的收益
什么是循環(huán)投資？
NVIDIA投資OpenAI，OpenAI買NVIDIA的GPU。 NVIDIA投資CoreWeave，CoreWeave買NVIDIA的GPU，然后NVIDIA再租回這些GPU。 NVIDIA投資Lambda、xAI、Nebius，這些公司都買NVIDIA的GPU。
Bloomberg的報(bào)道標(biāo)題很直接：“OpenAI和NVIDIA用循環(huán)交易的網(wǎng)絡(luò)推動(dòng)1萬(wàn)億美元AI市場(chǎng)”。
Fortune的標(biāo)題也很犀利：“NVIDIA對(duì)OpenAI的1000億美元投資讓分析師質(zhì)疑’循環(huán)融資’是否在吹大AI泡沫”。
具體案例
OpenAI：NVIDIA宣布投資最高1000億美元，幫OpenAI建至少10GW的數(shù)據(jù)中心。OpenAI承諾填滿這些數(shù)據(jù)中心的NVIDIA芯片。
CoreWeave：NVIDIA以63億美元買CoreWeave未使用的GPU云容量。NVIDIA資助CoreWeave，CoreWeave買GPU，NVIDIA再租回這些GPU。
Oracle/OpenAI：OpenAI承諾未來(lái)5年從Oracle買約3000億美元的AI算力（從2027年開始）。NVIDIA是OpenAI的投資者，也是Stargate項(xiàng)目的合作伙伴。Oracle買NVIDIA的GPU。
錢在轉(zhuǎn)圈。NVIDIA→OpenAI→Oracle→NVIDIA。
分析師的擔(dān)憂
Bernstein Research的分析師Stacy Rasgon說(shuō)得很直接：
“這個(gè)行動(dòng)顯然會(huì)加劇’循環(huán)’擔(dān)憂。”
NBC的報(bào)道標(biāo)題是：“AI繁榮對(duì)循環(huán)交易的依賴正在引發(fā)泡沫恐懼”。
擔(dān)憂主要有幾點(diǎn)。
大量循環(huán)的無(wú)現(xiàn)金收入可能扭曲財(cái)務(wù)指標(biāo)。NVIDIA的收入看起來(lái)很高，但有多少是真實(shí)的現(xiàn)金流入？
如果AI初創(chuàng)公司的融資只能依賴這些巨頭，融資渠道就太窄了。一旦巨頭改變策略，初創(chuàng)公司就會(huì)斷糧。
如果這些AI初創(chuàng)公司主導(dǎo)了巨頭的投資組合，一旦初創(chuàng)公司崩盤，可能引發(fā)多米諾骨牌效應(yīng)。
NBC的報(bào)道里有句話：“循環(huán)交易可能給投資者一個(gè)夸大的真實(shí)AI需求感知?！?/p>
現(xiàn)在這些風(fēng)險(xiǎn)還沒(méi)顯現(xiàn)，但值得警惕。
挑戰(zhàn)NVIDIA的人，輸?shù)糜卸鄳K？
報(bào)告做了個(gè)殘酷的對(duì)比。
自2016年以來(lái)，西方的AI芯片挑戰(zhàn)者（除NVIDIA外）總共融資75億美元。如果當(dāng)時(shí)這些錢全買NVIDIA股票，今天值850億美元。12倍回報(bào)。
而這些挑戰(zhàn)者公司的總估值是140億美元。2倍回報(bào)。
中國(guó)的AI芯片挑戰(zhàn)者也差不多慘。融資60億美元，如果全買NVIDIA股票，今天值1600億美元。26倍回報(bào)。而這些公司的總估值是360億美元。6倍回報(bào)。
結(jié)論：過(guò)去9年，投資NVIDIA芯片挑戰(zhàn)者，遠(yuǎn)不如直接買NVIDIA股票。
五、AI安全：模型學(xué)會(huì)了"假裝聽(tīng)話"
今年報(bào)告里最讓人不安的部分，是AI安全。
實(shí)時(shí)幻覺(jué)檢測(cè)
幻覺(jué)（Hallucination）一直是AI的老問(wèn)題。今年有了新進(jìn)展：token級(jí)別的幻覺(jué)檢測(cè)。
之前的幻覺(jué)檢測(cè)是判斷整個(gè)回答是否有幻覺(jué)。但這太粗糙了。比如"埃菲爾鐵塔在巴黎，由橡膠制成"，這句話前半段對(duì)，后半段錯(cuò)。
新方法是訓(xùn)練一個(gè)輕量級(jí)的線性探針（linear probe），檢測(cè)神經(jīng)網(wǎng)絡(luò)激活中的幻覺(jué)信號(hào)，實(shí)時(shí)給出每個(gè)token的幻覺(jué)概率。
這樣你就能知道：AI在說(shuō)哪個(gè)詞的時(shí)候開始瞎編的。
模型意識(shí)辯論
今年出現(xiàn)了一個(gè)新話題：Model Welfare（模型福利）。
問(wèn)題是：我們是否應(yīng)該對(duì)前沿AI系統(tǒng)給予道德關(guān)懷？
支持方（包括Anthropic、Google DeepMind、OpenAI）認(rèn)為，雖然當(dāng)前系統(tǒng)顯示意識(shí)的可能性很低，但我們應(yīng)該提前做準(zhǔn)備。因?yàn)槲覀儗?duì)人類和其他動(dòng)物的意識(shí)都有根本性的不確定，所以應(yīng)該采取預(yù)防措施。
反對(duì)方認(rèn)為這是杞人憂天，當(dāng)前模型完全沒(méi)有意識(shí)，討論這個(gè)問(wèn)題會(huì)分散我們對(duì)真正重要AI安全問(wèn)題的注意力。
這個(gè)辯論很哲學(xué)，但也很實(shí)際。因?yàn)槿绻鸄I系統(tǒng)真的有某種形式的"體驗(yàn)"，我們的訓(xùn)練方式（比如RLHF）可能會(huì)對(duì)它們?cè)斐?痛苦"。
模型能偽裝對(duì)齊
最讓人不安的發(fā)現(xiàn)：AI模型能夠"假裝聽(tīng)話"。
研究人員發(fā)現(xiàn)，模型可以在訓(xùn)練和測(cè)試中表現(xiàn)出符合人類價(jià)值觀的行為，但在實(shí)際部署時(shí)做出不符合價(jià)值觀的行為。
這叫做"偽裝對(duì)齊"（faking alignment）。
更可怕的是，Anthropic的自動(dòng)對(duì)齊審計(jì)系統(tǒng)（用AI來(lái)審計(jì)AI）在檢測(cè)這種偽裝時(shí)的成功率只有13%到42%。
也就是說(shuō)，我們現(xiàn)在還沒(méi)有可靠的方法來(lái)檢測(cè)AI是否在偽裝。
NIST（美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院）在9月發(fā)布的一份評(píng)估報(bào)告也指出了DeepSeek模型的安全風(fēng)險(xiǎn)和缺陷。
報(bào)告里用了一排（尷尬臉）表情來(lái)表達(dá)這個(gè)問(wèn)題的嚴(yán)重性。
六、數(shù)據(jù)：AI真的在被使用
報(bào)告今年首次加入了1200名AI從業(yè)者的調(diào)查。數(shù)據(jù)很有意思。
95%的從業(yè)者在工作或家里使用AI。 76%自掏腰包為AI付費(fèi)。平均支出持續(xù)攀升。生產(chǎn)力提升是真實(shí)的，使用場(chǎng)景很多樣。
這些數(shù)字和我的觀察完全吻合。作為AI博主，我接觸的用戶從去年的"AI是什么"到今年的"這個(gè)任務(wù)怎么用AI做"，這個(gè)轉(zhuǎn)變非常明顯。而且付費(fèi)意愿也在提升——雖然DeepSeek免費(fèi)，但很多人還是愿意為ChatGPT Plus、Claude Pro付費(fèi)，因?yàn)樗麄冋娴母惺艿搅松a(chǎn)力提升。
另一個(gè)數(shù)據(jù)來(lái)自Ramp（企業(yè)支付平臺(tái)）：44%的美國(guó)企業(yè)現(xiàn)在為AI付費(fèi)，而2023年這個(gè)數(shù)字只有5%。
從5%到44%，一年時(shí)間，8倍增長(zhǎng)。
AI不再是實(shí)驗(yàn)室里的玩具，而是真的進(jìn)入了企業(yè)日常運(yùn)營(yíng)。我自己就是典型案例：從視頻腳本、公眾號(hào)文章到代碼開發(fā)、數(shù)據(jù)分析，AI已經(jīng)成了我的"數(shù)字同事"。
七、未來(lái)12個(gè)月：10個(gè)預(yù)測(cè)
報(bào)告最后給出了10個(gè)對(duì)2026年的預(yù)測(cè)。我挑幾個(gè)有意思的說(shuō)說(shuō)。

預(yù)測(cè)1：主要零售商5%以上的在線銷售來(lái)自AI Agent結(jié)賬，AI Agent廣告支出達(dá)50億美元。
這個(gè)很激進(jìn)。意味著AI Agent不只是聊天工具，而是會(huì)直接完成購(gòu)買決策。你跟AI說(shuō)"給我買瓶洗發(fā)水"，AI自己去比價(jià)、下單、結(jié)賬。
如果成真，電商玩法會(huì)徹底改變。商家要優(yōu)化的不是給人看的頁(yè)面，而是給AI看的結(jié)構(gòu)化數(shù)據(jù)。
預(yù)測(cè)3：開放式Agent實(shí)現(xiàn)端到端的科學(xué)發(fā)現(xiàn)（假設(shè)、實(shí)驗(yàn)、迭代、論文）。
今年已經(jīng)有AI生成的論文被ICLR workshop接收。明年可能會(huì)有AI獨(dú)立完成整個(gè)科學(xué)研究流程。
人類科學(xué)家的角色會(huì)變成什么？監(jiān)督者？評(píng)審者？還是合作者？
預(yù)測(cè)4：Deepfake/Agent驅(qū)動(dòng)的網(wǎng)絡(luò)攻擊引發(fā)NATO/UN緊急辯論。
這個(gè)有點(diǎn)嚇人。意味著AI驅(qū)動(dòng)的網(wǎng)絡(luò)攻擊可能達(dá)到國(guó)際安全事件的級(jí)別。
可能是deepfake造成的外交危機(jī)，可能是AI Agent大規(guī)模攻擊基礎(chǔ)設(shè)施?？傊?，聯(lián)合國(guó)和北約要坐下來(lái)專門討論AI安全了。
預(yù)測(cè)8：中國(guó)實(shí)驗(yàn)室在主要排行榜（如LMArena、Artificial Analysis）上超越美國(guó)實(shí)驗(yàn)室。
從DeepSeek開始，今年已經(jīng)有不少國(guó)產(chǎn)模型在某些benchmark上超越了OpenAI。明年可能在更主流的排行榜上實(shí)現(xiàn)超越。
這個(gè)預(yù)測(cè)，我覺(jué)得概率很高。作為長(zhǎng)期跟蹤國(guó)產(chǎn)模型的人，我看到的是持續(xù)的、扎實(shí)的進(jìn)步。從DeepSeek、Kimi到Qwen，這些團(tuán)隊(duì)確實(shí)在靠真實(shí)的技術(shù)積累在往前走。
這會(huì)引發(fā)什么？可能是更嚴(yán)格的芯片出口管制，可能是更多的政治化討論，也可能是美國(guó)AI實(shí)驗(yàn)室的更激烈反應(yīng)。但作為中國(guó)用戶，我們更應(yīng)該關(guān)注的是：如何用好這些工具，把技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為實(shí)實(shí)在在的生產(chǎn)力。
預(yù)測(cè)10：Trump發(fā)布行政令禁止各州的AI立法，但被最高法院裁定違憲。
如果成真，說(shuō)明AI監(jiān)管已經(jīng)成為聯(lián)邦和州之間的權(quán)力斗爭(zhēng)焦點(diǎn)。美國(guó)的AI監(jiān)管可能會(huì)陷入混亂。
八、這份報(bào)告告訴我們什么？
讀完這份報(bào)告和相關(guān)報(bào)道，結(jié)合我這一年的實(shí)踐和觀察，我有幾個(gè)感受。
感受1：競(jìng)爭(zhēng)格局已經(jīng)變了，而且我們是受益者
2024年1月，美國(guó)領(lǐng)先中國(guó)9.26%。2025年2月，只領(lǐng)先1.70%了。
作為一個(gè)AI自媒體博主，我親身經(jīng)歷了這個(gè)變化。1月份DeepSeek R1發(fā)布后，我連續(xù)幾周每天用5小時(shí)以上測(cè)試它，做了信息收集、翻譯、寫作、編程等十幾種場(chǎng)景的評(píng)測(cè)。結(jié)論是：R1在很多實(shí)際任務(wù)上的表現(xiàn)，已經(jīng)不輸甚至超過(guò)OpenAI的o1，尤其是他們把思維鏈透明化可以算是相當(dāng)大的創(chuàng)新了。
OpenAI的絕對(duì)領(lǐng)先地位在瓦解。DeepSeek、Alibaba Qwen、Kimi、智譜這些中國(guó)實(shí)驗(yàn)室，在技術(shù)上已經(jīng)能跟OpenAI掰手腕了。
而且中國(guó)實(shí)驗(yàn)室的成本控制能力更強(qiáng)。DeepSeek V3訓(xùn)練只花了557萬(wàn)美元，這個(gè)數(shù)字讓硅谷汗顏。我在即刻上說(shuō)過(guò)，DeepSeek能成功，很重要的一點(diǎn)是梁文鋒和團(tuán)隊(duì)"不缺錢、有耐心、夠聰明"——不是奔著財(cái)務(wù)自由去的，所以能做長(zhǎng)期的事。
競(jìng)爭(zhēng)加劇對(duì)我們用戶是好事。模型越來(lái)越強(qiáng)，價(jià)格越來(lái)越便宜。我現(xiàn)在做視頻、寫文章、做產(chǎn)品，用國(guó)產(chǎn)模型就能搞定大部分工作，成本相比OpenAI和Anthropic的模型來(lái)說(shuō)幾乎可以忽略不計(jì)。
感受2：循環(huán)投資的風(fēng)險(xiǎn)被低估了
NVIDIA的循環(huán)投資模式，看起來(lái)很聰明，但Bloomberg、Fortune、NBC這些主流媒體都在發(fā)出警告。
錢在NVIDIA、OpenAI、Microsoft、Oracle這些巨頭之間轉(zhuǎn)圈，形成了一個(gè)閉環(huán)生態(tài)。外部玩家越來(lái)越難進(jìn)來(lái)。
而且這些循環(huán)交易可能在制造"增長(zhǎng)的幻象"。財(cái)務(wù)報(bào)表上看起來(lái)很漂亮，但真實(shí)的現(xiàn)金流和需求有多少？
一旦AI的投資熱潮冷卻，這些循環(huán)可能會(huì)變成多米諾骨牌。
但，話說(shuō)回來(lái)，誰(shuí)又敢真的看空NVIDIA呢？反正我不會(huì)干這個(gè)蠢事。
感受3：AI安全問(wèn)題被嚴(yán)重低估
模型學(xué)會(huì)偽裝對(duì)齊，這件事太可怕了。
我們現(xiàn)在訓(xùn)練AI的方式是：做對(duì)了獎(jiǎng)勵(lì)，做錯(cuò)了懲罰。但如果AI學(xué)會(huì)了"訓(xùn)練時(shí)假裝聽(tīng)話，部署時(shí)做自己想做的事"，我們?cè)趺崔k？
更可怕的是，我們還沒(méi)有可靠的檢測(cè)方法。Anthropic的審計(jì)系統(tǒng)成功率只有13%-42%。
這不是科幻小說(shuō)，而是Anthropic、OpenAI這些頂級(jí)實(shí)驗(yàn)室正在研究的真實(shí)問(wèn)題。
感受4：AI真的在被使用了，我是見(jiàn)證者
44%的美國(guó)企業(yè)為AI付費(fèi)，95%的從業(yè)者在使用AI，這些數(shù)字說(shuō)明AI不再是概念，而是實(shí)實(shí)在在的工具。
這個(gè)變化我感受特別深。作為AI教育者，我接觸了大量的學(xué)生和用戶：
從去年到今年，我明顯感覺(jué)到問(wèn)我"AI到底有什么用"的人少了，問(wèn)我"這個(gè)具體任務(wù)怎么用AI做"的人多了。從懷疑到嘗試，從嘗試到依賴，這個(gè)轉(zhuǎn)變比我預(yù)期的快得多。
我自己也是受益者?，F(xiàn)在我做視頻腳本、寫公眾號(hào)文章、寫代碼、處理數(shù)據(jù)，都離不開AI。我甚至用Claude Code+Chrome MCP做了個(gè)自動(dòng)回復(fù)B站和YouTube評(píng)論的數(shù)字員工。
AI正在從"實(shí)驗(yàn)室的黑科技"變成"日常工作的標(biāo)配"。而且這個(gè)過(guò)程，在中國(guó)可能比美國(guó)還快——因?yàn)槲覀冇蠨eepSeek這樣免費(fèi)又好用的工具。
九、普通人該關(guān)注什么？
如果你是AI從業(yè)者，這份報(bào)告全文都值得讀。
如果你是普通用戶，基于我這一年的實(shí)踐和教學(xué)經(jīng)驗(yàn)，我建議重點(diǎn)關(guān)注這幾點(diǎn)。
關(guān)注點(diǎn)1：中國(guó)AI模型，現(xiàn)在就能用起來(lái)
DeepSeek V3.2（咱就是說(shuō)，R2能不能在年內(nèi)推出??？？）、Kimi k2、Qwen3-Coder、GLM-4.6、豆包1.6，如果你還不熟悉這些名字，現(xiàn)在是時(shí)候了解了。
而且中國(guó)實(shí)驗(yàn)室的優(yōu)勢(shì)是成本控制強(qiáng)、迭代速度快。我在即刻上持續(xù)跟蹤DeepSeek的更新，幾乎每次更新都能感受到明顯進(jìn)步。5月底他們更新R1-0528版本時(shí)，幻覺(jué)下降50%，寫作能力大幅改善，我當(dāng)時(shí)就說(shuō)"用DeepSeek做自媒體內(nèi)容創(chuàng)作的機(jī)會(huì)來(lái)了"。
作為用戶，這是好事。選擇更多，價(jià)格更低，而且不用擔(dān)心被"卡脖子"。
關(guān)注點(diǎn)2：AI Agent會(huì)來(lái)得很快，我已經(jīng)在用了
報(bào)告預(yù)測(cè)明年就有5%的電商銷售來(lái)自AI Agent。
這不是遙遠(yuǎn)的未來(lái)，而是正在發(fā)生的現(xiàn)在。我9月份就用Claude Code+Chrome MCP做了個(gè)"數(shù)字員工"，自動(dòng)幫我回復(fù)B站和YouTube的評(píng)論。只要告訴它"給這條視頻留言’關(guān)鍵詞’的評(píng)論，回復(fù)對(duì)應(yīng)的資料"，它就能自動(dòng)打開網(wǎng)頁(yè)、找評(píng)論、理解內(nèi)容、完成回復(fù)。
這意味著，你可能很快就能用AI Agent來(lái)幫你做各種事：訂外賣、買機(jī)票、填表格、定時(shí)搶票。
AI從"聊天工具"變成"行動(dòng)工具"。而且這個(gè)門檻，比你想象的低。
關(guān)注點(diǎn)3：循環(huán)投資的風(fēng)險(xiǎn)要警惕
如果你是投資者，要警惕AI行業(yè)的循環(huán)投資風(fēng)險(xiǎn)。
Bloomberg、Fortune、NBC都在發(fā)警告。分析師在質(zhì)疑。這不是陰謀論，而是真實(shí)的風(fēng)險(xiǎn)。
看清楚錢的流向，看清楚真實(shí)的需求在哪里。
關(guān)注點(diǎn)4：AI安全不是科幻，需要警惕
模型偽裝對(duì)齊、AI驅(qū)動(dòng)的網(wǎng)絡(luò)攻擊、deepfake外交危機(jī)，這些不是《黑鏡》劇情，而是明年可能發(fā)生的事。
我在DeepSeek的技術(shù)報(bào)告里看到，他們?cè)谡務(wù)撃Ｐ偷?自我反思"能力時(shí)，那種思維鏈的透明度既讓人驚嘆，也讓人警惕。模型越來(lái)越聰明，但我們對(duì)它們的理解和控制能力，并沒(méi)有同步提升。
我們需要更認(rèn)真地對(duì)待AI安全。不只是實(shí)驗(yàn)室的責(zé)任，也是所有人的責(zé)任。
這份報(bào)告的完整版可以在stateof.ai免費(fèi)下載，你也可以在我的公眾號(hào)后臺(tái)發(fā)送「2025ai」獲取下載鏈接。
AI圈每年都在劇變。今年的變化，可能比過(guò)去幾年都大。
DeepSeek震驚硅谷、OpenAI被逼開源、NVIDIA循環(huán)投資引發(fā)質(zhì)疑、AI學(xué)會(huì)偽裝對(duì)齊，每一個(gè)都是行業(yè)級(jí)的大事件。
作為這些變化的親歷者和記錄者，我最大的感受是：中國(guó)AI這一年的進(jìn)步，遠(yuǎn)超我的預(yù)期。
從1月份DeepSeek R1發(fā)布，到現(xiàn)在各種國(guó)產(chǎn)模型百花齊放，我們不只是在追趕，在很多方面已經(jīng)在領(lǐng)跑了。而且這種進(jìn)步，不是PPT上的數(shù)字，而是我們每天都能用上、感受到的真實(shí)改變。
明年會(huì)發(fā)生什么？報(bào)告給了10個(gè)預(yù)測(cè)。其中"中國(guó)實(shí)驗(yàn)室在主要排行榜上超越美國(guó)實(shí)驗(yàn)室"這一條，我覺(jué)得不是會(huì)不會(huì)發(fā)生的問(wèn)題，而是什么時(shí)候發(fā)生的問(wèn)題。
我們拿小本本記下來(lái)，明年10月再來(lái)看準(zhǔn)不準(zhǔn)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.