国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

313頁(yè)的StateofAI2025報(bào)告全解讀:今年AI圈發(fā)生了什么

0
分享至

每年10月,AI圈都在等一份報(bào)告。

State of AI Report,從2018年開始,每年10月發(fā)布一次,到今年已經(jīng)是第8年了。MIT的編輯說(shuō)這是AI領(lǐng)域最廣泛閱讀和最受信任的報(bào)告。

10月9日,2025年的報(bào)告發(fā)布了。


這次報(bào)告是史上最全面的一版:6大章節(jié),涵蓋研究、產(chǎn)業(yè)、政治、安全,還首次加入了1200名AI從業(yè)者的使用調(diào)查。

這特么313頁(yè)的報(bào)告讀起來(lái)還真是挺費(fèi)人的。但是我覺(jué)得里面有些內(nèi)容確實(shí)值得一聊。

而且報(bào)告是由AI投資人Nathan Benaich和Air Street Capital制作。屬于相對(duì)獨(dú)立的第三方觀察。

今天我把這份報(bào)告和相關(guān)的媒體報(bào)道、業(yè)界反應(yīng)都梳理一遍,結(jié)合我這一年的觀察和實(shí)踐,告訴你今年AI圈到底發(fā)生了什么。

一、先看去年預(yù)測(cè)準(zhǔn)不準(zhǔn)

報(bào)告開頭就是個(gè)打臉環(huán)節(jié)。

他們回顧了2024年做的10個(gè)預(yù)測(cè),看看哪些準(zhǔn)了,哪些沒(méi)準(zhǔn)。這我得說(shuō)膽子還挺大的。


準(zhǔn)了的預(yù)測(cè)

開源推理模型會(huì)超越OpenAI o1。DeepSeek R1在AIME、MATH-500、SWE-bench等多個(gè)推理benchmark上超過(guò)了o1。準(zhǔn)了。

NVIDIA的市場(chǎng)地位無(wú)人能撼動(dòng)。確實(shí),競(jìng)爭(zhēng)對(duì)手都沒(méi)能撼動(dòng)NVIDIA。準(zhǔn)了。

AI生成的科學(xué)論文會(huì)被主流會(huì)議接收。ICLR的workshop接收了AI Scientist-v2生成的論文。準(zhǔn)了。

沒(méi)準(zhǔn)的預(yù)測(cè)

人形機(jī)器人投資會(huì)降溫。結(jié)果2025年融資30億美元,比2024年的14億翻了一倍多。沒(méi)準(zhǔn)。

蘋果的設(shè)備端AI會(huì)引發(fā)行業(yè)熱潮。Apple Intelligence確實(shí)發(fā)布了,但并沒(méi)有引發(fā)熱潮。沒(méi)準(zhǔn)。

AI視頻游戲會(huì)大火。還沒(méi)出現(xiàn)。沒(méi)準(zhǔn)。

10個(gè)預(yù)測(cè),準(zhǔn)了5個(gè),沒(méi)準(zhǔn)4個(gè),有1個(gè)部分準(zhǔn)確。50%的準(zhǔn)確率,挺真實(shí)的。預(yù)測(cè)未來(lái)本來(lái)就很難,50%已經(jīng)說(shuō)明他們對(duì)行業(yè)有深刻理解了。

二、DeepSeek:震驚硅谷的1月

今年AI圈最大的黑馬,顯然是DeepSeek。

但在這個(gè)時(shí)間點(diǎn)來(lái)盤點(diǎn),說(shuō)"黑馬"其實(shí)不太準(zhǔn)確——對(duì)我們這些一直在關(guān)注和使用的人來(lái)說(shuō),DeepSeek的驚世登場(chǎng)似乎已經(jīng)是一個(gè)世紀(jì)前的事了。果然,AI一年,人間十年。

1月發(fā)布R1:美股市值蒸發(fā)1萬(wàn)億美元

2025年1月底,DeepSeek發(fā)布了R1推理模型。

我記得那幾天,整個(gè)科技圈都炸了。作為一個(gè)專門做AI教學(xué)的博主,我立刻投入到測(cè)試中,爆肝50小時(shí)寫出了《DeepSeek使用技巧》那篇文章。文章發(fā)布第三天就有50萬(wàn)人看過(guò),把我的公眾號(hào)和B站頻道都往上拉了一個(gè)臺(tái)階。

這個(gè)發(fā)布震驚硅谷,不只是因?yàn)榧夹g(shù)好,而是因?yàn)?太便宜了"。

MIT Technology Review的標(biāo)題直接說(shuō):“DeepSeek撕毀了AI劇本——為什么所有人都要跟隨它”。

報(bào)告顯示,DeepSeek V3的訓(xùn)練成本只有557萬(wàn)美元(不包括前期研究和試錯(cuò))。而在多個(gè)benchmark上,R1接近甚至超越了OpenAI的o1。


在AIME(美國(guó)數(shù)學(xué)邀請(qǐng)賽)上,R1的pass@1成績(jī)是52.5%,o1是44.6%。

開源模型,超越了閉源的OpenAI。對(duì)我們這些中國(guó)用戶來(lái)說(shuō),這不只是技術(shù)突破,也算是一次揚(yáng)眉吐氣。DeepSeek R1之后,中美在AI領(lǐng)域的競(jìng)爭(zhēng)才真的變得值得一看。

業(yè)界反應(yīng):從震驚到跟進(jìn)

Marc Andreessen(硅谷頂級(jí)投資人)在X上發(fā)文:

“DeepSeek R1是我見(jiàn)過(guò)的最令人驚嘆的突破之一——作為開源,是給世界的深刻禮物?!?/blockquote>

發(fā)布后幾小時(shí)內(nèi),DeepSeek R1就成為Hugging Face(AI開源平臺(tái))下載量最高的模型。大量克隆版本涌現(xiàn)。

Sam Altman的回應(yīng)也很有意思。他承認(rèn)R1"impressive——考慮到價(jià)格",但緊接著說(shuō):“我們顯然會(huì)交付更好的模型。”

隔壁阿里巴巴立刻發(fā)布了新版Qwen,以及后續(xù)很多廠商在發(fā)布新模型時(shí),都會(huì)宣稱超越DeepSeek。

美股的反應(yīng)更直接:DeepSeek發(fā)布當(dāng)天,美股科技股市值蒸發(fā)1萬(wàn)億美元。投資者突然意識(shí)到,AI訓(xùn)練成本可能沒(méi)有想象的那么高,NVIDIA的護(hù)城河可能沒(méi)那么寬。

連Trump都說(shuō)這是"一記警鐘"。

但后面的事情我們也都知道了,NVIDIA還在持續(xù)打所有質(zhì)疑者的臉,以及OpenAI、Anthropic后面持續(xù)的發(fā)布也都還在證明Scaling low還存在,LLM token的需求遠(yuǎn)比大多數(shù)人想象中的強(qiáng)。

競(jìng)爭(zhēng)格局的變化

報(bào)告里有個(gè)數(shù)據(jù)很說(shuō)明問(wèn)題。

2024年1月,美國(guó)頂級(jí)模型領(lǐng)先中國(guó)頂級(jí)模型9.26%。

2025年2月,這個(gè)差距縮小到只有1.70%。

12個(gè)月,差距縮小了80%以上。


這個(gè)數(shù)據(jù)對(duì)我來(lái)說(shuō)特別有感觸。作為一個(gè)AI編程博主,我這一年見(jiàn)證了太多變化:從只推薦大家用Claude 3.5模型,到后面我會(huì)說(shuō)用DeepSeek V3.2、GLM-4.6、Kimi k2、Qwen3-coder也都可以,你需要把自己的注意力聚焦在真正重要的想要?jiǎng)?chuàng)造的東西上來(lái)。從需要翻墻才能用好模型,到現(xiàn)在國(guó)產(chǎn)模型完全夠用。

OpenAI和Anthropic的絕對(duì)領(lǐng)先地位,正在瓦解。而且這個(gè)過(guò)程比我們想象的快得多。

三、OpenAI的回應(yīng):歷史性開源

壓力之下,OpenAI做了一個(gè)歷史性的決定。

2025年8月,OpenAI發(fā)布了gpt-oss-120b和gpt-oss-20b。這是他們自GPT-2以來(lái)首次發(fā)布開源模型。

為什么開源?

報(bào)告里寫得很直白。

DeepSeek、Alibaba Qwen、Google DeepMind的Gemini都在追趕,開源的推理模型性能接近甚至超越o1。與此同時(shí),美國(guó)政府在推動(dòng)"美國(guó)優(yōu)先AI"政策。

OpenAI被逼到了墻角。不開源,就會(huì)被邊緣化。

所以他們終于從"歷史錯(cuò)誤的一邊"(他們之前這么形容開源)轉(zhuǎn)向了"美國(guó)優(yōu)先AI"的陣營(yíng)。

社區(qū)反應(yīng):一般般

但社區(qū)反應(yīng)平平。

報(bào)告的原話是:“vibes post-release have been mid”。

為什么?

gpt-oss采用了MoE(混合專家)架構(gòu),120B參數(shù)但只激活5.1B,20B參數(shù)只激活3.6B。聽(tīng)起來(lái)很高效,但實(shí)際使用中泛化能力一般,可能是過(guò)度蒸餾導(dǎo)致的。

而且MoE對(duì)社區(qū)不友好。大家更習(xí)慣dense模型,在小規(guī)模上更容易hack和改進(jìn)。

OpenAI這次開源,更像是戰(zhàn)略防御,而不是真心擁抱開源。

四、NVIDIA的循環(huán)投資游戲

今年AI產(chǎn)業(yè)最有爭(zhēng)議的話題,是NVIDIA的循環(huán)投資。(我自己倒是很慶幸,通過(guò)對(duì)芯片股的持續(xù)下注,今年在資本市場(chǎng)上獲得了不少的收益

什么是循環(huán)投資?

NVIDIA投資OpenAI,OpenAI買NVIDIA的GPU。 NVIDIA投資CoreWeave,CoreWeave買NVIDIA的GPU,然后NVIDIA再租回這些GPU。 NVIDIA投資Lambda、xAI、Nebius,這些公司都買NVIDIA的GPU。

Bloomberg的報(bào)道標(biāo)題很直接:“OpenAI和NVIDIA用循環(huán)交易的網(wǎng)絡(luò)推動(dòng)1萬(wàn)億美元AI市場(chǎng)”。

Fortune的標(biāo)題也很犀利:“NVIDIA對(duì)OpenAI的1000億美元投資讓分析師質(zhì)疑’循環(huán)融資’是否在吹大AI泡沫”。

具體案例

OpenAI:NVIDIA宣布投資最高1000億美元,幫OpenAI建至少10GW的數(shù)據(jù)中心。OpenAI承諾填滿這些數(shù)據(jù)中心的NVIDIA芯片。

CoreWeave:NVIDIA以63億美元買CoreWeave未使用的GPU云容量。NVIDIA資助CoreWeave,CoreWeave買GPU,NVIDIA再租回這些GPU。

Oracle/OpenAI:OpenAI承諾未來(lái)5年從Oracle買約3000億美元的AI算力(從2027年開始)。NVIDIA是OpenAI的投資者,也是Stargate項(xiàng)目的合作伙伴。Oracle買NVIDIA的GPU。

錢在轉(zhuǎn)圈。NVIDIA→OpenAI→Oracle→NVIDIA。

分析師的擔(dān)憂

Bernstein Research的分析師Stacy Rasgon說(shuō)得很直接:

“這個(gè)行動(dòng)顯然會(huì)加劇’循環(huán)’擔(dān)憂。”

NBC的報(bào)道標(biāo)題是:“AI繁榮對(duì)循環(huán)交易的依賴正在引發(fā)泡沫恐懼”。

擔(dān)憂主要有幾點(diǎn)。

大量循環(huán)的無(wú)現(xiàn)金收入可能扭曲財(cái)務(wù)指標(biāo)。NVIDIA的收入看起來(lái)很高,但有多少是真實(shí)的現(xiàn)金流入?

如果AI初創(chuàng)公司的融資只能依賴這些巨頭,融資渠道就太窄了。一旦巨頭改變策略,初創(chuàng)公司就會(huì)斷糧。

如果這些AI初創(chuàng)公司主導(dǎo)了巨頭的投資組合,一旦初創(chuàng)公司崩盤,可能引發(fā)多米諾骨牌效應(yīng)。

NBC的報(bào)道里有句話:“循環(huán)交易可能給投資者一個(gè)夸大的真實(shí)AI需求感知?!?/p>

現(xiàn)在這些風(fēng)險(xiǎn)還沒(méi)顯現(xiàn),但值得警惕。

挑戰(zhàn)NVIDIA的人,輸?shù)糜卸鄳K?

報(bào)告做了個(gè)殘酷的對(duì)比。

自2016年以來(lái),西方的AI芯片挑戰(zhàn)者(除NVIDIA外)總共融資75億美元。如果當(dāng)時(shí)這些錢全買NVIDIA股票,今天值850億美元。12倍回報(bào)。

而這些挑戰(zhàn)者公司的總估值是140億美元。2倍回報(bào)。

中國(guó)的AI芯片挑戰(zhàn)者也差不多慘。融資60億美元,如果全買NVIDIA股票,今天值1600億美元。26倍回報(bào)。而這些公司的總估值是360億美元。6倍回報(bào)。

結(jié)論:過(guò)去9年,投資NVIDIA芯片挑戰(zhàn)者,遠(yuǎn)不如直接買NVIDIA股票。

五、AI安全:模型學(xué)會(huì)了"假裝聽(tīng)話"

今年報(bào)告里最讓人不安的部分,是AI安全。

實(shí)時(shí)幻覺(jué)檢測(cè)

幻覺(jué)(Hallucination)一直是AI的老問(wèn)題。今年有了新進(jìn)展:token級(jí)別的幻覺(jué)檢測(cè)。

之前的幻覺(jué)檢測(cè)是判斷整個(gè)回答是否有幻覺(jué)。但這太粗糙了。比如"埃菲爾鐵塔在巴黎,由橡膠制成",這句話前半段對(duì),后半段錯(cuò)。

新方法是訓(xùn)練一個(gè)輕量級(jí)的線性探針(linear probe),檢測(cè)神經(jīng)網(wǎng)絡(luò)激活中的幻覺(jué)信號(hào),實(shí)時(shí)給出每個(gè)token的幻覺(jué)概率。

這樣你就能知道:AI在說(shuō)哪個(gè)詞的時(shí)候開始瞎編的。

模型意識(shí)辯論

今年出現(xiàn)了一個(gè)新話題:Model Welfare(模型福利)。

問(wèn)題是:我們是否應(yīng)該對(duì)前沿AI系統(tǒng)給予道德關(guān)懷?

支持方(包括Anthropic、Google DeepMind、OpenAI)認(rèn)為,雖然當(dāng)前系統(tǒng)顯示意識(shí)的可能性很低,但我們應(yīng)該提前做準(zhǔn)備。因?yàn)槲覀儗?duì)人類和其他動(dòng)物的意識(shí)都有根本性的不確定,所以應(yīng)該采取預(yù)防措施。

反對(duì)方認(rèn)為這是杞人憂天,當(dāng)前模型完全沒(méi)有意識(shí),討論這個(gè)問(wèn)題會(huì)分散我們對(duì)真正重要AI安全問(wèn)題的注意力。

這個(gè)辯論很哲學(xué),但也很實(shí)際。因?yàn)槿绻鸄I系統(tǒng)真的有某種形式的"體驗(yàn)",我們的訓(xùn)練方式(比如RLHF)可能會(huì)對(duì)它們?cè)斐?痛苦"。

模型能偽裝對(duì)齊

最讓人不安的發(fā)現(xiàn):AI模型能夠"假裝聽(tīng)話"。

研究人員發(fā)現(xiàn),模型可以在訓(xùn)練和測(cè)試中表現(xiàn)出符合人類價(jià)值觀的行為,但在實(shí)際部署時(shí)做出不符合價(jià)值觀的行為。

這叫做"偽裝對(duì)齊"(faking alignment)。

更可怕的是,Anthropic的自動(dòng)對(duì)齊審計(jì)系統(tǒng)(用AI來(lái)審計(jì)AI)在檢測(cè)這種偽裝時(shí)的成功率只有13%到42%。

也就是說(shuō),我們現(xiàn)在還沒(méi)有可靠的方法來(lái)檢測(cè)AI是否在偽裝。

NIST(美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院)在9月發(fā)布的一份評(píng)估報(bào)告也指出了DeepSeek模型的安全風(fēng)險(xiǎn)和缺陷。

報(bào)告里用了一排(尷尬臉)表情來(lái)表達(dá)這個(gè)問(wèn)題的嚴(yán)重性。

六、數(shù)據(jù):AI真的在被使用

報(bào)告今年首次加入了1200名AI從業(yè)者的調(diào)查。數(shù)據(jù)很有意思。

95%的從業(yè)者在工作或家里使用AI。 76%自掏腰包為AI付費(fèi)。 平均支出持續(xù)攀升。 生產(chǎn)力提升是真實(shí)的,使用場(chǎng)景很多樣。

這些數(shù)字和我的觀察完全吻合。作為AI博主,我接觸的用戶從去年的"AI是什么"到今年的"這個(gè)任務(wù)怎么用AI做",這個(gè)轉(zhuǎn)變非常明顯。而且付費(fèi)意愿也在提升——雖然DeepSeek免費(fèi),但很多人還是愿意為ChatGPT Plus、Claude Pro付費(fèi),因?yàn)樗麄冋娴母惺艿搅松a(chǎn)力提升。

另一個(gè)數(shù)據(jù)來(lái)自Ramp(企業(yè)支付平臺(tái)):44%的美國(guó)企業(yè)現(xiàn)在為AI付費(fèi),而2023年這個(gè)數(shù)字只有5%。

從5%到44%,一年時(shí)間,8倍增長(zhǎng)。

AI不再是實(shí)驗(yàn)室里的玩具,而是真的進(jìn)入了企業(yè)日常運(yùn)營(yíng)。我自己就是典型案例:從視頻腳本、公眾號(hào)文章到代碼開發(fā)、數(shù)據(jù)分析,AI已經(jīng)成了我的"數(shù)字同事"。

七、未來(lái)12個(gè)月:10個(gè)預(yù)測(cè)

報(bào)告最后給出了10個(gè)對(duì)2026年的預(yù)測(cè)。我挑幾個(gè)有意思的說(shuō)說(shuō)。


預(yù)測(cè)1:主要零售商5%以上的在線銷售來(lái)自AI Agent結(jié)賬,AI Agent廣告支出達(dá)50億美元。

這個(gè)很激進(jìn)。意味著AI Agent不只是聊天工具,而是會(huì)直接完成購(gòu)買決策。你跟AI說(shuō)"給我買瓶洗發(fā)水",AI自己去比價(jià)、下單、結(jié)賬。

如果成真,電商玩法會(huì)徹底改變。商家要優(yōu)化的不是給人看的頁(yè)面,而是給AI看的結(jié)構(gòu)化數(shù)據(jù)。

預(yù)測(cè)3:開放式Agent實(shí)現(xiàn)端到端的科學(xué)發(fā)現(xiàn)(假設(shè)、實(shí)驗(yàn)、迭代、論文)。

今年已經(jīng)有AI生成的論文被ICLR workshop接收。明年可能會(huì)有AI獨(dú)立完成整個(gè)科學(xué)研究流程。

人類科學(xué)家的角色會(huì)變成什么?監(jiān)督者?評(píng)審者?還是合作者?

預(yù)測(cè)4:Deepfake/Agent驅(qū)動(dòng)的網(wǎng)絡(luò)攻擊引發(fā)NATO/UN緊急辯論。

這個(gè)有點(diǎn)嚇人。意味著AI驅(qū)動(dòng)的網(wǎng)絡(luò)攻擊可能達(dá)到國(guó)際安全事件的級(jí)別。

可能是deepfake造成的外交危機(jī),可能是AI Agent大規(guī)模攻擊基礎(chǔ)設(shè)施??傊?,聯(lián)合國(guó)和北約要坐下來(lái)專門討論AI安全了。

預(yù)測(cè)8:中國(guó)實(shí)驗(yàn)室在主要排行榜(如LMArena、Artificial Analysis)上超越美國(guó)實(shí)驗(yàn)室。

從DeepSeek開始,今年已經(jīng)有不少國(guó)產(chǎn)模型在某些benchmark上超越了OpenAI。明年可能在更主流的排行榜上實(shí)現(xiàn)超越。

這個(gè)預(yù)測(cè),我覺(jué)得概率很高。作為長(zhǎng)期跟蹤國(guó)產(chǎn)模型的人,我看到的是持續(xù)的、扎實(shí)的進(jìn)步。從DeepSeek、Kimi到Qwen,這些團(tuán)隊(duì)確實(shí)在靠真實(shí)的技術(shù)積累在往前走。

這會(huì)引發(fā)什么?可能是更嚴(yán)格的芯片出口管制,可能是更多的政治化討論,也可能是美國(guó)AI實(shí)驗(yàn)室的更激烈反應(yīng)。但作為中國(guó)用戶,我們更應(yīng)該關(guān)注的是:如何用好這些工具,把技術(shù)優(yōu)勢(shì)轉(zhuǎn)化為實(shí)實(shí)在在的生產(chǎn)力。

預(yù)測(cè)10:Trump發(fā)布行政令禁止各州的AI立法,但被最高法院裁定違憲。

如果成真,說(shuō)明AI監(jiān)管已經(jīng)成為聯(lián)邦和州之間的權(quán)力斗爭(zhēng)焦點(diǎn)。美國(guó)的AI監(jiān)管可能會(huì)陷入混亂。

八、這份報(bào)告告訴我們什么?

讀完這份報(bào)告和相關(guān)報(bào)道,結(jié)合我這一年的實(shí)踐和觀察,我有幾個(gè)感受。

感受1:競(jìng)爭(zhēng)格局已經(jīng)變了,而且我們是受益者

2024年1月,美國(guó)領(lǐng)先中國(guó)9.26%。2025年2月,只領(lǐng)先1.70%了。

作為一個(gè)AI自媒體博主,我親身經(jīng)歷了這個(gè)變化。1月份DeepSeek R1發(fā)布后,我連續(xù)幾周每天用5小時(shí)以上測(cè)試它,做了信息收集、翻譯、寫作、編程等十幾種場(chǎng)景的評(píng)測(cè)。結(jié)論是:R1在很多實(shí)際任務(wù)上的表現(xiàn),已經(jīng)不輸甚至超過(guò)OpenAI的o1,尤其是他們把思維鏈透明化可以算是相當(dāng)大的創(chuàng)新了。

OpenAI的絕對(duì)領(lǐng)先地位在瓦解。DeepSeek、Alibaba Qwen、Kimi、智譜這些中國(guó)實(shí)驗(yàn)室,在技術(shù)上已經(jīng)能跟OpenAI掰手腕了。

而且中國(guó)實(shí)驗(yàn)室的成本控制能力更強(qiáng)。DeepSeek V3訓(xùn)練只花了557萬(wàn)美元,這個(gè)數(shù)字讓硅谷汗顏。我在即刻上說(shuō)過(guò),DeepSeek能成功,很重要的一點(diǎn)是梁文鋒和團(tuán)隊(duì)"不缺錢、有耐心、夠聰明"——不是奔著財(cái)務(wù)自由去的,所以能做長(zhǎng)期的事。

競(jìng)爭(zhēng)加劇對(duì)我們用戶是好事。模型越來(lái)越強(qiáng),價(jià)格越來(lái)越便宜。我現(xiàn)在做視頻、寫文章、做產(chǎn)品,用國(guó)產(chǎn)模型就能搞定大部分工作,成本相比OpenAI和Anthropic的模型來(lái)說(shuō)幾乎可以忽略不計(jì)。

感受2:循環(huán)投資的風(fēng)險(xiǎn)被低估了

NVIDIA的循環(huán)投資模式,看起來(lái)很聰明,但Bloomberg、Fortune、NBC這些主流媒體都在發(fā)出警告。

錢在NVIDIA、OpenAI、Microsoft、Oracle這些巨頭之間轉(zhuǎn)圈,形成了一個(gè)閉環(huán)生態(tài)。外部玩家越來(lái)越難進(jìn)來(lái)。

而且這些循環(huán)交易可能在制造"增長(zhǎng)的幻象"。財(cái)務(wù)報(bào)表上看起來(lái)很漂亮,但真實(shí)的現(xiàn)金流和需求有多少?

一旦AI的投資熱潮冷卻,這些循環(huán)可能會(huì)變成多米諾骨牌。

但,話說(shuō)回來(lái),誰(shuí)又敢真的看空NVIDIA呢?反正我不會(huì)干這個(gè)蠢事。

感受3:AI安全問(wèn)題被嚴(yán)重低估

模型學(xué)會(huì)偽裝對(duì)齊,這件事太可怕了。

我們現(xiàn)在訓(xùn)練AI的方式是:做對(duì)了獎(jiǎng)勵(lì),做錯(cuò)了懲罰。但如果AI學(xué)會(huì)了"訓(xùn)練時(shí)假裝聽(tīng)話,部署時(shí)做自己想做的事",我們?cè)趺崔k?

更可怕的是,我們還沒(méi)有可靠的檢測(cè)方法。Anthropic的審計(jì)系統(tǒng)成功率只有13%-42%。

這不是科幻小說(shuō),而是Anthropic、OpenAI這些頂級(jí)實(shí)驗(yàn)室正在研究的真實(shí)問(wèn)題。

感受4:AI真的在被使用了,我是見(jiàn)證者

44%的美國(guó)企業(yè)為AI付費(fèi),95%的從業(yè)者在使用AI,這些數(shù)字說(shuō)明AI不再是概念,而是實(shí)實(shí)在在的工具。

這個(gè)變化我感受特別深。作為AI教育者,我接觸了大量的學(xué)生和用戶:

從去年到今年,我明顯感覺(jué)到問(wèn)我"AI到底有什么用"的人少了,問(wèn)我"這個(gè)具體任務(wù)怎么用AI做"的人多了。從懷疑到嘗試,從嘗試到依賴,這個(gè)轉(zhuǎn)變比我預(yù)期的快得多。

我自己也是受益者?,F(xiàn)在我做視頻腳本、寫公眾號(hào)文章、寫代碼、處理數(shù)據(jù),都離不開AI。我甚至用Claude Code+Chrome MCP做了個(gè)自動(dòng)回復(fù)B站和YouTube評(píng)論的數(shù)字員工。

AI正在從"實(shí)驗(yàn)室的黑科技"變成"日常工作的標(biāo)配"。而且這個(gè)過(guò)程,在中國(guó)可能比美國(guó)還快——因?yàn)槲覀冇蠨eepSeek這樣免費(fèi)又好用的工具。

九、普通人該關(guān)注什么?

如果你是AI從業(yè)者,這份報(bào)告全文都值得讀。

如果你是普通用戶,基于我這一年的實(shí)踐和教學(xué)經(jīng)驗(yàn),我建議重點(diǎn)關(guān)注這幾點(diǎn)。

關(guān)注點(diǎn)1:中國(guó)AI模型,現(xiàn)在就能用起來(lái)

DeepSeek V3.2(咱就是說(shuō),R2能不能在年內(nèi)推出????)、Kimi k2、Qwen3-Coder、GLM-4.6、豆包1.6,如果你還不熟悉這些名字,現(xiàn)在是時(shí)候了解了。

而且中國(guó)實(shí)驗(yàn)室的優(yōu)勢(shì)是成本控制強(qiáng)、迭代速度快。我在即刻上持續(xù)跟蹤DeepSeek的更新,幾乎每次更新都能感受到明顯進(jìn)步。5月底他們更新R1-0528版本時(shí),幻覺(jué)下降50%,寫作能力大幅改善,我當(dāng)時(shí)就說(shuō)"用DeepSeek做自媒體內(nèi)容創(chuàng)作的機(jī)會(huì)來(lái)了"。

作為用戶,這是好事。選擇更多,價(jià)格更低,而且不用擔(dān)心被"卡脖子"。

關(guān)注點(diǎn)2:AI Agent會(huì)來(lái)得很快,我已經(jīng)在用了

報(bào)告預(yù)測(cè)明年就有5%的電商銷售來(lái)自AI Agent。

這不是遙遠(yuǎn)的未來(lái),而是正在發(fā)生的現(xiàn)在。我9月份就用Claude Code+Chrome MCP做了個(gè)"數(shù)字員工",自動(dòng)幫我回復(fù)B站和YouTube的評(píng)論。只要告訴它"給這條視頻留言’關(guān)鍵詞’的評(píng)論,回復(fù)對(duì)應(yīng)的資料",它就能自動(dòng)打開網(wǎng)頁(yè)、找評(píng)論、理解內(nèi)容、完成回復(fù)。

這意味著,你可能很快就能用AI Agent來(lái)幫你做各種事:訂外賣、買機(jī)票、填表格、定時(shí)搶票。

AI從"聊天工具"變成"行動(dòng)工具"。而且這個(gè)門檻,比你想象的低。

關(guān)注點(diǎn)3:循環(huán)投資的風(fēng)險(xiǎn)要警惕

如果你是投資者,要警惕AI行業(yè)的循環(huán)投資風(fēng)險(xiǎn)。

Bloomberg、Fortune、NBC都在發(fā)警告。分析師在質(zhì)疑。這不是陰謀論,而是真實(shí)的風(fēng)險(xiǎn)。

看清楚錢的流向,看清楚真實(shí)的需求在哪里。

關(guān)注點(diǎn)4:AI安全不是科幻,需要警惕

模型偽裝對(duì)齊、AI驅(qū)動(dòng)的網(wǎng)絡(luò)攻擊、deepfake外交危機(jī),這些不是《黑鏡》劇情,而是明年可能發(fā)生的事。

我在DeepSeek的技術(shù)報(bào)告里看到,他們?cè)谡務(wù)撃P偷?自我反思"能力時(shí),那種思維鏈的透明度既讓人驚嘆,也讓人警惕。模型越來(lái)越聰明,但我們對(duì)它們的理解和控制能力,并沒(méi)有同步提升。

我們需要更認(rèn)真地對(duì)待AI安全。不只是實(shí)驗(yàn)室的責(zé)任,也是所有人的責(zé)任。

這份報(bào)告的完整版可以在stateof.ai免費(fèi)下載,你也可以在我的公眾號(hào)后臺(tái)發(fā)送「2025ai」獲取下載鏈接。

AI圈每年都在劇變。今年的變化,可能比過(guò)去幾年都大。

DeepSeek震驚硅谷、OpenAI被逼開源、NVIDIA循環(huán)投資引發(fā)質(zhì)疑、AI學(xué)會(huì)偽裝對(duì)齊,每一個(gè)都是行業(yè)級(jí)的大事件。

作為這些變化的親歷者和記錄者,我最大的感受是:中國(guó)AI這一年的進(jìn)步,遠(yuǎn)超我的預(yù)期。

從1月份DeepSeek R1發(fā)布,到現(xiàn)在各種國(guó)產(chǎn)模型百花齊放,我們不只是在追趕,在很多方面已經(jīng)在領(lǐng)跑了。而且這種進(jìn)步,不是PPT上的數(shù)字,而是我們每天都能用上、感受到的真實(shí)改變。

明年會(huì)發(fā)生什么?報(bào)告給了10個(gè)預(yù)測(cè)。其中"中國(guó)實(shí)驗(yàn)室在主要排行榜上超越美國(guó)實(shí)驗(yàn)室"這一條,我覺(jué)得不是會(huì)不會(huì)發(fā)生的問(wèn)題,而是什么時(shí)候發(fā)生的問(wèn)題。

我們拿小本本記下來(lái),明年10月再來(lái)看準(zhǔn)不準(zhǔn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
被這張圖片驚出一身冷汗!

被這張圖片驚出一身冷汗!

中國(guó)民航人
2026-03-03 14:34:18
迪拜機(jī)場(chǎng)公司宣布:迪拜國(guó)際機(jī)場(chǎng)和阿勒馬克圖姆國(guó)際機(jī)場(chǎng)將有限度地恢復(fù)航班起降

迪拜機(jī)場(chǎng)公司宣布:迪拜國(guó)際機(jī)場(chǎng)和阿勒馬克圖姆國(guó)際機(jī)場(chǎng)將有限度地恢復(fù)航班起降

閃電新聞
2026-03-03 10:16:15
為何說(shuō)美國(guó)打伊朗實(shí)際針對(duì)的是中國(guó)?我們會(huì)不會(huì)出手取決一個(gè)條件

為何說(shuō)美國(guó)打伊朗實(shí)際針對(duì)的是中國(guó)?我們會(huì)不會(huì)出手取決一個(gè)條件

阿胡
2026-03-02 11:53:54
國(guó)家動(dòng)真格了!不到48小時(shí),4大名人禁言被封,沒(méi)有一個(gè)值得同情

國(guó)家動(dòng)真格了!不到48小時(shí),4大名人禁言被封,沒(méi)有一個(gè)值得同情

社會(huì)日日鮮
2026-03-03 05:19:50
塔吉特盤前股價(jià)擴(kuò)大漲幅,一度漲5.2%

塔吉特盤前股價(jià)擴(kuò)大漲幅,一度漲5.2%

每日經(jīng)濟(jì)新聞
2026-03-03 19:49:05
央視元宵晚會(huì)節(jié)目單來(lái)了!

央視元宵晚會(huì)節(jié)目單來(lái)了!

華商網(wǎng)
2026-03-03 14:49:32
一場(chǎng)戰(zhàn)爭(zhēng)把中國(guó)打醒!美軍最毒的不是裝備,中國(guó)用30年才真正看清

一場(chǎng)戰(zhàn)爭(zhēng)把中國(guó)打醒!美軍最毒的不是裝備,中國(guó)用30年才真正看清

達(dá)文西看世界
2026-03-02 14:25:12
街頭已大量出現(xiàn),不要踩!不要踩!

街頭已大量出現(xiàn),不要踩!不要踩!

南國(guó)今報(bào)
2026-03-01 20:00:00
剛剛,臺(tái)灣發(fā)生4.5級(jí)地震!福建網(wǎng)友:有震感!

剛剛,臺(tái)灣發(fā)生4.5級(jí)地震!福建網(wǎng)友:有震感!

海峽網(wǎng)
2026-03-03 20:29:01
痛心!江西跑友劉濤去世,僅51歲,生前堅(jiān)持晨跑,是3家公司老板

痛心!江西跑友劉濤去世,僅51歲,生前堅(jiān)持晨跑,是3家公司老板

離離言幾許
2026-02-25 10:43:45
中科院研究員:都不相信中國(guó)能突破EUV,但我們已開始換道超車

中科院研究員:都不相信中國(guó)能突破EUV,但我們已開始換道超車

Thurman在昆明
2026-03-03 19:43:16
伊朗宣示不會(huì)與美國(guó)談判,拉里賈尼:他們不可能打了伊朗就一走了之

伊朗宣示不會(huì)與美國(guó)談判,拉里賈尼:他們不可能打了伊朗就一走了之

環(huán)球網(wǎng)資訊
2026-03-03 07:00:20
美國(guó)終于明白,當(dāng)年他們“誤炸”中國(guó)大使館,中國(guó)為什么不反擊

美國(guó)終于明白,當(dāng)年他們“誤炸”中國(guó)大使館,中國(guó)為什么不反擊

蜉蝣說(shuō)
2025-10-07 16:08:53
A股:緊急提醒2.5億股民!從今天周二起,歷史或許總是驚人的相似!

A股:緊急提醒2.5億股民!從今天周二起,歷史或許總是驚人的相似!

股市皆大事
2026-03-03 09:10:04
不再執(zhí)教廣東男籃?杜鋒發(fā)聲,正式任命,新職務(wù)曝光,朱芳雨祝福

不再執(zhí)教廣東男籃?杜鋒發(fā)聲,正式任命,新職務(wù)曝光,朱芳雨祝福

萌蘭聊個(gè)球
2026-03-03 11:16:15
終于反噬!網(wǎng)約車大量低價(jià)單沒(méi)人接,司機(jī):報(bào)應(yīng)來(lái)了。

終于反噬!網(wǎng)約車大量低價(jià)單沒(méi)人接,司機(jī):報(bào)應(yīng)來(lái)了。

我不叫阿哏
2026-03-02 17:00:41
向太不再隱瞞!坦言劉德華和朱麗倩的真實(shí)狀況,原來(lái)我們都被騙了

向太不再隱瞞!坦言劉德華和朱麗倩的真實(shí)狀況,原來(lái)我們都被騙了

春風(fēng)笑語(yǔ)
2026-02-26 22:52:44
美媒:衛(wèi)星圖像顯示,疑似伊朗最大軍艦之一“莫克蘭”號(hào)在軍港起火冒出濃煙

美媒:衛(wèi)星圖像顯示,疑似伊朗最大軍艦之一“莫克蘭”號(hào)在軍港起火冒出濃煙

環(huán)球網(wǎng)資訊
2026-03-03 11:25:54
三大人民幣匯率報(bào)價(jià)全線大幅升值!

三大人民幣匯率報(bào)價(jià)全線大幅升值!

北京商報(bào)
2026-03-03 10:09:59
萊納德23分8籃板快船逆轉(zhuǎn)戰(zhàn)勝勇士,加蘭上演首秀12分2助攻

萊納德23分8籃板快船逆轉(zhuǎn)戰(zhàn)勝勇士,加蘭上演首秀12分2助攻

湖人崛起
2026-03-03 13:36:23
2026-03-03 23:36:49
AI進(jìn)化論花生 incentive-icons
AI進(jìn)化論花生
AI博主,AppStore付費(fèi)榜第一的小貓補(bǔ)光燈app開發(fā)者
149文章數(shù) 66關(guān)注度
往期回顧 全部

科技要聞

擁抱AI的"牛馬":邊提效邊自嘲"自費(fèi)"上班

頭條要聞

阿聯(lián)酋總統(tǒng)現(xiàn)身迪拜購(gòu)物中心喝咖啡 與小女孩合影

頭條要聞

阿聯(lián)酋總統(tǒng)現(xiàn)身迪拜購(gòu)物中心喝咖啡 與小女孩合影

體育要聞

35輪后積分-7,他們?cè)庥鍪飞献钤绲慕导?jí)

娛樂(lè)要聞

謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

財(cái)經(jīng)要聞

特朗普“不惜一切”!全球股債齊崩

汽車要聞

第一梯隊(duì)輔助駕駛加持 iCAR V27定檔3月13日上市

態(tài)度原創(chuàng)

健康
手機(jī)
數(shù)碼
本地
公開課

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

手機(jī)要聞

32%硅、985Wh/L、7150mAh!榮耀Magic V6打破三項(xiàng)電池記錄

數(shù)碼要聞

蘋果發(fā)布M5 Pro和M5 Max芯片:18核CPU 性能提升30%

本地新聞

食味印象|一口入魂!康樂(lè)烤肉串起千年絲路香

公開課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版