国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

斯坦福年度結(jié)論:中美大模型已沒(méi)差距

0
分享至

一覺(jué)醒來(lái),中美AI模型差距快沒(méi)了??

仔細(xì)一看才知道,這竟然還是斯坦福HAI最新發(fā)布的《2026年AI指數(shù)報(bào)告》給出的結(jié)論。

中美AI模型性能差距已基本消除(effectively closed)。

(粉色代表中國(guó),藍(lán)色代表美國(guó),模型差距逐漸縮?。?/p>



除了談中美,報(bào)告還一口氣給出了14個(gè)重要觀(guān)察或結(jié)論,它們共同回答了一個(gè)問(wèn)題:

過(guò)去一年,AI又把我們帶到了怎樣的世界?

如果你也想知道答案,不妨一起往下看。

(天啦擼,報(bào)告原文有423頁(yè),所以咱們直接挑重點(diǎn)gogogo)

報(bào)告得出的15個(gè)主要結(jié)論

“Scaling Law見(jiàn)頂”爭(zhēng)議下,AI發(fā)展不停

首先,報(bào)告從整體上給出了一個(gè)趨勢(shì)判斷:

AI能力并未停滯不前,它正在加速發(fā)展,并觸達(dá)比以往更多的人。



這體現(xiàn)在AI對(duì)困難任務(wù)的解決上:

2025年,業(yè)界生產(chǎn)了超過(guò)90%的知名前沿模型,其中多個(gè)模型在博士級(jí)科學(xué)問(wèn)題、多模態(tài)推理和競(jìng)賽數(shù)學(xué)方面現(xiàn)已達(dá)到或超越人類(lèi)基線(xiàn)。

而且在SWE-bench Verified這個(gè)關(guān)鍵的編碼基準(zhǔn)測(cè)試上,模型性能在一年內(nèi)從60%提升至接近100%。

與此同時(shí),AI也在迅速普及開(kāi)來(lái):

企業(yè)端的采用率已經(jīng)達(dá)到88%,而在大學(xué)生群體中,五分之四的人已經(jīng)在使用生成式人工智能。

中美AI模型性能差距已基本消除

至于中美,則從2025年初以來(lái)呈現(xiàn)“你方唱罷我登臺(tái)”的局面。



2025年2月,DeepSeek-R1橫空出世,短暫追平美國(guó)頂尖模型。

截至2026年3月,Anthropic的頂尖模型雖仍保持領(lǐng)先,但優(yōu)勢(shì)已收窄至僅2.7%。

在產(chǎn)出層面,美國(guó)依然擁有更多頂級(jí)AI模型和更高影響力的專(zhuān)利,而中國(guó)則在論文發(fā)表量、引用量、專(zhuān)利總數(shù)及工業(yè)機(jī)器人安裝量上占據(jù)優(yōu)勢(shì)。

此外,韓國(guó)憑借其創(chuàng)新密度脫穎而出,人均AI專(zhuān)利數(shù)量位居全球第一。

AI數(shù)據(jù)中心美國(guó)最多,臺(tái)積電贏麻了

關(guān)于巨頭們都在押注的AI數(shù)據(jù)中心,目前美國(guó)擁有絕對(duì)數(shù)量?jī)?yōu)勢(shì)——

有5427個(gè)數(shù)據(jù)中心,數(shù)量是其他任何國(guó)家的10倍以上(不過(guò)能源消耗也超過(guò)其他任何國(guó)家)。

而且在芯片制造方面,臺(tái)積電簡(jiǎn)直贏麻了:

幾乎每一款領(lǐng)先的AI芯片都由臺(tái)積電一家公司制造,這使得全球AI智能硬件供應(yīng)鏈依賴(lài)于中國(guó)臺(tái)灣省的一家代工廠(chǎng)——盡管臺(tái)積電在美國(guó)的擴(kuò)建項(xiàng)目已于2025年投入運(yùn)營(yíng)。

AI能拿奧數(shù)金牌,但還是看不懂時(shí)間

過(guò)去一年,AI能力依舊參差不齊。

國(guó)際前沿模型Gemini Deep Think可以在IMO中拿下金牌,但當(dāng)前頂尖模型在讀取指針式時(shí)鐘時(shí),準(zhǔn)確率卻只有50.1%。

與此同時(shí),AI Agent的能力也在快速進(jìn)化:

在OSWorld這一覆蓋多操作系統(tǒng)真實(shí)任務(wù)的測(cè)試中,任務(wù)成功率從12%躍升至約66%。

不過(guò)即便如此,在結(jié)構(gòu)化基準(zhǔn)測(cè)試中,它們?nèi)匀淮蠹s有三分之一的任務(wù)會(huì)失敗。



AI安全基準(zhǔn)滯后,安全事故頻發(fā)

如今,幾乎所有頭部前沿模型開(kāi)發(fā)者,都會(huì)主動(dòng)披露模型在能力基準(zhǔn)測(cè)試上的成績(jī)。

但在“負(fù)責(zé)任的AI”這件事上,信息依然零散且不完整,缺乏系統(tǒng)性的披露。

與此同時(shí),風(fēng)險(xiǎn)信號(hào)也在變多——

被記錄在案的AI事件數(shù)量,從2024年的233起,上升到了362起。

更棘手的是,最新研究還發(fā)現(xiàn):

在負(fù)責(zé)任的AI中,不同目標(biāo)之間可能存在“此消彼長(zhǎng)”,比如提升安全性,往往會(huì)以犧牲準(zhǔn)確性為代價(jià)。



美國(guó)在AI投資方面領(lǐng)先,但對(duì)全球人才的吸引力正在下降

2025年,美國(guó)在AI上的私人投資達(dá)到2859億美元,規(guī)模是中國(guó)124億美元的23倍以上。

不過(guò)報(bào)告提醒,單看私人投資大概率會(huì)低估中國(guó)的整體投入——

因?yàn)橹袊?guó)還有大量來(lái)自政府引導(dǎo)基金的支持。



在創(chuàng)業(yè)活躍度上,美國(guó)領(lǐng)先中國(guó):

一年內(nèi)獲得新融資的AI公司達(dá)到1953家,數(shù)量是第二名國(guó)家的10倍以上。

但另一邊,美國(guó)這邊也出現(xiàn)了一個(gè)不太樂(lè)觀(guān)的趨勢(shì)——

流向美國(guó)的AI研究人員和開(kāi)發(fā)者,正在明顯減少。

自2017年以來(lái),這一數(shù)字已經(jīng)下降了89%;僅過(guò)去一年,就又減少了80%。

AI普及率正在歷史性加速

AI普及率正在歷史性加速。

僅用三年時(shí)間,生成式AI就觸達(dá)了53%的人口,普及速度明顯快于PC和互聯(lián)網(wǎng)

不過(guò),這一進(jìn)程在不同國(guó)家之間差異明顯,并且與人均GDP高度相關(guān)。

其中,新加坡的普及率達(dá)到61%,阿拉伯聯(lián)合酋長(zhǎng)國(guó)為54%;相比之下,美國(guó)僅為28.3%,排名第24位。



此外,從價(jià)值角度看,體感也在迅速放大——

到2026年初,生成式AI工具為美國(guó)消費(fèi)者創(chuàng)造的年價(jià)值,已經(jīng)達(dá)到1720億美元。

而從2025年到2026年,單個(gè)用戶(hù)的中位價(jià)值直接翻了三倍。

換句話(huà)說(shuō),哪怕很多工具本身是免費(fèi)的,但普通消費(fèi)者正在從中拿到真金白銀的價(jià)值。

當(dāng)前正規(guī)教育跟不上AI發(fā)展的速度

雖然AI發(fā)展很快,但正規(guī)教育體系,當(dāng)前明顯有點(diǎn)跟不上了。

學(xué)生這邊已經(jīng)全面上手:

在美國(guó),超過(guò)80%的高中生和大學(xué)生,已經(jīng)在用AI完成學(xué)習(xí)相關(guān)任務(wù)。

但另一邊,學(xué)校體系卻還沒(méi)準(zhǔn)備好——

美國(guó)只有一半的中小學(xué)制定了AI相關(guān)政策,而在教師群體中,只有6%的人認(rèn)為這些政策是清晰的。



在全球范圍內(nèi),AI工程技能增長(zhǎng)最快的國(guó)家,反而是阿拉伯聯(lián)合酋長(zhǎng)國(guó)、智利和南非。

與此同時(shí),人才供給也在變化:

從2022年到2024年,美國(guó)和加拿大新增的AI博士數(shù)量增長(zhǎng)了22%,但這些新增博士,更多流向了學(xué)術(shù)界,而不是工業(yè)界。

開(kāi)源正在成為全球AI競(jìng)爭(zhēng)新變量

如今,越來(lái)越多國(guó)家開(kāi)始加碼布局AI。

為了把AI能力盡量掌握在本土體系內(nèi),發(fā)展中經(jīng)濟(jì)體持續(xù)擴(kuò)展國(guó)家級(jí)AI戰(zhàn)略,同時(shí)政府主導(dǎo)的AI超級(jí)計(jì)算投資也在同步增長(zhǎng)。

但現(xiàn)實(shí)是,核心能力依然高度集中:

無(wú)論是模型研發(fā)還是前沿突破,仍主要掌握在美國(guó)和中國(guó)手中。



不過(guò),一個(gè)新的變量正在出現(xiàn)——開(kāi)源。

隨著開(kāi)源生態(tài)的發(fā)展,參與者的版圖開(kāi)始被重新分配。

在GitHub上,來(lái)自“其他地區(qū)”的貢獻(xiàn)量,已經(jīng)超過(guò)歐洲,并逐漸逼近美國(guó)。

更重要的是,這種變化正在帶來(lái)連鎖反應(yīng):

更多語(yǔ)言、更豐富場(chǎng)景的模型與評(píng)測(cè)體系,開(kāi)始出現(xiàn)。

關(guān)于AI的未來(lái),專(zhuān)家和普通人的看法正在明顯“分叉”

在“AI會(huì)如何影響工作”這個(gè)問(wèn)題上,73%的專(zhuān)家認(rèn)為是正面的,但公眾中只有23%這么看,兩者之間拉開(kāi)了整整50個(gè)百分點(diǎn)的差距。

類(lèi)似的分歧,也出現(xiàn)在對(duì)經(jīng)濟(jì)、醫(yī)療等關(guān)鍵領(lǐng)域的判斷上。

信任層面,不同國(guó)家之間,對(duì)政府監(jiān)管AI的信任度差異明顯。

在受調(diào)查國(guó)家中,美國(guó)的信任度最低,只有31%。

而從全球范圍來(lái)看,歐盟在“能否有效監(jiān)管AI”這件事上,整體信任度要高于美國(guó)和中國(guó)。



除了上面這10個(gè),斯坦福官網(wǎng)未列但報(bào)告里提到的其他5個(gè)結(jié)論分別是:

1、即使在受控環(huán)境中表現(xiàn)出色,機(jī)器人仍無(wú)法完成大多數(shù)家務(wù)任務(wù)(僅12%)。

2、AI先替代的是“入門(mén)級(jí)執(zhí)行”,而不是“有經(jīng)驗(yàn)的判斷”。從2024年開(kāi)始,美國(guó)22~25歲的年輕開(kāi)發(fā)者崗位,直接少了近20%;但與此同時(shí),年長(zhǎng)開(kāi)發(fā)者反而在增加。

3、AI能力在變強(qiáng),但環(huán)境代價(jià)也在同步放大。僅GPT-4o推理的年用水量,就可能超過(guò)1200萬(wàn)人的飲用水需求

4、AI在科學(xué)領(lǐng)域,已經(jīng)開(kāi)始超越人類(lèi),但模型越大,并不總是越強(qiáng)。

5、AI正在快速進(jìn)入臨床一線(xiàn),但仍缺乏有效性。一項(xiàng)覆蓋500多項(xiàng)研究的綜述顯示,接近一半的研究,依賴(lài)的是示例性問(wèn)題,而不是真實(shí)患者數(shù)據(jù);真正基于真實(shí)臨床數(shù)據(jù)開(kāi)展的研究,占比只有5%。

(具體指路第9頁(yè))



斯坦福HAI出品、谷歌OpenAI提供支持

最后簡(jiǎn)單說(shuō)一下,《斯坦福AI指數(shù)報(bào)告》到底是什么來(lái)頭。

除了出品方斯坦福HAI,其支持者陣容可謂相當(dāng)豪華:

不僅有谷歌、OpenAI這樣的頭部模型玩家,而且還有麥肯錫、GitHub、領(lǐng)英等強(qiáng)大數(shù)據(jù)提供方。



對(duì)了,“以人為本”人工智能實(shí)驗(yàn)室(HAI)還是李飛飛發(fā)起并聯(lián)合創(chuàng)立的,之前她通常以“代言人”的身份宣傳介紹這份報(bào)告,不過(guò)今年推特暫無(wú)動(dòng)靜。

翻了下報(bào)告指導(dǎo)委員會(huì)名單,里面也沒(méi)有她的身影(而且也沒(méi)有華人)。

(難道這和她投身創(chuàng)業(yè)有關(guān)?)



而從2017年開(kāi)始,這些頂尖研究人員和機(jī)構(gòu)就聚在一起專(zhuān)門(mén)做一件事:

用數(shù)據(jù),把AI每年怎么發(fā)展這件事講清楚

多年下來(lái),該報(bào)告已經(jīng)成為業(yè)界重要參考(今年已經(jīng)是第9份了)。

相比之前,報(bào)告今年還明顯增加了一個(gè)信號(hào):AI已經(jīng)不只是技術(shù)問(wèn)題,而是開(kāi)始全面進(jìn)入深水區(qū)。

一方面,它持續(xù)追蹤AI在推理能力、安全性、以及真實(shí)世界任務(wù)中的表現(xiàn),但一個(gè)關(guān)鍵變化是——

這些指標(biāo)本身,正在變得越來(lái)越不可靠。



另一方面,報(bào)告首次給出了生成式AI的經(jīng)濟(jì)價(jià)值新估算,并補(bǔ)充了對(duì)勞動(dòng)力市場(chǎng)影響的最新證據(jù)——

AI不再只是“會(huì)不會(huì)取代人”的問(wèn)題,而是已經(jīng)開(kāi)始重塑崗位結(jié)構(gòu)。

更宏觀(guān)的部分也在展開(kāi),比如提出了一個(gè)分析國(guó)家層面技術(shù)控制與競(jìng)爭(zhēng)的新框架、首次單獨(dú)設(shè)立AI科學(xué)/AI醫(yī)學(xué)兩大板塊、與谷歌前CEO施密特的公司合寫(xiě)科學(xué)章節(jié)。

Anyway,如果你也關(guān)心AI的近況和未來(lái)——

這份報(bào)告或許就是目前信息密度最高、值得每年一追的那一個(gè)。

(好好好,我將深度學(xué)習(xí)之)



報(bào)告原文:
https://hai.stanford.edu/ai-index/2026-ai-index-report

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
下架、召回!廣東多款飲用水,細(xì)菌超標(biāo)!情況通報(bào)

下架、召回!廣東多款飲用水,細(xì)菌超標(biāo)!情況通報(bào)

娛樂(lè)的硬糖吖
2026-04-14 00:52:32
知名投行高盛再對(duì)中國(guó)房地產(chǎn)走勢(shì)作出預(yù)測(cè),或大概率又是對(duì)的

知名投行高盛再對(duì)中國(guó)房地產(chǎn)走勢(shì)作出預(yù)測(cè),或大概率又是對(duì)的

專(zhuān)業(yè)聊房君
2026-04-11 19:26:23
真正的養(yǎng)生,是省著用自己

真正的養(yǎng)生,是省著用自己

提升氣場(chǎng)看花田
2026-04-10 14:58:41
浙大名嘴揭開(kāi)殘酷真相:當(dāng)年恒大倒臺(tái),壓根不是因?yàn)?萬(wàn)億負(fù)債!

浙大名嘴揭開(kāi)殘酷真相:當(dāng)年恒大倒臺(tái),壓根不是因?yàn)?萬(wàn)億負(fù)債!

阿器談史
2026-04-02 13:31:44
古代嬪妃被翻牌,次日往往站不穩(wěn),嬤嬤:哼,絕不是你想的那樣

古代嬪妃被翻牌,次日往往站不穩(wěn),嬤嬤:哼,絕不是你想的那樣

棠棣分享
2026-03-21 00:51:06
近一周“一口價(jià)”黃金產(chǎn)品最高下跌17%!機(jī)構(gòu)依舊看好黃金后市

近一周“一口價(jià)”黃金產(chǎn)品最高下跌17%!機(jī)構(gòu)依舊看好黃金后市

證券時(shí)報(bào)e公司
2026-04-14 16:32:42
每天走多少步最延壽?哈佛研究實(shí)錘:這樣走路,全因死亡風(fēng)險(xiǎn)降17%

每天走多少步最延壽?哈佛研究實(shí)錘:這樣走路,全因死亡風(fēng)險(xiǎn)降17%

CHTV百姓健康
2026-04-14 12:00:07
狐貍尾巴藏不?。∫詾槟堋皻У簟比t嬋,不料自己先被扒個(gè)底朝天

狐貍尾巴藏不住!以為能“毀掉”全紅嬋,不料自己先被扒個(gè)底朝天

芭比衣櫥
2026-04-14 12:42:54
英國(guó)男稱(chēng)上海食物像狗屎!罕見(jiàn)全球華人團(tuán)結(jié)回懟

英國(guó)男稱(chēng)上海食物像狗屎!罕見(jiàn)全球華人團(tuán)結(jié)回懟

環(huán)球趣聞分享
2026-04-13 14:22:47
新一代理想L9無(wú)偽實(shí)車(chē)曝光:整體變圓潤(rùn) 首次用上雙色車(chē)漆

新一代理想L9無(wú)偽實(shí)車(chē)曝光:整體變圓潤(rùn) 首次用上雙色車(chē)漆

快科技
2026-04-13 18:14:06
退休后,永遠(yuǎn)不要在熟人面前,說(shuō)以下6句話(huà),切記切記

退休后,永遠(yuǎn)不要在熟人面前,說(shuō)以下6句話(huà),切記切記

東林夕亭
2026-04-02 16:44:39
演員王曉晨自曝:“吃了不合適的藥,引發(fā)了心悸”

演員王曉晨自曝:“吃了不合適的藥,引發(fā)了心悸”

神顏販賣(mài)機(jī)
2026-04-14 10:03:25
5月1日起反腐新規(guī)正式落地!普通人送禮、幫忙、牽線(xiàn)全踩紅線(xiàn)

5月1日起反腐新規(guī)正式落地!普通人送禮、幫忙、牽線(xiàn)全踩紅線(xiàn)

小楊侃事
2026-04-14 12:46:46
“46歲羅志祥在家中猝死”登熱搜,經(jīng)紀(jì)人回應(yīng)

“46歲羅志祥在家中猝死”登熱搜,經(jīng)紀(jì)人回應(yīng)

齊魯壹點(diǎn)
2026-04-14 14:44:12
觸目驚心!廣州一高校原黨委副書(shū)記,被判無(wú)期

觸目驚心!廣州一高校原黨委副書(shū)記,被判無(wú)期

南方都市報(bào)
2026-04-14 08:50:16
靠結(jié)婚化債的小仙女越來(lái)越多了!

靠結(jié)婚化債的小仙女越來(lái)越多了!

黯泉
2026-04-13 08:57:38
重慶:堅(jiān)決擁護(hù)黨中央決定

重慶:堅(jiān)決擁護(hù)黨中央決定

農(nóng)民日?qǐng)?bào)
2026-04-13 20:18:04
馬英九再發(fā)聲明,連戰(zhàn)方面出手了,蕭旭岑直面應(yīng)對(duì),主動(dòng)證實(shí)一事

馬英九再發(fā)聲明,連戰(zhàn)方面出手了,蕭旭岑直面應(yīng)對(duì),主動(dòng)證實(shí)一事

李博世財(cái)經(jīng)
2026-04-14 14:23:53
阿爾瓦雷斯39場(chǎng)歐冠進(jìn)24球,僅5人曾在前40場(chǎng)突破25球

阿爾瓦雷斯39場(chǎng)歐冠進(jìn)24球,僅5人曾在前40場(chǎng)突破25球

懂球帝
2026-04-14 06:10:10
本來(lái)窮得好好的,非要闖一闖,結(jié)果成老賴(lài)!半生努力換一身負(fù)債

本來(lái)窮得好好的,非要闖一闖,結(jié)果成老賴(lài)!半生努力換一身負(fù)債

夜深?lèi)?ài)雜談
2026-04-11 11:42:57
2026-04-14 17:15:00
量子位 incentive-icons
量子位
追蹤人工智能動(dòng)態(tài)
12469文章數(shù) 176448關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

大陸公布十項(xiàng)惠臺(tái)政策 民進(jìn)黨當(dāng)局?jǐn)M封殺

頭條要聞

大陸公布十項(xiàng)惠臺(tái)政策 民進(jìn)黨當(dāng)局?jǐn)M封殺

體育要聞

他做對(duì)了所有事,卻被整個(gè)職業(yè)網(wǎng)壇放逐了八年

娛樂(lè)要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財(cái)經(jīng)要聞

許家印受審當(dāng)庭表示認(rèn)罪悔罪

汽車(chē)要聞

售12.99萬(wàn)起/續(xù)航2000km 風(fēng)云T9L上市

態(tài)度原創(chuàng)

健康
家居
手機(jī)
房產(chǎn)
旅游

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

家居要聞

現(xiàn)代融合 自然靈動(dòng)

手機(jī)要聞

REDMI K90 Max續(xù)航拉滿(mǎn)!8550mAh電池+100W快充 邊玩邊充不發(fā)燙

房產(chǎn)要聞

改善標(biāo)桿,1.5w+起橫掃國(guó)興!海口樓市,打出最猛一張牌!

旅游要聞

好評(píng)中國(guó)丨春日經(jīng)濟(jì)熱潮涌動(dòng) 創(chuàng)新融合帶動(dòng)消費(fèi)熱潮

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版