国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek V4炸場背后:硅谷在“造墻”,中國在“修路”

0
分享至



4月24日上午,姍姍來遲的DeepSeek V4終于顯露真身。

當天,DeepSeek-V4-Pro即登頂Hugging Face開源模型榜,兩個“核彈級創(chuàng)新”被津津樂道:

一是百萬級的超長上下文,但KV cache只有V3.2的10%,被亞馬遜工程師盛贊將解決HBM短缺問題;

二是對國產(chǎn)芯片的適配,在研發(fā)過程中與華為緊密合作,并第一時間適配了昇騰、寒武紀等國產(chǎn)芯片。



巧合的是,Hugging Face開源模型榜排名第二的,正是4月20日深夜發(fā)布并開源的Kimi K2.6。

如果是在太平洋對岸,兩個萬億參數(shù)模型的“撞檔”,免不了為了估值、商業(yè)版圖互相攻訐,國內卻上演了截然不同的一幕:沒有互揭老底的戲碼、沒有暗流涌動的公關戰(zhàn),甚至在技術底層進行了“換防”。

“不尋!钡谋澈,暗藏了中美在AI技術路線上的分歧:硅谷正在狂“豎起高墻”,試圖用閉源守住既得利益;國大模型廠商則選擇“拆掉圍墻”,在開源的土壤上走向了協(xié)同進化。

01 硅谷深陷“權力的游戲”

不同于國內大模型百花齊放的開源路線,OpenAI、Anthropic、谷歌Gemini為代表的硅谷AI頭羊,無不是閉源的擁躉。

當前沿的技術創(chuàng)新被鎖死在各自的數(shù)據(jù)中心里,面對算力成本的重壓和資本市場的期待,以開放與協(xié)作著稱的“硅谷精神”漸漸消亡,玩家們不可避免地陷入了零和博弈的“權力游戲”。

過去兩年里,技術“暗戰(zhàn)”已經(jīng)演變成公開互撕,最典型的手段就是互相“搶風頭”:在競爭對手發(fā)布新產(chǎn)品的關鍵節(jié)點,迅速拋出自家的重磅更新來遏制對方的聲量,已經(jīng)成為硅谷的常規(guī)操作。

早在2024年5月,OpenAI和谷歌就曾同時發(fā)布AI新品,一方說GPT-4o全球領先,一方說Gemini家族能覆蓋全生態(tài)全路徑。最后兩家公司的CEO都坐不住了,公開在社交媒體上嘲諷對方。

不只是和谷歌的“纏斗”,OpenAI與Anthropic的較量也進入了白熱化:就在4月16日,Anthropic剛發(fā)布了新模型Claude Opus 4.7,OpenAI在兩個多小時后便宣布Codex大幅更新,喊出了“Codex for(almost) everything”的口號。明眼人都看得出來,時間上的撞檔絕非巧合,而是OpenAI針對Anthropic精心策劃的一場“狙擊”。

除了輿論場上的“文斗”,互相“揭老底”的“武斗”也成了硅谷的常態(tài)。

Anthropic在4月7日高調宣布年化收入達到300億美元,成功超越OpenAI的250億美元。

一個禮拜后,OpenAI首席營收官在給全體員工的內部信中直言不諱地指出:Anthropic對外宣稱的300億美元年化營收存在嚴重水分,因為它采用的是“總額法”,把分給亞馬遜、谷歌等云服務商的抽成,也全額算進了自己的總營收里,導致年化收入被高估了約80億美元。

內部信中給對手拆臺的做法,在科技行業(yè)并不常見,目的無非是想告訴投資人——Anthropic的增長神話是注水的。

而一旦敵意滋生,會無孔不入地影響每一個決策。

Anthropic因拒絕刪除合同中的特定安全條款與五角大樓“鬧掰”后,OpenAI幾個小時后就高調宣布已與美國國防部達成合作。



在2026年的“超級碗”上,Anthropic重金投放了一條廣告,內容是“廣告正在進入AI領域,但不會進入Claude!笨梢哉f是對著剛開始測試廣告功能的OpenAI“貼臉開大”.......

為何昔日的“同門兄弟”,走到了水火不容的地步?

根源在于閉源商業(yè)模式的固有邏輯:閉源的生存根基在于構建護城河,而構建護城河的前提就是阻斷技術擴散,壟斷最先進的生產(chǎn)力。再加上技術路線不兼容、產(chǎn)品敘事對立,自然而然地形成了一個納什均衡:誰先“;稹,誰的品牌敘事就會坍塌,最終在內耗的泥潭里越陷越深。

02 開源陣營的“協(xié)同進化”

將視線轉回國內,劇本的走向完全不同。

時間回到一年多前,DeepSeek-R1的橫空出世,為狂奔的大模型創(chuàng)業(yè)賽踩了一腳剎車,進入決賽圈的大模型“六小虎”首當其沖。和硅谷最大的區(qū)別,DeepSeek沒有扮演吃掉池子里所有魚的“鯊魚”,而是像鯰魚一樣激活了整個中國大模型生態(tài),大家紛紛擁抱開源。

直接的例子就是和DeepSeek的成長軌跡高度重合的月之暗面 都是2023年起步的初創(chuàng)團隊,都保持著人數(shù)極少但人才密度極高的團隊結構,并且都是Scaling Law的堅定信徒。

2025年7月,月之暗面發(fā)布了全球第一個萬億參數(shù)的開源模型Kimi K2,在技術報告里毫不掩飾的說采用了DeepSeek開源的MLA架構。對于大模型來說,處理超長文本最大的噩夢是顯存墻,而MLA架構的顛覆性在于,巧妙將KV Cache的壓縮率做到了驚人的93%以上。

有了DeepSeek貢獻的“業(yè)界標準”,月之暗面在內的大模型團隊不需要重復造輪子,快速降低了推理成本。

故事并未止步于此。

翻看DeepSeek V4的技術文檔,詳細描述了模型的架構,其中一個重要升級是把大部分模塊的優(yōu)化器從AdamW換成了Muon,實現(xiàn)了更快的收斂速度、更優(yōu)的訓練穩(wěn)定性。



在Kimi K2.6的技術文檔中,同樣提到了Muon優(yōu)化器,在相同的訓練量下實現(xiàn)了2倍的效率提升。

兩個模型都提到的Muon優(yōu)化器,最早由獨立研究者Keller Jordan在2024年底的博客里提出。同樣被AdamW困擾的月之暗面團隊,在2025年初對Muon進行了關鍵的工程化改進,增加了Weight Decay、RMS控制等能力,并命名為MuonClip。

月之暗面在Kimi K2上率先驗證了Muon優(yōu)化器的穩(wěn)定性,實現(xiàn)了預訓練全程“零Loss Spike”。DeepSeek在訓練V4大模型時,同樣采用了被驗證過的Muon優(yōu)化器。

需要說明的是,開源大模型的“協(xié)同進化”并未陷入同質化,正在走向一條“和而不同”的道路。

比如DeepSeek-V4聚焦基礎模型的核心能力攻堅,進一步筑牢了全球開源大模型的性能天花板,為全行業(yè)提供了性能比肩閉源旗艦的基礎底座;Kimi K2.6深耕Agent工程化落地,解決了大模型長程自主執(zhí)行的痛點,為大模型進入真實生產(chǎn)場景打通了關鍵路徑。

整個過程中,沒有曠日持久的商業(yè)談判,沒有劍拔弩張的專利博弈。在開源陣營里,技術創(chuàng)新正在像水一樣自由流動,誰做得好,大家就用誰的。

在開源生態(tài)中汲取養(yǎng)分,在技術路線上互補。中國的大模型廠商,用行動向世界示范了硅谷之外的另一種可能。

03 美國在“造墻”,中國在“修路”

贊嘆開源協(xié)同進化的同時,必須直面一個商業(yè)現(xiàn)實。

目前OpenAI和Anthropic的年化收入均達到了百億美元以上,而國內頭部大模型廠商的營收,剛跨過年化一億美元的大門。

OpenAI在二級市場的估值約8800億美元,Anthropic的估值已經(jīng)飆升到了1萬億美元左右,而Kimi和DeepSeek新一輪融資的估值,分別為180億美元和200億美元。

有人高呼中國大模型廠商的市值被低估了,也有人認為:“能否將技術口碑轉化為真金白銀,是擺在中國廠商面前的生死大考!币粫r間,關于開源“性價比”的討論甚囂塵上。

想要看清終局,或可以從大模型的競爭階段著手:



第一階段是“拼參數(shù)、拼Benchmark”。到了2026年4月末,這個階段基本結束,各家在榜單上的跑分已經(jīng)拉不開實質性差距。

第二階段是“拼訓練效率、拼推理成本、拼架構創(chuàng)新”。正是當下所處的賽段,也是算力成本倒逼下的必然結果。

第三階段將是“拼Agent體系、拼生態(tài)、拼開發(fā)者”。當Token從免費流量變成執(zhí)行任務的“燃料”時,生態(tài)的繁榮度將決定生死。

國內的開源大模型處于什么生態(tài)位呢?我們找到了兩組直觀的對比數(shù)據(jù)。

一個是訓練成本。

2025年8月發(fā)布的GPT-5,訓練成本超過5億美元;同期的Kimi K2 Thinking,訓練成本約460萬美元;DeepSeek沒有公布V4系列模型的訓練成本,但V3模型僅花費了557.6萬美元......國內大模型廠商只用了不到OpenAI零頭的資源,訓練出了同等水平的模型。

另一個是調用量。

進入2026年后,多模型聚合平臺OpenRouter的數(shù)據(jù)顯示:在OpenClaw代表的Agent產(chǎn)品的帶動下,全球的Token消耗量呈現(xiàn)出了指數(shù)級增長,中國的“開源夢之隊”,憑借“好用又便宜”的口碑,調用量已經(jīng)連續(xù)多周超越美國。

原因并不難解釋。

中國開源陣營已經(jīng)跑通了“正反饋飛輪”:A公司開源底層技術,B公司采用并進行工程優(yōu)化,再將優(yōu)化的結果和經(jīng)驗反哺給整個生態(tài)。如果說閉源模型的進化是建立在海量算力堆砌上的線性增長,等待開源路線的,將是技術創(chuàng)新相互碰撞帶來的指數(shù)級擴散。

按照摩根大通的研報,2025-2030年間中國AI推理token消耗量將實現(xiàn)約330%的年復合增長率,將從2025年的10萬億token,激增至2030年的3900萬億token,增長規(guī)模達370倍。

也就是說,2026年仍處于AI爆發(fā)的初期,未來5年里還有數(shù)百倍的增長機會,遠未到蓋棺定論的時候。

恰恰是對長遠機會的自信,在硅谷巨頭們拼命造墻時,中國的大模型廠商選擇用協(xié)同補位的方式,不斷夯實通往AGI的路。

04 寫在最后

這場轟轟烈烈的AI浪潮,誰會笑到最后?答案不僅關乎模型,還關系到算力的自主可控。如果把模型比作“原子彈”的話,擺脫外部技術封鎖的國產(chǎn)算力,就是將原子彈送上天的“火箭”。

讓人欣慰的是,國產(chǎn)模型和國產(chǎn)算力的融合越來越緊密:DeepSeek V4的技術文檔中,將昇騰NPU與英偉達GPU并列寫入了硬件驗證清單;月之暗面在最新的論文中將大模型推理的預填充和解碼運行在了不同芯片上,為國產(chǎn)芯片大規(guī)模參與模型推理打開了大門。

2025年初,DeepSeek R1為國產(chǎn)大模型爭取到了上牌桌的機會;到了2026年,中國的開源大模型陣營,正在協(xié)同合作中不斷創(chuàng)造更多定義牌桌規(guī)則的硬資本。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
河南鄭州一遠嫁妻子哭訴,丈夫月薪漲至6萬后頻繁家暴,岳母下跪求情仍不停手,還侮辱其女兒容貌,已去世婆婆曾勸阻:現(xiàn)在離婚虧了

河南鄭州一遠嫁妻子哭訴,丈夫月薪漲至6萬后頻繁家暴,岳母下跪求情仍不停手,還侮辱其女兒容貌,已去世婆婆曾勸阻:現(xiàn)在離婚虧了

大風新聞
2026-04-28 15:13:21
特變電工:一季度歸母凈利潤18.15億元 同比增長13.4%

特變電工:一季度歸母凈利潤18.15億元 同比增長13.4%

證券時報
2026-04-29 17:04:17
太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

太可怕了!繼注射藥物、熱巴事件后,王陽再揭娛樂圈最臟的一面

橙星文娛
2026-04-17 13:19:56
所有人都說錢越來越難賺了,可2025年GDP依舊上漲5%

所有人都說錢越來越難賺了,可2025年GDP依舊上漲5%

流蘇晚晴
2026-04-27 19:48:45
外資“躺平網(wǎng)紅”用偽躺平洗腦網(wǎng)民,眾多網(wǎng)民被洗腦而走向極端

外資“躺平網(wǎng)紅”用偽躺平洗腦網(wǎng)民,眾多網(wǎng)民被洗腦而走向極端

清濱酒客
2026-04-29 15:50:57
5月起殯葬新規(guī)正式試行!824號令全面落地,城鄉(xiāng)居民都要早了解

5月起殯葬新規(guī)正式試行!824號令全面落地,城鄉(xiāng)居民都要早了解

復轉這些年
2026-04-28 11:37:16
土以要開打?埃爾多安威脅攻打以色列后,不到1天,卡茨強勢出招

土以要開打?埃爾多安威脅攻打以色列后,不到1天,卡茨強勢出招

老謝談史
2026-04-14 17:08:45
正式發(fā)行!2026版人民幣來了,不是新紙幣,兌換辦法一次說清

正式發(fā)行!2026版人民幣來了,不是新紙幣,兌換辦法一次說清

說故事的阿襲
2026-04-29 15:31:50
特朗普:伊朗剛告知我們,他們已處于“崩潰狀態(tài)”,希望美國盡快開放海峽!伊朗:已絕對控制霍爾木茲,通過須繳費、用波斯語通訊

特朗普:伊朗剛告知我們,他們已處于“崩潰狀態(tài)”,希望美國盡快開放海峽!伊朗:已絕對控制霍爾木茲,通過須繳費、用波斯語通訊

每日經(jīng)濟新聞
2026-04-28 22:58:06
破案!沒有得罪杜鋒,陳家政卻被棄用的原因找到,粵名嘴說出實情

破案!沒有得罪杜鋒,陳家政卻被棄用的原因找到,粵名嘴說出實情

后仰大風車
2026-04-29 09:05:11
趙心童被不雅喊話24小時,特魯姆普曝墨菲奪冠優(yōu)勢,潘曉婷坦言

趙心童被不雅喊話24小時,特魯姆普曝墨菲奪冠優(yōu)勢,潘曉婷坦言

李橑在北漂
2026-04-29 16:40:08
姚高員任浙江省政府黨組成員

姚高員任浙江省政府黨組成員

汲古知新
2026-04-28 14:30:38
動不動就是3秒加速,你一個電車跑那么快有什么用?

動不動就是3秒加速,你一個電車跑那么快有什么用?

少數(shù)派報告Report
2026-04-29 05:14:45
朝鮮獲贈德國“豹2”、美國M1A1坦克,這下朝鮮又有好東西山寨了

朝鮮獲贈德國“豹2”、美國M1A1坦克,這下朝鮮又有好東西山寨了

藍星雜談
2026-04-27 17:33:21
WC!火箭或交易杜蘭特...

WC!火箭或交易杜蘭特...

技巧君侃球
2026-04-29 18:09:29
湯唯宣布懷二胎:大大的意外,很開心,家里要多匹小馬駒了,都很期待

湯唯宣布懷二胎:大大的意外,很開心,家里要多匹小馬駒了,都很期待

魯中晨報
2026-04-29 18:16:06
石油巨震!阿聯(lián)酋退出歐佩克,引爆金融核彈,人民幣砍出致命一刀

石油巨震!阿聯(lián)酋退出歐佩克,引爆金融核彈,人民幣砍出致命一刀

最美的開始
2026-04-29 10:46:23
鞏曉彬犀利點評,忍不住爆粗口,邱彪這次丟人丟大了

鞏曉彬犀利點評,忍不住爆粗口,邱彪這次丟人丟大了

硯底沉香
2026-04-29 17:57:21
96歲奶奶街頭擺攤10年還清2077萬元債務,本人最新回應:這輩子沒做過什么大事,只是守住了做人的底線

96歲奶奶街頭擺攤10年還清2077萬元債務,本人最新回應:這輩子沒做過什么大事,只是守住了做人的底線

極目新聞
2026-04-28 21:45:41
突發(fā),金價暴跌!

突發(fā),金價暴跌!

吉刻新聞
2026-04-29 09:41:29
2026-04-29 18:51:00
Alter聊科技 incentive-icons
Alter聊科技
探究產(chǎn)業(yè)興衰,專注商業(yè)解讀。
1502文章數(shù) 168128關注度
往期回顧 全部

科技要聞

今晨庭審紀實|馬斯克當庭講述OpenAI被偷走

頭條要聞

女子被騙與"未婚"高管發(fā)生關系 得知對方年薪百萬舉報

頭條要聞

女子被騙與"未婚"高管發(fā)生關系 得知對方年薪百萬舉報

體育要聞

一場九球狂歡,各路神仙批量下凡

娛樂要聞

馬頔一句話,孫楊媽媽怒罵節(jié)目組2小時

財經(jīng)要聞

蘇州,率先進入牛市

汽車要聞

技術天花板再摸高 全能型的奕境X9首秀

態(tài)度原創(chuàng)

游戲
健康
親子
房產(chǎn)
公開課

LCK第二賽段:Scout也帶不動,T1零封NS,斬獲四連勝

干細胞治燒燙傷能用了么?

親子要聞

5年的備孕道路說清楚DHEA 正確服用方法

房產(chǎn)要聞

80億投資!浙商總部基地+?诒闭,金沙灣這是要起飛!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版