国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek,該卸下掃地僧的枷鎖了

0
分享至

我每次翻《天龍八部》,翻到少林寺藏經(jīng)閣那一段,都要停下來。

蕭遠(yuǎn)山、蕭峰父子對上慕容博、慕容復(fù)父子,鳩摩智再從旁攪局,三十年的血海深恨攪在一處,眼看就要分出生死。就在這當(dāng)口,一個枯瘦的掃地僧走了出來。

蕭峰的降龍十八掌打在他身上,他雖受內(nèi)傷吐血,卻以渾厚內(nèi)力生生受之;他舉手投足間讓慕容博陷入「假死」復(fù)又救活,這種生死由心的境界,令在場一眾頂尖高手莫不震懾失語。


這一刻,誰強誰弱,答案不言而喻。

AI 圈最近幾年,流行把 DeepSeek(深度求索)比作這位老僧。在所有人眼里,AI 賽道的格局早已注定,海外有御三家,國內(nèi)有大廠和彼時風(fēng)頭正盛的 AI 六小虎,輪不到旁人來置喙。

結(jié)果一家做量化交易出身的中國公司,悄沒聲兒地走出來,用一套從天而降的招法,在各項核心評測上與這幫人正面交手,打得有來有回。


只是,掃地僧出場,是《天龍八部》行將收尾的時刻。他的使命是終結(jié)紛爭、化解戾氣,然后全書走向尾聲??纱竽P偷墓适?,沒有尾聲,也沒有終章,只有下一回,還有下下一回。

把 DeepSeek 比作掃地僧,是對它過去的最高贊譽,但如果這三個字正在慢慢變成困住它的枷鎖,我倒覺得,贊譽和催命符,有時候只在一念之間。

掃地僧是怎么練成的

金庸寫掃地僧,從來不正面寫他的功夫。他寫的是別人的反應(yīng),蕭峰愣了,慕容復(fù)愣了,旁觀的人也愣了。高手的境界,要從旁人失語的瞬間才能傳遞出來。

DeepSeek 的故事,也暗合這個邏輯。

作為杭州的一家對沖基金,外人提到幻方量化,第一反應(yīng)是期貨、是算法交易、是數(shù)學(xué)天才們盯著屏幕上跳動的數(shù)字。這和 AI 大模型,八竿子打不著,卻悄悄把一批工程師和研究員聚在一起做大模型。


2023 年 11 月,他們發(fā)布首個開源代碼大模型 DeepSeek Coder,后續(xù)拿出了一個 67B 的語言模型。在官方給出的多項評測中,67B 超過了 LLaMA2 70B,67B Chat 在部分中文和開放式評測中優(yōu)于 GPT 3.5。只是,圈內(nèi)少數(shù)幾個消息靈通的人注意到了,大多數(shù)人沒注意到。掃地僧還在掃地,少林寺的人都在忙著練少林長拳。

讓其開始嶄露頭角,是 2024 年 5 月 7 日發(fā)布的 V2。V2 用的是 MoE(混合專家)架構(gòu),總參數(shù) 2360 億,但每次推理實際激活的只有 210 億。與此同時,V2 首次采用了 MLA(多頭潛在注意力)機制,大幅壓縮了推理時的顯存占用。

兩相疊加,讓模型在同等效果下,跑得更快,花得更少。用金庸的話來說,這叫以柔克剛,以精妙的內(nèi)功路數(shù),彌補了真氣總量上的不足。


▲ https://arxiv.org/abs/2405.04434

但砸出最大水花的,是定價。V2 的 API 定價,每百萬 token 輸入 1 元,輸出 2 元。GPT-4 Turbo 當(dāng)時是它的七十倍,Meta 的 Llama3 70B 是它的七倍。一塊錢,一百萬個 token,大約相當(dāng)于一本《三國演義》的字?jǐn)?shù)。

這個價格擺出來,讓整個國內(nèi)大模型市場為之色變。當(dāng)月,字節(jié)、阿里、百度、騰訊、訊飛、智譜,一家接一家跳出來宣布降價,最高降幅 97%,部分輕量級模型直接免費開放。

一場持續(xù)了大半年的價格戰(zhàn),就這么被 DeepSeek 的一句定價點燃了。那時候,業(yè)內(nèi)給 DeepSeek 送了個外號,價格屠夫。

美國的半導(dǎo)體咨詢公司 SemiAnalysis 在那段時間寫了一篇分析,說這家公司有可能成為 OpenAI 的對手,也有可能碾壓其他開源大模型。當(dāng)時讀到這句話的人,大概有一半覺得是危言聳聽。一年多以后回頭看,沒有人再覺得是危言聳聽了。


2024 年末的 V3 和 2025 年初的 R1,則是連續(xù)出手的兩招,把對手打得目瞪口呆。DeepSeek 用極低的投入,打出了旗鼓相當(dāng)?shù)男Ч?/p>

更讓人震驚的是參與人數(shù),139 名工程師和研究人員完成了這個項目,而 OpenAI 同期有 1200 名研究人員,Anthropic 有 500 名。Meta 超級智能實驗室負(fù)責(zé)人亞歷山大·王后來說了一句被廣泛流傳的話,當(dāng)美國人休息時,他們在工作,而且以更便宜、更快、更強的產(chǎn)品追上我們。

緊接著便是是 R1,主打深度推理,數(shù)學(xué)、代碼、邏輯,在相當(dāng)多的測試維度上與 OpenAI o1 不落下風(fēng),訓(xùn)練方法用的是 GRPO 強化學(xué)習(xí),靠讓模型自己想清楚來提升推理能力。


最要緊的一步是開源。

R1 的開源,被廣泛解讀為一種慷慨。模型權(quán)重、技術(shù)論文、訓(xùn)練細(xì)節(jié)全部公開,全球開發(fā)者共享成果。這套敘事里,DeepSeek 是那個敞開藏經(jīng)閣大門的人,路不拾遺,人人可進(jìn)。

武功秘籍直接擺桌上,誰想學(xué)誰來拿的這一手,也打破了少數(shù)幾家巨頭對前沿模型的壟斷,讓全球數(shù)以萬計的中小開發(fā)者有了和頂尖模型掰手腕的資格。

金庸寫掃地僧,主要抓住幾樣?xùn)|西,出身邊緣、多年隱匿、一鳴驚人、技法精絕、胸懷坦蕩。DeepSeek V2 的價格屠刀、V3 的成本奇跡、R1 的開源普惠,也讓人們在 DeepSeek 身上,真真切切地看見了那個老僧的影子。

枷鎖,以及枷鎖之后

但武俠小說是會結(jié)束的,AI 賽道不會。

每次我寫 DeepSeek 的文章,底下的評論區(qū)都像藏經(jīng)閣又打了一場架。有人說它安安靜靜做產(chǎn)品,不收費、不立人設(shè),能用就用,這才是正道。有人說它連國產(chǎn)其他巨頭都未必打得過,已經(jīng)無法攪局。


有人替它抱不平,有人覺得它早就該被淘汰。更有人說,「我們一直以來都沒把 DeepSeek 當(dāng)作優(yōu)等生,而是當(dāng)作掃地僧,真心希望它能如我們所愿」,這句話說得又期待,又帶著一絲說不清楚的悲涼。


意見如此撕裂,本身就說明了一件事。DeepSeek 所受到的關(guān)注,早已超出了一家普通 AI 公司應(yīng)有的體量。捧它的人把它捧上神壇,罵它的人把它踩進(jìn)泥里,沒有幾家公司能在輿論場里同時承受這兩種極端。

這篇文章大概也逃不過同樣的命運,有人會說這是黑稿,有人會說這是 PR 稿,落個兩頭不討好。但這無所謂,輿論從來都是這樣,藏經(jīng)閣里打架,不管誰贏,總有人不服。


說回正題,掃地僧出場那一幕,是《天龍八部》收尾的信號。他出手,紛爭平息,故事逐漸走向終章。這個敘事結(jié)構(gòu),似乎天然就帶著一種大結(jié)局的氣息,英雄橫空出世,一招定乾坤,從此江湖太平。

根據(jù)《創(chuàng)智記》援引知情人士消息稱,按照創(chuàng)始人梁文鋒在內(nèi)部透露的時間,DeepSeek V4 將于四月下旬正式發(fā)布。
爽文里的主角,每一章都要有突破,讀者翻到下一頁,期待的永遠(yuǎn)是更大的驚喜。

V3 和 R1 用四兩撥千斤的邏輯征服了世界,大眾于是開始把它當(dāng)成 DeepSeek 的固定輸出,每一次出手都必須讓硅谷巨頭血濺千里,都必須讓英偉達(dá)的股價抖一抖。V4 也應(yīng)當(dāng)如此。


可在這等待一年多的時間里,外界等得有些躁動,各路聲音都出來了,說一拖再拖,是不是黔驢技窮了,掃地僧要不行了?說這話的人認(rèn)為 DeepSeek 理應(yīng)每次出手都是奇跡,一旦慢了半拍,便是江郎才盡。

慢,自然有慢的原因。

3 月 29 日,DeepSeek 的服務(wù)器崩了將近十三個小時,創(chuàng)下網(wǎng)頁端和 App 平臺上線以來最長中斷紀(jì)錄。連續(xù)的服務(wù)事故暴露了 DeepSeek 在運維監(jiān)控、應(yīng)急預(yù)案和災(zāi)備機制上的明顯短板,也給整個 AI 行業(yè)敲響警鐘。


當(dāng)然,綜合各家報道來看,V4 一再推遲的原因,還藏在芯片層面。

V3 和 R1 的成功,一定程度上建立在成熟的英偉達(dá) CUDA 生態(tài)上,DeepSeek 的工程師們在工具完備、文檔詳盡、社區(qū)活躍的環(huán)境里,把算法效率一點一點榨到了極限,每一步都踩得踏實。

V4 要做的事,是把這套功夫移植到國產(chǎn) AI 芯片上。工具鏈還在快速迭代,底層接口和 CUDA 差異巨大,分布式訓(xùn)練框架幾乎需要從頭重構(gòu)。

DeepSeek 交出的答卷,如果是在受限條件下做出來的,這讓它的每一分成績,都帶著額外的含金量。哪怕梁文鋒愿意為這件事多拖幾個月,也是一筆非常劃算的決策。

至于 V4 本身,《創(chuàng)智記》報道稱,技術(shù)重心據(jù)悉落在了 LTM(長期記憶)能力的突破上,同時將原生多模態(tài)從底層融入架構(gòu),文字和視覺在預(yù)訓(xùn)練階段就融合在一起。

另一個值得關(guān)注的變化,是梁文鋒本人的注意力在悄悄轉(zhuǎn)移。盡管在過去的一年里,包括 R1 的核心作者郭達(dá)雅在內(nèi)的部分 DeepSeek 核心骨干陸續(xù)離職,不過根據(jù)《晚點 LatePost》的觀察,DeepSeek 的人才基本盤依然穩(wěn)固,并未出現(xiàn)大規(guī)模的人才流失現(xiàn)象。

進(jìn)入 2025 年下半年,梁文鋒也愈發(fā)看重技術(shù)的商業(yè)落地與產(chǎn)品化進(jìn)程,積極招募負(fù)責(zé) Agent 領(lǐng)域的策略產(chǎn)品經(jīng)理。與此同時,他正在為公司啟動估值,給員工的期權(quán)一個明確的錨點,讓團隊對未來有更清晰的預(yù)期。


綜合上述種種動向不難得出一個結(jié)論:曾經(jīng)心無旁騖盯著 AGI 的 DeepSeek 也得開始面對一家成熟科技公司必須面對的那些現(xiàn)實:商業(yè)閉環(huán)、生態(tài)建設(shè)、可持續(xù)的收入來源。

掃地僧可以幾十年不問江湖俗事,守著藏經(jīng)閣一掃到底,一家公司,沒有這個選項。

《笑傲江湖》里的令狐沖憑著獨孤九劍可以破盡天下武功,但當(dāng)他真正坐鎮(zhèn)恒山派,每天迎來送往,護(hù)佑門人,一招鮮遠(yuǎn)遠(yuǎn)不夠,他需要的是內(nèi)政、是人心、是香火代代相傳的根基。奇招,解決不了日常的柴米油鹽。


因此,我們應(yīng)該主動幫 DeepSeek 卸下「掃地僧」這個名號。這三個字是對過去的最高褒獎,卻是對未來的過重負(fù)擔(dān)。即便 V4 發(fā)布時沒有斷崖式的領(lǐng)先,只是一款 LTM 扎實、多模態(tài)原生融合、各項指標(biāo)均衡的水桶機。

從產(chǎn)業(yè)的角度看,這依然是巨大的成功,成功在于它或許將證明 DeepSeek 有能力從一個創(chuàng)造奇跡的挑戰(zhàn)者,變成一個穩(wěn)定交付的基礎(chǔ)設(shè)施提供者。

有意思的是,這件事或許本來就是雙向的?!锻睃c LatePost》此前的報道里,DeepSeek 對外的溝通姿態(tài)明顯比以往克制,既沒有大張旗鼓地預(yù)熱,也沒有放出足以吊足胃口的技術(shù)信號。

這種低調(diào),很難說是無意為之。

他們比任何人都清楚,掃地僧這三個字背后懸著什么。每一次出手若不能再掀翻整張牌桌,輿論的落差就會被無限放大。這是一種預(yù)期管理,也是一種自我解綁——他們同樣不想再背著這個包袱走下去。


▲AI 模型的世界,已經(jīng)從少數(shù)幾家機構(gòu)的專屬游戲,變成了全球開發(fā)者共同參與的基礎(chǔ)設(shè)施建設(shè),而且這個趨勢還在加速。 https://huggingface.co/blog/huggingface/state-of-os-hf-spring-2026

而話說回來,當(dāng)輿論都在一窩蜂盯著 DeepSeek,卻少有人往旁邊多看一眼。


▲開源模型等級列表,圖片來源:https://www.interconnects.ai/p/2025-open-models-year-in-review

這片江湖里,國內(nèi)每一家 AI 都在苦修內(nèi)功,押注多模態(tài)、Agent 生態(tài)、算力布局,也都在各自的賽道上走出了自己的路數(shù)。

DeepSeek 固然是那個最讓人心跳加速的名字,但把眼光只鎖死在它一家身上,未免看窄了這個時代。真正讓天龍八部成為天龍八部的,是那一整代人各有來路,各有絕學(xué),彼此激蕩,才撐起了那個波瀾壯闊的時代。

掃地僧的傳說,止于藏經(jīng)閣那一戰(zhàn),藏經(jīng)閣外,才是真的江湖。

作者:莫崇宇

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
伊朗:沖突爆發(fā)以來,石油出口“一天也未中斷”;美以軍事打擊給伊朗已造成2700億美元損失

伊朗:沖突爆發(fā)以來,石油出口“一天也未中斷”;美以軍事打擊給伊朗已造成2700億美元損失

魯中晨報
2026-04-14 15:56:02
女子被香港機場刁難,百萬元雕塑被捏毀,機票作廢,第二天更氣人

女子被香港機場刁難,百萬元雕塑被捏毀,機票作廢,第二天更氣人

米果說識
2026-04-11 22:20:53
孕婦買200元水果后續(xù):打掉二胎,坦言止損,計劃曝光

孕婦買200元水果后續(xù):打掉二胎,坦言止損,計劃曝光

蕭鑟科普解說
2026-04-14 11:32:34
章子怡新電影路透照,穿灰襯衫戴眼鏡素顏出鏡,網(wǎng)友:完全認(rèn)不出

章子怡新電影路透照,穿灰襯衫戴眼鏡素顏出鏡,網(wǎng)友:完全認(rèn)不出

悠悠說世界
2026-04-14 10:07:26
章子怡為新電影角色增重20斤,劇透照曝光,素顏狀態(tài)讓人認(rèn)不出來

章子怡為新電影角色增重20斤,劇透照曝光,素顏狀態(tài)讓人認(rèn)不出來

觀魚聽雨
2026-04-13 20:38:29
中央候補委員新職務(wù)明確!七個省級黨委組織部部長調(diào)整

中央候補委員新職務(wù)明確!七個省級黨委組織部部長調(diào)整

上觀新聞
2026-04-14 11:58:06
泡泡瑪特盤中漲超8%,段永平高調(diào)宣布:我現(xiàn)在是王寧的粉絲

泡泡瑪特盤中漲超8%,段永平高調(diào)宣布:我現(xiàn)在是王寧的粉絲

21世紀(jì)經(jīng)濟報道
2026-04-14 14:09:03
上海男籃沖擊20連勝!盧偉拒絕爆冷,懷特塞德回歸,央視直播

上海男籃沖擊20連勝!盧偉拒絕爆冷,懷特塞德回歸,央視直播

體壇瞎白話
2026-04-14 10:42:39
出大事了,內(nèi)塔獲準(zhǔn)不出庭審判后,也門首個硬剛,美以或無路可退

出大事了,內(nèi)塔獲準(zhǔn)不出庭審判后,也門首個硬剛,美以或無路可退

書紀(jì)文譚
2026-04-14 13:29:24
23秒守住638場全勤!職業(yè)生涯沒缺席過!你是真牛!

23秒守住638場全勤!職業(yè)生涯沒缺席過!你是真牛!

柚子說球
2026-04-13 17:56:33
送別!安平逝世,享年65歲

送別!安平逝世,享年65歲

環(huán)球網(wǎng)資訊
2026-04-13 18:56:09
9球13助攻 曼城神操作 3600萬歐撿漏新德布勞內(nèi) 一年不到身價翻倍

9球13助攻 曼城神操作 3600萬歐撿漏新德布勞內(nèi) 一年不到身價翻倍

零度眼看球
2026-04-14 09:26:20
“九寨溝惡勢力出租車圍毆群眾”?警方通報

“九寨溝惡勢力出租車圍毆群眾”?警方通報

黃河新聞網(wǎng)呂梁
2026-04-13 15:11:54
陪玩陪睡不算啥!繼注射不明物體后,內(nèi)娛又傳噩耗連楊紫也被牽連

陪玩陪睡不算啥!繼注射不明物體后,內(nèi)娛又傳噩耗連楊紫也被牽連

林輕吟
2026-04-11 19:36:46
約P?多人運動?夜夜不重樣?“娛圈鐵腎”的瓜

約P?多人運動?夜夜不重樣?“娛圈鐵腎”的瓜

萌姐
2026-04-11 18:44:38
何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

何潔自曝養(yǎng)家艱難,40歲斷崖式衰老?明明一手好牌,為何被打爛

扒點半吃瓜
2026-03-10 07:00:13
TA:若伊朗無法參加世界杯,意大利或?qū)⑼ㄟ^附加賽遞補參賽

TA:若伊朗無法參加世界杯,意大利或?qū)⑼ㄟ^附加賽遞補參賽

懂球帝
2026-04-13 21:15:11
能不能發(fā)生關(guān)系,都是由女人決定的

能不能發(fā)生關(guān)系,都是由女人決定的

加油丁小文
2026-04-11 07:00:09
給演“偉人”的5位演員排名:唐國強第五,古月僅第二,第一是誰

給演“偉人”的5位演員排名:唐國強第五,古月僅第二,第一是誰

琨玉秋霜
2026-03-16 17:07:00
油價即將大跳水!4月21日官宣,加滿一箱能省多少錢?

油價即將大跳水!4月21日官宣,加滿一箱能省多少錢?

沙雕小琳琳
2026-04-13 21:03:20
2026-04-14 16:27:00
愛范兒 incentive-icons
愛范兒
消費科技第一媒體
38694文章數(shù) 2601475關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴(yán)對華芯片法案來了

頭條要聞

防范特朗普政府"對華軟化" 史上最嚴(yán)對華芯片法案來了

體育要聞

他做對了所有事,卻被整個職業(yè)網(wǎng)壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財經(jīng)要聞

許家印受審當(dāng)庭表示認(rèn)罪悔罪

汽車要聞

長城歐拉5限定版純電版上市 限量99臺售價13.38萬元

態(tài)度原創(chuàng)

教育
時尚
健康
藝術(shù)
軍事航空

教育要聞

初中數(shù)學(xué),根式運算

今年科切拉的風(fēng)吹向了誰?

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

藝術(shù)要聞

這位美女畫家的夏天竟如此夢幻

軍事要聞

伊朗要求五個中東國家賠償戰(zhàn)爭損失

無障礙瀏覽 進(jìn)入關(guān)懷版