国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

知春路最有AGI理想的兩個男人

0
分享至


深度求索(北京子公司)和月之暗面都位于海淀區(qū)知春路一帶,相距僅1.4公里,步行只需十幾分鐘。站在其中一家公司的會議室里,能隔空望見另一家公司的辦公樓?;蛟S在某些時刻,它們的研究員會隔著一片樓宇對望,腦海里浮現(xiàn)的盡是關(guān)于AGI藍(lán)圖的構(gòu)想。

物理空間的接近,讓這兩家公司員工氣質(zhì)多有相像:低調(diào),純粹,專注AGI。在社交媒體里,你能看到幾乎每位DeepSeek研究員的關(guān)注列表里都會有Kimi研究員,而Kimi研究員的關(guān)注列表里也躺著不少DeepSeek研究員。

過去一年,Kimi研究員對DeepSeek幾乎不吝贊美。我們?nèi)ツ?月和Kimi的人士有過短暫交流,當(dāng)時他就直言“感謝DeepSeek”。本月初,《人物》雜志詳細(xì)報道了月之暗面這家公司,同樣指出“你能夠感受到公司中蔓延的對DeepSeek的尊重”。

正是DeepSeek R1的出現(xiàn)教育了市場,硬實力就是最好的推廣。去年Kimi也選擇了DeepSeek敲開的推理路線,并一路在agent能力上實現(xiàn)超越。

這種惺惺相惜,也體現(xiàn)在DeepSeek的研究員身上。一位DeepSeek研究員非常直白地告訴我們,他個人比較看好Kimi,這兩家公司有著相似的技術(shù)理想,也更純粹,但在管理上略有不同。DeepSeek做事慢一點(diǎn),會做得更細(xì)致一點(diǎn),“如果Kimi老板看對了方向,可能比DeepSeek更快接近AGI?!?/p>

相似的技術(shù)氣質(zhì),讓這兩家公司更愿意押注那些成本高、周期長、不確定性強(qiáng)的方向,也因此更有機(jī)會觸發(fā)范式級的能力躍遷。

它們同樣是資本熱衷的對象。一位去年參與Anthropic融資的國內(nèi)一線投資機(jī)構(gòu)人士告訴我們,國內(nèi)模型公司里,如果能閉著眼選兩家直接打錢,一個是DeepSeek,另一個就是Kimi。

從投資人、大模型科學(xué)家到行業(yè)內(nèi)部從業(yè)者,都在不約而同地將這兩家公司放在同一坐標(biāo)系中審視。審視公司,也是審視兩位創(chuàng)始人梁文鋒和楊植麟。他們同樣信仰Scaling Law的底層力量,堅持“模型即產(chǎn)品”的極簡邏輯,在互聯(lián)網(wǎng)大廠的流量圍剿中守住了C端用戶基本盤,也同樣在海外市場撕開了中國大模型的品牌缺口。

海淀區(qū)知春路一向被認(rèn)為是創(chuàng)業(yè)者的福地。張一鳴曾于2012年在知春路的一處民宅中創(chuàng)立今日頭條,開啟了他的創(chuàng)業(yè)歷程。當(dāng)前AI時代,這兩個扎根知春路一帶的AI創(chuàng)業(yè)新星,在技術(shù)迭代、戰(zhàn)略選擇甚至一些心境上,都愈加同頻。

01

一種默契

4月的倒數(shù)第二周,Qwen、Kimi、DeepSeek、小米、騰訊的新模型扎堆發(fā)布。4月20號,Kimi發(fā)布了Kimi2.6并開源,該模型在多項編碼基準(zhǔn)測試中超越GPT-5.4和Claude Opus 4.6等閉源模型,大幅增強(qiáng)了Agent自主化執(zhí)行能力,長程編碼能力也得到顯著提升。

僅僅4天后,DeepSeek V4也終于在外界的關(guān)注下姍姍來遲。DeepSeek官方同樣稱,相比前代模型,DeepSeek-V4-Pro的Agent能力顯著增強(qiáng),在Agentic Coding評測中,V4-Pro已達(dá)到當(dāng)前開源模型最佳水平,并在其他Agent相關(guān)評測中同樣表現(xiàn)優(yōu)異。

此時距離上一代V3發(fā)布已經(jīng)過去了484天,這期間DeepSeek從爆紅到幾乎隱身,用戶數(shù)也一度大幅下滑,甚至被指責(zé)只是曇花一現(xiàn)。梁文鋒團(tuán)隊承受巨大壓力。在官方公眾號發(fā)布V4新模型的文章里,梁文鋒引用了荀子的名言:“不誘于譽(yù),不恐于誹,率道而行,端然正己?!边@是他的自勉,也是對過去一年最好的回應(yīng)。

沒人比楊植麟更懂這種被全世界冷落的感受。去年年初DeepSeek爆紅時,作為創(chuàng)業(yè)明星的楊植麟默默承壓。外界紛紛詬病月之暗面陷入流量依賴的路徑陷阱,基座模型進(jìn)展遲緩,在萬億參數(shù)競賽、推理能力突破、開源生態(tài)布局上,全面落后于橫空出世的DeepSeek。

楊植麟對此從未回應(yīng),只是帶領(lǐng)團(tuán)隊埋頭研發(fā)新模型。直到2025年7月11日,Kimi K2發(fā)布,總參數(shù)達(dá)到萬億,并采用Muon二階優(yōu)化器訓(xùn)練,也是國產(chǎn)大模型首次大規(guī)模用二階優(yōu)化。

一時間Kimi K2震動全球,《自然》雜志稱:“另一個DeepSeek時刻”。楊植麟用新模型回應(yīng)過去的一切。

去年8月,楊植麟接受媒體人采訪時說:“這也是Kimi跟我講的——任何中間狀態(tài)都有可能成為被批評的對象。你總是會有這個時代的局限性?!边@種豁達(dá)的價值觀,與梁文鋒引用荀子的名句所表達(dá)的價值觀幾乎一致。

梁文鋒與楊植麟的相似性,根植于對AGI的共同信仰。他們都堅信,大模型的能力上限由基礎(chǔ)架構(gòu)與參數(shù)規(guī)模的持續(xù)突破定義,所有的產(chǎn)品體驗與商業(yè)價值,都要建立在基座模型能力領(lǐng)先之上。這種信仰,讓兩家公司在技術(shù)路線上走出了罕見的協(xié)同進(jìn)化軌跡。

從去年至今,媒體關(guān)于DeepSeek與Kimi敘事都是“撞車”,包括發(fā)新論文和新模型的架構(gòu)和參數(shù)量。例如DeepSeek V4采用MoE混合專家架構(gòu),總參數(shù)規(guī)模達(dá)到1.6萬億,激活參數(shù)約370億。而Kimi K2系列同樣采用萬億級MoE架構(gòu),總參數(shù)1萬億,激活參數(shù)320億。

類似的“撞車”太多。事實上它們遠(yuǎn)不止“撞車”這么簡單,而是已經(jīng)形成了互相驗證乃至彼此復(fù)用的默契。

2025年年初,DeepSeek在V3模型中推出的MLA多頭潛在注意力機(jī)制,通過壓縮KV緩存大幅降低了大模型推理成本,成為萬億參數(shù)模型落地的核心架構(gòu)創(chuàng)新。而Kimi在后續(xù)的K2系列模型中,直接沿用了這一架構(gòu),為其超長上下文與Agent能力的落地掃清了工程障礙。

到了2025年7月,Kimi在萬億參數(shù)MoE模型K2中,率先規(guī)?;炞C自研Muon二階優(yōu)化器,官方論文與技術(shù)報告確認(rèn),其token效率達(dá)AdamW的2倍,訓(xùn)練成本降低50%以上,成為全球首個在萬億級別落地的二階優(yōu)化方案。

而這次DeepSeek V4的技術(shù)報告里顯示,也跟進(jìn)采用了Muon,成為其1.6萬億參數(shù)模型訓(xùn)練的核心底座。


兩家公司形成的默契,背后是兩個創(chuàng)始人的精神共振。梁文鋒從量化投資起家,帶著“用極致工程能力實現(xiàn)模型效率革命”的底色,DeepSeek從成立之初就堅持用自有資金支撐底層研發(fā),只為不受短期商業(yè)目標(biāo)干擾。

楊植麟出身清華與卡內(nèi)基梅隆大學(xué),是NLP領(lǐng)域的頂尖學(xué)術(shù)人才。從創(chuàng)立月之暗面之初,他就定下了“用長上下文能力突破AGI邊界”的核心路線,即便在行業(yè)流量戰(zhàn)最激烈的階段,也堅持將核心資源投入基座模型研發(fā)。

這兩個在知春路一帶相距1.4公里的男人,忙得也許很少能見到面,但他們可能又是神交已久且最了解對方的那個人。

02

海外影響力

DeepSeek和Kimi另一個共同點(diǎn),是在海外的口碑,這也是它們能夠吸引投資的重要原因之一。一家一線投資機(jī)構(gòu)在Kimi估值60億美金的時候進(jìn)入,后續(xù)兩輪都選擇了跟進(jìn)。

“模型好,產(chǎn)品好,認(rèn)知好,全球化做得好,團(tuán)隊反應(yīng)速度也快。”這家機(jī)構(gòu)參與投資的人士舉例稱,全球化上最明顯的案例就是今年3月國外產(chǎn)品Cursor套殼Kimi。

3月20日,Cursor正式發(fā)布新編程模型Composer 2,官方博客全程強(qiáng)調(diào),自研,持續(xù)預(yù)訓(xùn)練+大規(guī)模強(qiáng)化學(xué)習(xí),并宣稱超越Claude Opus 4.6,價格僅為其1/10。

幾個小時后,一位開發(fā)者調(diào)試Cursor API時,截獲內(nèi)部模型ID:kimi-k2p5-rl-0317-s515-fast。直譯為,Kimi K2.5 +強(qiáng)化學(xué)習(xí)(RL)+3.17版本+快速推理。馬斯克下場回復(fù)帖子下評論:“Yes, Kimi 2.5!”,全球輿論引爆。

“你就從Cursor訓(xùn)了它的模型就能看出來,Kimi的全球的認(rèn)知肯定是很好的?!鄙鲜鐾顿Y人說。

自去年發(fā)布Kimi K2以來,Kimi幾乎每隔兩個月就有一次重大發(fā)布。同年11月,Kimi推出萬億參數(shù)的K2 Thinking大模型,在智能體工具調(diào)用能力測試中93%的得分位居全球第一,超過OpenAI、Anthropic 等海外閉源旗艦?zāi)P?,成為?dāng)時 “最大最好的開源模型”。

今年1月推出的K2.5,在多模態(tài)、長記憶和智能體上全方位升級,隨后借助小龍蝦的火熱,在技術(shù)社區(qū)走紅。2月登頂海外模型聚合平臺OpenRouter,成為周榜調(diào)用量冠軍。

同樣在3月,Kimi發(fā)布重磅技術(shù)報告,被認(rèn)為挑戰(zhàn)了Transformer沿用11年的殘差連接機(jī)制,前OpenAI研究副總裁Jerry Tworek也評價其為“深度學(xué)習(xí)2.0”的開端。馬斯克轉(zhuǎn)發(fā)評論:“Impressive work from Kimi”(Kimi 的工作令人印象深刻)。


DeepSeek的海外影響力自不必多說。去年年初DeepSeek R1就是率先在海外走紅的,在一些海外開發(fā)者和創(chuàng)業(yè)者心中,DeepSeek被奉為開源之神的存在。

本月DeepSeek V4發(fā)布后,再次在海外掀起巨量討論。憑借極致性價比,《彭博》把DeepSeek V4寫成對OpenAI和Anthropic的有力挑戰(zhàn)。盡管也有不少聲音認(rèn)為,V4的聲量完全不如V3帶來的沖擊。

“對開發(fā)者而言,國產(chǎn)開源模型DeepSeek、Kimi和智譜雖然和海外閉源模型相比仍有幾個月的差距,但這些模型憑借性價比依然是最能打的。”上述投資人士稱。

資本市場對DeepSeek的興趣也已經(jīng)達(dá)到前所未有的程度。DeepSeek融資,相關(guān)報道滿天飛,官方一直未回應(yīng)。

我們獨(dú)家獲悉,DeepSeek融前估值是3000億人民幣,約合440億美元。DeepSeek計劃增資500億,內(nèi)部增資200億,對外募資300億。這次投資非常隱秘,屬于定向邀約,要求也極高。一家一線投資機(jī)構(gòu)因為募資的基金里有許多個人投資人未達(dá)標(biāo),也被拒之門外。

融資在某種程度上是為了留住人才。此前,DeepSeek多位核心技術(shù)人員被高薪挖走。上述DeepSeek人士表示,獲得融資對DeepSeek最大好處之一,或許就是人員被挖走的概率降低了。

Kimi同樣重視人才。去年12月楊植麟在內(nèi)部信里稱,Kimi賬上現(xiàn)金超過100億元人民幣,短期內(nèi)并不著急上市。他還說,融資是為了更加激進(jìn)地擴(kuò)充顯卡(GPU)儲備,加速下一代K3模型的訓(xùn)練與研發(fā),并將部分資金用于大幅提高員工激勵,以吸引和保留頂尖人才。

據(jù)今年4月初晚點(diǎn)報道,Kimi將推出一項新的頂尖人才校招計劃,擬授予尚未畢業(yè)的實習(xí)生公司期權(quán),在實習(xí)生通過月之暗面為期3到6個月的考察后,計劃入選者將被直接授予期權(quán)股數(shù),即使本人尚未正式畢業(yè)。

大模型的競賽,是一場資本、人才和算力的全方位比拼。DeepSeek從不融資到宣布融資,Kimi從宣布不著急上市,到賬面資金闊綽、到融資數(shù)十億人民幣,都反映資本市場已經(jīng)形成的共識——大模型底層能力躍遷帶來的生產(chǎn)力巨量提升,已經(jīng)非常明確。

03

大模型投資依舊熱

去年9月的外灘大會上,朱嘯虎公開演講稱:“大模型已經(jīng)變成水電煤,是基礎(chǔ)設(shè)施,沒有超額利潤,真正的機(jī)會在應(yīng)用?!?/p>

目前來看,事情并沒有沿著那個方向發(fā)展。尤其當(dāng)智譜和MiniMax上市后,模型熱一直持續(xù),兩家公司市值一度達(dá)到三千多億和四千多億港元。

今年以來大模型投資的熱度繼續(xù)高漲,尤其從DeepSeek V4的融資門檻,以及Kimi連續(xù)融資并且估值翻了四倍來看。就連大模型存在感不強(qiáng)的階躍星辰,也在2026年1月26日宣布完成超50億元人民幣B+輪融資。

視頻大模型和世界模型同樣迎來投資熱潮。生數(shù)科技在4月完成近20億元B輪融資,估值120億元,阿里、中網(wǎng)投領(lǐng)投。極佳視界單月融資25億元,估值破100億元。

相比海外,國內(nèi)這些融資顯得小情小調(diào)的。OpenAI2026年3月完成高達(dá)1220億美元融資,投后估值8520億美元,亞馬遜、英偉達(dá)、軟銀入局。Anthropic2026年2月完成300億美元G輪融資,估值3800億美元,新加坡GIC、Coatue領(lǐng)投。

投資的熱潮背后更直觀的反應(yīng)是,模型公司收入增速表現(xiàn)非常樂觀。截至4月7日,Anthropic對外披露的ARR是超過300億美元,較2025年底的收入增長了3倍有余。上述參投Anthropic的投資人告訴我們,“Anthropic的2026年ARR收入預(yù)計會突破1000億美元”。

“大模型作為底層設(shè)施,可能會吞噬所有行業(yè)的價值黑洞?!鄙鲜鐾顿Y人稱,過去一年她頻繁的見許多全球最優(yōu)秀的一批研究員,他們無一例外都向她展示了模型涌現(xiàn)能力已經(jīng)出現(xiàn)。

看到模型收入增速以及智譜二級市場的暴漲反應(yīng),更多的投資人是一種FOMO心理。

據(jù)我們了解,最近幾個月,Kimi的股權(quán)一直很搶手,一家美元基金猶豫了幾天名額就滿了。

不過,錢對兩家公司來說從來都不是目的。梁文鋒唯一一次接受采訪是在2024年7月,當(dāng)時他說過這句話:“我們的出發(fā)點(diǎn),就不是趁機(jī)賺一筆,而是走到技術(shù)的前沿”。這與楊植麟所說的:“不急于短期變現(xiàn),專注技術(shù)前沿與長期AGI目標(biāo)?!辈恢\而合。

這份可貴的純粹,也正是他們持續(xù)吸引外界關(guān)注的原因。

知春路的風(fēng)永不停歇,吹過一代代創(chuàng)業(yè)者。從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),中國的科技行業(yè)從來不乏流量明星與商業(yè)神話,但在AI這條關(guān)乎未來的賽道上,或許需要更多的時間來驗證新的范式。

撰寫|吳尋

編輯|劉培


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
《教父》柯里昂臨終前的頓悟:男人可以囂張,可以蠻橫,可以得罪權(quán)貴,唯獨(dú)這兩類人,碰了就是給自己種下禍端

《教父》柯里昂臨終前的頓悟:男人可以囂張,可以蠻橫,可以得罪權(quán)貴,唯獨(dú)這兩類人,碰了就是給自己種下禍端

心理觀察局
2026-05-08 09:32:04
王皓變陣破韓國戰(zhàn)術(shù)!王楚欽林詩棟互相感謝,國乒復(fù)仇晉級四強(qiáng)

王皓變陣破韓國戰(zhàn)術(shù)!王楚欽林詩棟互相感謝,國乒復(fù)仇晉級四強(qiáng)

排球黃金眼
2026-05-08 23:28:34
任敏連搭“頂流”6連撲:被強(qiáng)捧的“小花”們,會成為資本棄兒嗎

任敏連搭“頂流”6連撲:被強(qiáng)捧的“小花”們,會成為資本棄兒嗎

扒點(diǎn)半吃瓜
2026-05-08 07:00:12
他汀天天吃,哪種更安全?一文講出實情

他汀天天吃,哪種更安全?一文講出實情

李藥師談健康
2026-05-08 13:12:29
TVB老戲骨自爆不被公司續(xù)約,兒子出面澄清:全是父親的無奈計策

TVB老戲骨自爆不被公司續(xù)約,兒子出面澄清:全是父親的無奈計策

TVB劇評社
2026-05-08 18:54:28
在迪拜工作華人感慨:別信媒體吹牛,迪拜就相當(dāng)于我國二線城市

在迪拜工作華人感慨:別信媒體吹牛,迪拜就相當(dāng)于我國二線城市

蜉蝣說
2026-05-06 15:25:25
峨眉山男子推猴后續(xù):正臉曝光已社死,官方下場,工作恐保不住

峨眉山男子推猴后續(xù):正臉曝光已社死,官方下場,工作恐保不住

淺色夏么
2026-05-08 12:21:46
受賄1.34億余元!國家能源局原綜合司司長被判死緩!

受賄1.34億余元!國家能源局原綜合司司長被判死緩!

老楊說光伏
2026-05-08 21:09:36
美國和以色列花了幾十年成功,沒想到被伊朗兩個月就給辦成了

美國和以色列花了幾十年成功,沒想到被伊朗兩個月就給辦成了

麓谷隱士
2026-05-09 00:06:22
8000億城投再掀“反腐風(fēng)暴”,旗下地產(chǎn)項目擱淺十年

8000億城投再掀“反腐風(fēng)暴”,旗下地產(chǎn)項目擱淺十年

中國房地產(chǎn)報官方號
2026-05-08 15:44:04
兩次將妻子捉奸在床,情夫:睡你老婆怎樣!丈夫絕望,喝下百草枯

兩次將妻子捉奸在床,情夫:睡你老婆怎樣!丈夫絕望,喝下百草枯

黑哥講現(xiàn)代史
2026-04-26 06:00:24
調(diào)查發(fā)現(xiàn):起床后馬上吸煙的人,用不了多久,身體會有4個改變

調(diào)查發(fā)現(xiàn):起床后馬上吸煙的人,用不了多久,身體會有4個改變

醫(yī)學(xué)原創(chuàng)故事會
2026-05-04 23:24:14
北大畢業(yè)留德醫(yī)生是暗網(wǎng)犯罪頭目?疑教唆數(shù)萬同伙下藥侵害“獵物”,庭審曝捂臉照!

北大畢業(yè)留德醫(yī)生是暗網(wǎng)犯罪頭目?疑教唆數(shù)萬同伙下藥侵害“獵物”,庭審曝捂臉照!

英國報姐
2026-05-07 21:09:56
著名衛(wèi)視宣布停播

著名衛(wèi)視宣布停播

中國經(jīng)濟(jì)網(wǎng)
2026-05-07 18:05:06
中國高校200強(qiáng)名單出爐!哈工大第10,西電第34,深圳大學(xué)第59

中國高校200強(qiáng)名單出爐!哈工大第10,西電第34,深圳大學(xué)第59

教育導(dǎo)向分享
2026-05-08 21:25:29
CNN:種種跡象表明穆帥即將回歸皇馬;他本人已完全做好準(zhǔn)備

CNN:種種跡象表明穆帥即將回歸皇馬;他本人已完全做好準(zhǔn)備

懂球帝
2026-05-09 00:16:12
費(fèi)爾南德斯或成英超本賽季杰出球員,賴斯、哈蘭德仍有爭冠機(jī)會

費(fèi)爾南德斯或成英超本賽季杰出球員,賴斯、哈蘭德仍有爭冠機(jī)會

體壇觀察猿
2026-05-09 01:15:01
哈佛提醒:防肌肉流失別只補(bǔ)蛋白!這6種營養(yǎng)才是關(guān)鍵

哈佛提醒:防肌肉流失別只補(bǔ)蛋白!這6種營養(yǎng)才是關(guān)鍵

橘子約定
2026-05-05 20:49:53
皇馬亂了!曝更衣室成內(nèi)鬼窩+派系林立 主帥撒手不管 老佛爺失職

皇馬亂了!曝更衣室成內(nèi)鬼窩+派系林立 主帥撒手不管 老佛爺失職

我愛英超
2026-05-08 08:02:43
文章面館正式開業(yè),免費(fèi)送汽水喝,馬伊琍帶著兩女兒低調(diào)支持!

文章面館正式開業(yè),免費(fèi)送汽水喝,馬伊琍帶著兩女兒低調(diào)支持!

老吳教育課堂
2026-05-08 20:15:22
2026-05-09 01:44:49
白鯨實驗室one incentive-icons
白鯨實驗室one
記錄 AI改變世界的瞬間
133文章數(shù) 15關(guān)注度
往期回顧 全部

科技要聞

SK海力士平均獎金600萬 工服成相親神器

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內(nèi)幕解密

頭條要聞

外籍銀行高層在香港豪宅性虐及殺害兩女子 內(nèi)幕解密

體育要聞

他把首勝讓給隊友,然后用一年時間還清賬單

娛樂要聞

古天樂被曝隱婚生子,新娘竟是她

財經(jīng)要聞

估值3000億 DeepSeek尋求500億元融資

汽車要聞

MG 4X實車亮相 將于5月11日開啟盲訂

態(tài)度原創(chuàng)

本地
數(shù)碼
時尚
公開課
軍事航空

本地新聞

用蘇繡的方式,打開江西婺源

數(shù)碼要聞

華碩京東重磅新品日,華碩天選7系列游戲本開啟預(yù)約

衣服其實沒有必要買很貴,準(zhǔn)備這三件基礎(chǔ)款,百搭實用又不挑人

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗:最高領(lǐng)袖穆杰塔巴全面掌控局勢

無障礙瀏覽 進(jìn)入關(guān)懷版