国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

燒光5000萬(wàn)美金,我終于不慌了

0
分享至

昨天看完了羅永浩訪談MiniMax創(chuàng)始人閆俊杰,整個(gè)訪談3小時(shí)50分,其中許多觀點(diǎn)非常有啟發(fā),建議你完整看一遍。如果你確實(shí)沒(méi)時(shí)間,至少認(rèn)真看完這篇文章,要知道這可是AI大模型獨(dú)角獸公司創(chuàng)始人,花了幾千萬(wàn)美金燒出來(lái)的真知灼見,含金量非常高。


01 燒掉5000萬(wàn)美金,終于不慌了

在K哥看來(lái),MiniMax是一家對(duì)技術(shù)有獨(dú)特追求的公司,畢竟創(chuàng)始人是頂級(jí)技術(shù)專家。早在2023年,大家還在琢磨怎么把LLaMA復(fù)現(xiàn)一遍,MiniMax已經(jīng)開始搞MoE(混合專家模型)了。

這個(gè)決定有多瘋?當(dāng)時(shí)除了OpenAI自己玩得挺溜但又不開源,外面基本沒(méi)人知道這玩意兒該怎么整。沒(méi)有開源社區(qū)的作業(yè)可以抄,沒(méi)有GitHub上的代碼可以參考,全靠自己一點(diǎn)點(diǎn)試。

試的過(guò)程就是不斷失敗,連著失敗了3到4次。每失敗一次,兩個(gè)月的研發(fā)時(shí)間就白費(fèi)了,1500萬(wàn)美金的算力成本直接打水漂。算下來(lái),光是這幾次失敗,就燒掉了四五千萬(wàn)美金。

換成一般公司,估計(jì)早就被董事會(huì)按在地上摩擦了。但閆俊杰的邏輯挺簡(jiǎn)單:如果相信MoE架構(gòu)的上限更高,那為了那個(gè)能支撐起大幾千億參數(shù)的天花板,這錢就得燒。只要方向?qū),就不能算小賬。

MiniMax還同時(shí)開了三條戰(zhàn)線:文本、語(yǔ)音、視覺(jué)。

外人看來(lái)這簡(jiǎn)直是“兵力分散”的教科書式反面案例。一個(gè)早期創(chuàng)業(yè)公司,資源本來(lái)就緊張,你不集中火力打一個(gè)點(diǎn),反而要三線作戰(zhàn)?

閆俊杰的邏輯還是那套第一性原理:真正的AGI肯定是多模態(tài)的。既然相信Scaling Law,相信不同模態(tài)在深度學(xué)習(xí)層面本質(zhì)上是一回事,那就算現(xiàn)在算力不夠,做不了“原生多模態(tài)”,也得把它們當(dāng)成三個(gè)獨(dú)立模型先訓(xùn)練起來(lái),為最終的融合做準(zhǔn)備。

他不想為了短期的技術(shù)形象去跟媒體講故事,而是真的在為解決根本問(wèn)題做準(zhǔn)備。哪怕要走之字形路線,哪怕要長(zhǎng)期追趕,也認(rèn)了。

更純粹的技術(shù)創(chuàng)業(yè),不是為了好看,是為了走得遠(yuǎn)。

02 被DeepSeek干懵,然后頓悟

2025年春節(jié),DeepSeek R1橫空出世,把全球大模型圈子給干懵了。

那種沖擊感,不亞于當(dāng)年ChatGPT剛出來(lái)的時(shí)候。所有人都沉默了好長(zhǎng)一段時(shí)間,閆俊杰也不例外。

他跟老羅坦言,當(dāng)時(shí)確實(shí)陷入了長(zhǎng)時(shí)間的自我反思:是技術(shù)路線錯(cuò)了嗎?是團(tuán)隊(duì)要求降低了?還是我們?cè)谧非驛GI的路上不夠堅(jiān)定?

擺在所有大模型公司面前的其實(shí)就兩條路:要么繼續(xù)死磕技術(shù),要么趕緊想辦法“開源節(jié)流”,早點(diǎn)把商業(yè)收入做起來(lái)。

閆俊杰選了前者,把自己徹底扔進(jìn)模型技術(shù)這個(gè)維度去死磕。

他的判斷很明確:華山只有一條路,而且狹路相逢不能躲。那些之前還在考慮的“沿途下蛋”做產(chǎn)品工廠的路線,直接砍掉了。

有意思的是,他在戰(zhàn)略上聚焦技術(shù)的同時(shí),在組織上做了個(gè)特別實(shí)在的動(dòng)作,就是發(fā)更多的錢。

用最直接的方式,讓大家把丟掉的信心撿回來(lái),把分散的注意力聚回來(lái)。忠于目標(biāo),做該做的事,不要有羞恥感。

2025年,MiniMax連著打贏了三場(chǎng)硬仗。

第一場(chǎng),走非共識(shí)技術(shù)路線

1月份,MiniMax發(fā)布了國(guó)內(nèi)首個(gè)線性注意力架構(gòu)模型MiniMax-Text 01,算是走了一條非共識(shí)技術(shù)路線。到了6月,開源了全球首個(gè)大規(guī)模混合架構(gòu)推理模型MiniMax-M1。K哥當(dāng)時(shí)寫了篇文章做了詳細(xì)分析。


雖然后來(lái)的M2沒(méi)有完全沿用這個(gè)架構(gòu),但這種敢于偏離主流的探索本身就很有含金量。它證明了MiniMax不是那種等著硅谷發(fā)論文再跟進(jìn)的好學(xué)生,而是真的敢去無(wú)人區(qū)找更優(yōu)解。

第二場(chǎng),底層算法被科技巨頭采用

在M1模型里,MiniMax提出了一個(gè)叫CISPO的強(qiáng)化學(xué)習(xí)算法。后來(lái)Meta發(fā)布的ScaleRL訓(xùn)練框架也用了這個(gè)算法。中國(guó)創(chuàng)業(yè)公司在底層算法邏輯上,對(duì)國(guó)際巨頭完成了一次罕見且硬核的技術(shù)輸出。


第三場(chǎng),定義了交互行業(yè)標(biāo)準(zhǔn)

到了10月,隨著M2模型發(fā)布,MiniMax首次把Interleaved Thinking(交錯(cuò)思維鏈)推向了行業(yè)標(biāo)準(zhǔn)。這種讓模型“像人一樣邊想邊做”的能力,很快就得到了OpenRouter等國(guó)外知名開發(fā)者平臺(tái)的支持。

這一次,不再是硅谷定義規(guī)則,MiniMax在定義什么叫更好的交互。

打完這三場(chǎng)仗,閆俊杰手里的拼圖終于齊了。

閆俊杰說(shuō),語(yǔ)音模型兩年前就做到國(guó)際領(lǐng)先了,視頻生成一年前沖到國(guó)際前列,音樂(lè)模型現(xiàn)在是全球三強(qiáng),唯獨(dú)語(yǔ)言模型之前一直差點(diǎn)火候。但隨著M2發(fā)布,這塊短板也補(bǔ)上了,開始被國(guó)際開發(fā)者用來(lái)做Agent和寫代碼。

客觀來(lái)看,MiniMax是中國(guó)唯一一家,在文本、視頻、語(yǔ)音、音樂(lè)全模態(tài)上都做到國(guó)際領(lǐng)先的公司。

說(shuō)這話的時(shí)候,閆俊杰明顯比年初那會(huì)兒松弛多了。

03 只有5家大模型,最終能留在牌桌上

閆俊杰向老羅描繪了一個(gè),比外界認(rèn)知更殘酷的全球AI技術(shù)競(jìng)爭(zhēng)格局。

他認(rèn)為,在美國(guó),真正能坐在大模型牌桌上的其實(shí)只有四家公司:OpenAI、Google、Anthropic,還有X.AI。

那MiniMax的位置在哪兒?閆俊杰的目標(biāo)是成為全球極少數(shù)具備全模態(tài)整合能力的公司,而且是中國(guó)唯一一家在文本、視頻、語(yǔ)音、音樂(lè)全模態(tài)上都做到國(guó)際領(lǐng)先的。

讓他真正有自信的,是中國(guó)公司獨(dú)特的效率優(yōu)勢(shì)。

在閆俊杰看來(lái),美國(guó)那四家核心公司,估值和收入可能是中國(guó)公司的100倍,但技術(shù)領(lǐng)先幅度可能只剩5%。中國(guó)公司花美國(guó)同行1/50的錢,做出來(lái)的效果只差5%,而且這個(gè)差距還在縮小。當(dāng)全模態(tài)的數(shù)據(jù)和模型完成最終整合時(shí),會(huì)出現(xiàn)從量變到質(zhì)變的時(shí)刻。

在采訪里閆俊杰說(shuō),如果要反思技術(shù)做得好到底需要什么,他總結(jié)為兩個(gè)詞:想象力和自信。

美國(guó)企業(yè)在自信方面做得很好,他們敢于講我要引領(lǐng)這個(gè)行業(yè)。中國(guó)科技企業(yè)要更上一個(gè)層面,要引領(lǐng)世界,歸根到底也需要這種坦蕩的自信。

曾幾何時(shí),在中國(guó)做一家真正的技術(shù)公司,想很純粹地依托技術(shù)本身形成大的商業(yè)價(jià)值閉環(huán),是無(wú)比艱難的。以至于一段時(shí)間以來(lái),技術(shù)理想這個(gè)真正的核動(dòng)力,在沒(méi)做出偉大成果之前,都是不足為外人道也的東西。甚至在商業(yè)世界公開談理想和追求,都成了有點(diǎn)羞恥感的事。

但到了今天這個(gè)新的技術(shù)時(shí)代,情況應(yīng)該開始改變了。

該羞恥的是那些只看見歷史、不敢下注未來(lái)的人,不是這些技術(shù)創(chuàng)業(yè)者們。

MiniMax給中國(guó)科技公司打了個(gè)樣,希望他們繼續(xù)縱情向前。也希望更多新一代中國(guó)技術(shù)創(chuàng)業(yè)者,在這個(gè)全新的技術(shù)時(shí)代,保持純粹,勇敢追逐技術(shù)理想。

來(lái)源 | 技術(shù)領(lǐng)導(dǎo)力(ID:jishulingdaoli)

作者 | Mr.K ; 編輯 | 蝦餃

內(nèi)容僅代表作者獨(dú)立觀點(diǎn),不代表早讀課立場(chǎng)


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
單場(chǎng)狂進(jìn)9記三分,快船內(nèi)線老將突然間打出了賽季最佳之戰(zhàn)?

單場(chǎng)狂進(jìn)9記三分,快船內(nèi)線老將突然間打出了賽季最佳之戰(zhàn)?

稻谷與小麥
2025-12-27 21:59:52
立案調(diào)查!股價(jià)從185元跌至33元:慘遭腰斬、再腰斬…

立案調(diào)查!股價(jià)從185元跌至33元:慘遭腰斬、再腰斬…

新浪財(cái)經(jīng)
2025-12-27 17:12:27
男子發(fā)現(xiàn)女兒非親生,多部門調(diào)解讓他放棄追責(zé)!評(píng)論區(qū)一言難盡!

男子發(fā)現(xiàn)女兒非親生,多部門調(diào)解讓他放棄追責(zé)!評(píng)論區(qū)一言難盡!

你食不食油餅
2025-12-25 20:35:40
欠薪無(wú)緣準(zhǔn)入!他們建隊(duì)僅7年,如今面臨解散,退出中國(guó)職業(yè)聯(lián)賽

欠薪無(wú)緣準(zhǔn)入!他們建隊(duì)僅7年,如今面臨解散,退出中國(guó)職業(yè)聯(lián)賽

球場(chǎng)沒(méi)跑道
2025-12-27 10:43:40
古代刑罰“虎豹嬉春”是啥樣的?為何受過(guò)此刑的女子都不寒而栗?

古代刑罰“虎豹嬉春”是啥樣的?為何受過(guò)此刑的女子都不寒而栗?

銘記歷史呀
2025-12-27 17:37:59
《老舅》大結(jié)局沒(méi)有奇跡,崔國(guó)明患癌殞命,拒絕兩女,和舅媽合葬

《老舅》大結(jié)局沒(méi)有奇跡,崔國(guó)明患癌殞命,拒絕兩女,和舅媽合葬

宇林網(wǎng)絡(luò)
2025-12-26 20:07:17
沒(méi)苦硬吃,中老年“純累游”太狠了...

沒(méi)苦硬吃,中老年“純累游”太狠了...

環(huán)行星球
2025-12-26 20:34:13
天津女排勝上海女排

天津女排勝上海女排

丁隗解說(shuō)
2025-12-27 21:38:28
梅西已經(jīng)抵達(dá)烏拉圭,將參加蘇亞雷斯女兒15歲生日派對(duì)

梅西已經(jīng)抵達(dá)烏拉圭,將參加蘇亞雷斯女兒15歲生日派對(duì)

懂球帝
2025-12-27 11:09:07
米飯立大功!研究發(fā)現(xiàn):糖尿病患者常吃米飯,或能降低幾種并發(fā)癥

米飯立大功!研究發(fā)現(xiàn):糖尿病患者常吃米飯,或能降低幾種并發(fā)癥

搖感軍事
2025-12-27 17:26:30
“不許在雕塑上曬被子”,高校多次下發(fā)聲明,校長(zhǎng)看后也忍不住笑了

“不許在雕塑上曬被子”,高校多次下發(fā)聲明,校長(zhǎng)看后也忍不住笑了

譚老師地理大課堂
2025-12-26 19:29:37
漲價(jià)在即,碳纖維概念牛股7連板!市盈率最低的是這幾只

漲價(jià)在即,碳纖維概念牛股7連板!市盈率最低的是這幾只

數(shù)據(jù)寶
2025-12-27 17:48:11
北京明天傍晚至夜間北風(fēng)再起,元旦降溫或迎“新年雪”

北京明天傍晚至夜間北風(fēng)再起,元旦降溫或迎“新年雪”

新京報(bào)北京知道
2025-12-27 16:25:27
馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個(gè)孩子

馬斯克收心了?官宣了39歲印度裔伴侶:相貌普通為他生了4個(gè)孩子

豐譚筆錄
2025-12-12 11:16:23
80年媽媽心軟放走盜賊,10年后收到一個(gè)包裹,打開一看全家蒙圈

80年媽媽心軟放走盜賊,10年后收到一個(gè)包裹,打開一看全家蒙圈

衍月
2025-12-26 15:33:09
新加坡越來(lái)越著急,看來(lái)是要對(duì)中國(guó)梭哈了!

新加坡越來(lái)越著急,看來(lái)是要對(duì)中國(guó)梭哈了!

比利
2025-12-26 20:03:14
美軍扣押中國(guó)油輪,180萬(wàn)桶石油被零元購(gòu)!中國(guó)太極拳打到了七寸

美軍扣押中國(guó)油輪,180萬(wàn)桶石油被零元購(gòu)!中國(guó)太極拳打到了七寸

素衣讀史
2025-12-25 16:42:18
陳偉霆何穗兒子滿月禮盒流出,有蘋果17大疆,禮物總價(jià)值不菲

陳偉霆何穗兒子滿月禮盒流出,有蘋果17大疆,禮物總價(jià)值不菲

觀威海
2025-12-26 14:18:19
比特幣一度“閃崩”超70%至24111美元!趙長(zhǎng)鵬發(fā)文回應(yīng)

比特幣一度“閃崩”超70%至24111美元!趙長(zhǎng)鵬發(fā)文回應(yīng)

和訊網(wǎng)
2025-12-27 20:24:03
忘年交 5:闖集團(tuán)索要賠償

忘年交 5:闖集團(tuán)索要賠償

金昔說(shuō)故事
2025-12-27 13:25:28
2025-12-27 23:07:00
互聯(lián)網(wǎng)早讀課 incentive-icons
互聯(lián)網(wǎng)早讀課
專注互聯(lián)網(wǎng)產(chǎn)品、運(yùn)營(yíng)、交互
9394文章數(shù) 55153關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

澤連斯基:烏在領(lǐng)土及扎波羅熱核電站問(wèn)題上有明確紅線

頭條要聞

澤連斯基:烏在領(lǐng)土及扎波羅熱核電站問(wèn)題上有明確紅線

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂(lè)要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

時(shí)尚
本地
健康
數(shù)碼
房產(chǎn)

穿好雪地靴的4個(gè)訣竅,還挺有效!

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬(wàn)年史書

這些新療法,讓化療不再那么痛苦

數(shù)碼要聞

備戰(zhàn)“內(nèi)存荒”:消息稱廠商直接與三星、SK海力士談判

房產(chǎn)要聞

年銷20億+!中交·藍(lán)色港灣用好房子致敬好生活

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版