国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

美國(guó)華裔女院士李飛飛:低成本成功復(fù)刻Deepseek,性能媲美頂級(jí)AI

0
分享至

2025年1月的AI圈簡(jiǎn)直是熱鬧得不行,國(guó)產(chǎn)Deepseek剛在27號(hào)登陸美國(guó)地區(qū)手機(jī)應(yīng)用商店,直接把穩(wěn)坐榜首的ChatGPT擠了下去,連帶美國(guó)多支科技股都跌得慘兮兮,特朗普都公開表態(tài)說Deepseek的出現(xiàn)給整個(gè)美國(guó)相關(guān)產(chǎn)業(yè)敲響了警鐘。大家還在熱議Deepseek怎么這么能打時(shí),另一則消息直接把整個(gè)全球AI圈炸翻了。李飛飛團(tuán)隊(duì)搞出的新模型,性能跟Deepseek差不離,成本居然低到普通人想都不敢想的地步。



之前AI圈大伙都有個(gè)共識(shí),要搞出能打的頂級(jí)大模型,就得砸錢砸算力砸數(shù)據(jù),動(dòng)輒幾百萬上千萬美元往里扔,小團(tuán)隊(duì)連入門的門檻都摸不到。Deepseek之前就靠性價(jià)比出圈,被大伙叫AI界的價(jià)格屠夫,已經(jīng)逼得不少科技公司坐不住了。誰能想到李飛飛團(tuán)隊(duì)比他還狠,花了不到50美元就搞出差不多性能的s1-32B模型。這事可不是隨便吹的,有公開論文佐證,還有業(yè)內(nèi)專家實(shí)打?qū)崪y(cè)過,一點(diǎn)水分都沒有。

李飛飛是斯坦福大學(xué)的教授,也是美國(guó)科學(xué)院院士,在AI領(lǐng)域摸爬滾打了幾十年,是圈內(nèi)公認(rèn)的行業(yè)大佬。他們團(tuán)隊(duì)搞這個(gè)模型也不是憑空造出來的,是站在阿里通義千問Qwen2.5-32B的成熟模型基礎(chǔ)上做的監(jiān)督微調(diào)。等于說已經(jīng)有現(xiàn)成的地基,不用自己從打地基開始蓋樓,省了超多時(shí)間和成本。很多人第一反應(yīng)都是不信,50美元連個(gè)好點(diǎn)的顯卡都買不到,怎么可能做出來大模型?

他們沒搞那些動(dòng)輒上億條的海量數(shù)據(jù),反而花功夫篩了1000個(gè)問題做成小型數(shù)據(jù)集,名字叫s1K。別小看這1000個(gè)問題,含金量拉滿,團(tuán)隊(duì)先是從16個(gè)不同來源攢了近6萬個(gè)問題,覆蓋數(shù)學(xué)、量子力學(xué)、腦筋急轉(zhuǎn)彎足足50個(gè)領(lǐng)域。之后卡著難度、多樣性、質(zhì)量三個(gè)標(biāo)準(zhǔn)一點(diǎn)點(diǎn)摳,最后只留下1000個(gè)推理鏈路長(zhǎng)、難度高的問題,每個(gè)都配了詳細(xì)的推理過程和標(biāo)準(zhǔn)答案。等于說用的都是精華中的精華,一點(diǎn)沒用的廢料都沒有。



他們還搞了個(gè)叫“預(yù)算強(qiáng)制”的小技術(shù),專門用來控制模型的思考時(shí)間。說白了就是給模型設(shè)了個(gè)思考的時(shí)間上限,想太久就強(qiáng)制停下來答題,想的時(shí)間不夠就提醒它再捋捋思路。這么操作下來,既能保證推理的質(zhì)量,又能把算力成本壓到最低。最后算下來,訓(xùn)練的時(shí)候只用了16個(gè)英偉達(dá)H100 GPU,全程只跑了26分鐘。

按當(dāng)時(shí)的GPU租金來算,這部分的開銷加起來還不到50美元。對(duì)比一下其他頂級(jí)大模型,動(dòng)不動(dòng)就要上百個(gè)GPU跑好幾天甚至幾周,成本早就沖到百萬美元以上了,這個(gè)成本低得跟白撿似的。也有人說他們這是“作弊”,50美元復(fù)刻Deepseek根本不可能,這話其實(shí)也得掰扯清楚才不會(huì)有誤解。這50美元只算了微調(diào)時(shí)候的GPU租金,沒算通義千問模型本身的訓(xùn)練成本。

通義千問之前訓(xùn)練的時(shí)候已經(jīng)砸了大量的人力物力,李飛飛團(tuán)隊(duì)是在這個(gè)已經(jīng)成型的成熟模型基礎(chǔ)上做優(yōu)化。相當(dāng)于你買了現(xiàn)成的洗好切好的食材,只需要下鍋炒一下就能上桌,食材本身的成本沒算在炒菜的錢里。還有人吹這個(gè)s1-32B模型性能已經(jīng)超過Deepseek和OpenAI的o1模型,這話也不準(zhǔn)確。實(shí)測(cè)下來,它在競(jìng)賽數(shù)學(xué)問題上比o1-preview高27%,和Deepseek的R1、普通版o1性能差不多,但是還沒超過滿血版的o1和正式版的Deepseek-R1。



業(yè)內(nèi)專家也說,李飛飛團(tuán)隊(duì)最厲害的地方不是復(fù)刻了Deepseek,是找到了一條低成本提升模型性能的路子。他們相當(dāng)于給整個(gè)行業(yè)指了條明路,用高質(zhì)量的小數(shù)據(jù)集加簡(jiǎn)單的技術(shù)優(yōu)化,就能讓普通模型的性能漲一大截,不用再死磕海量數(shù)據(jù)和高額算力。之前AI行業(yè)完全是資本堆出來的,大公司拼了命砸錢比算力比數(shù)據(jù),小團(tuán)隊(duì)根本活不下去,現(xiàn)在倒好,沒錢也能搞出能打的頂級(jí)AI了。不少人都說這是AI成本革命的又一個(gè)里程碑,搞不好要改寫整個(gè)AI行業(yè)的游戲規(guī)則。

現(xiàn)在s1模型已經(jīng)開源了,越來越多的團(tuán)隊(duì)都跟著學(xué)這種玩法,基于現(xiàn)成的開源模型做微調(diào),成本直接砍了一大截,F(xiàn)在通義千問的衍生模型數(shù)量已經(jīng)破了9萬,就兩款視覺模型的全球下載量都超過3200萬次,開源大模型的生態(tài)越來越熱鬧。那些大科技公司也都改了策略,不再傻乎乎一味砸錢,都轉(zhuǎn)頭去搞效率提升了。整個(gè)行業(yè)的風(fēng)向一下子就變了,不再是比誰砸的錢多,而是比誰的思路巧效率高。



的李彥宏之前就說過,AI推理成本每年能降90%,比摩爾定律猛多了,以后AI肯定會(huì)越來越普及。谷歌CEO也說,過去18個(gè)月AI處理數(shù)據(jù)的成本降了97%,以后智能技術(shù)的獲取門檻只會(huì)越來越低。這事也不是跟普通人沒關(guān)系的冷門科技新聞,實(shí)打?qū)崟?huì)影響到我們以后的生活。以后說不定小工作室甚至個(gè)人都能搞出自己想用的AI模型,不用再被成本卡脖子。

以后低成本AI會(huì)滲透到更多行業(yè),不管是醫(yī)療、教育還是自動(dòng)駕駛,這些領(lǐng)域的門檻都會(huì)往下掉,我們能享受到的便利也會(huì)越來越多。李飛飛作為華裔院士,能在AI領(lǐng)域搞出這種突破性的成果,不少華人都覺得特別驕傲。她沒靠資本堆出來的優(yōu)勢(shì),全靠技術(shù)創(chuàng)新打破了行業(yè)的壟斷,讓AI的發(fā)展回歸到技術(shù)本身的賽道上。這種靠巧勁破局的思路,也給很多國(guó)內(nèi)的AI團(tuán)隊(duì)做了很好的示范。



之后肯定會(huì)有更多團(tuán)隊(duì)借鑒這種思路搞研發(fā),AI行業(yè)的競(jìng)爭(zhēng)也會(huì)越來越卷。行業(yè)卷起來對(duì)普通消費(fèi)者肯定是好事,不管是產(chǎn)品價(jià)格還是服務(wù)質(zhì)量,都會(huì)往更利好我們的方向走。咱們普通人就等著享受技術(shù)進(jìn)步帶來的紅利就行,以后AI的玩法說不定還會(huì)有更多驚喜。整個(gè)AI行業(yè)的普惠時(shí)代,說不定比我們預(yù)想的要來得早得多。

參考資料:人民網(wǎng) 2025年全球開源大模型生態(tài)發(fā)展白皮書

中國(guó)科學(xué)報(bào) 李飛飛團(tuán)隊(duì)低成本大模型研發(fā)成果解析

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
俄羅斯裝錢的麻袋都不夠了,每天多掙100億,四年戰(zhàn)爭(zhēng),一朝回血

俄羅斯裝錢的麻袋都不夠了,每天多掙100億,四年戰(zhàn)爭(zhēng),一朝回血

混沌錄
2026-03-25 22:37:05
美媒:中國(guó)花了整整30年時(shí)間,只為研發(fā)一條摧毀美國(guó)航母的殺傷鏈

美媒:中國(guó)花了整整30年時(shí)間,只為研發(fā)一條摧毀美國(guó)航母的殺傷鏈

阿訊說天下
2026-03-24 13:57:57
一家子全是美籍,卻還在國(guó)內(nèi)“撈金”,年賺4億,賬上還存有130億

一家子全是美籍,卻還在國(guó)內(nèi)“撈金”,年賺4億,賬上還存有130億

云景侃記
2026-02-26 23:05:22
來俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,殺全族都行

來俊臣的酷刑有多狠?曾有女犯哀求:只要不上刑,殺全族都行

銘記歷史呀
2026-03-09 15:28:19
轟43+7又刷八紀(jì)錄!東契奇多次露出燦爛笑容 湖人6連客5勝1負(fù)收官

轟43+7又刷八紀(jì)錄!東契奇多次露出燦爛笑容 湖人6連客5勝1負(fù)收官

顏小白的籃球夢(mèng)
2026-03-26 09:34:32
39人落網(wǎng)!中方追回走私稀土,價(jià)值46個(gè)億,美國(guó)砸重金收買內(nèi)鬼

39人落網(wǎng)!中方追回走私稀土,價(jià)值46個(gè)億,美國(guó)砸重金收買內(nèi)鬼

阿鳧愛吐槽
2026-03-24 03:53:45
83歲趙樸初歸鄉(xiāng),站在陳獨(dú)秀墓前直言:墓碑上少了兩個(gè)字太不應(yīng)該

83歲趙樸初歸鄉(xiāng),站在陳獨(dú)秀墓前直言:墓碑上少了兩個(gè)字太不應(yīng)該

老謝談史
2026-03-23 12:07:01
有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

有沒有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

夜深愛雜談
2026-02-18 20:55:58
伊朗“真實(shí)承諾4”81輪了!這次打擊70多目標(biāo)?要把以色列打懵了

伊朗“真實(shí)承諾4”81輪了!這次打擊70多目標(biāo)?要把以色列打懵了

阿芒娛樂說
2026-03-26 05:31:34
嘴唇發(fā)紫是心臟在“求救”?原來心臟不好的人,臉上會(huì)“報(bào)警”

嘴唇發(fā)紫是心臟在“求救”?原來心臟不好的人,臉上會(huì)“報(bào)警”

人民日?qǐng)?bào)健康客戶端
2026-03-25 20:29:06
4.7萬億!馬斯克打破人類財(cái)富紀(jì)錄:他一個(gè)人的錢抵得過160個(gè)國(guó)家

4.7萬億!馬斯克打破人類財(cái)富紀(jì)錄:他一個(gè)人的錢抵得過160個(gè)國(guó)家

通鑒史智
2026-03-15 11:45:00
金融專家:薩拉赫若轉(zhuǎn)會(huì)沙特,商業(yè)價(jià)值超越梅羅,身家將達(dá)10億鎊

金融專家:薩拉赫若轉(zhuǎn)會(huì)沙特,商業(yè)價(jià)值超越梅羅,身家將達(dá)10億鎊

天光破云來
2026-03-26 10:41:04
女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),被親人點(diǎn)到不赴約

女孩當(dāng)小姐,一晚要提供4到5次上門服務(wù),被親人點(diǎn)到不赴約

情感藝術(shù)家
2026-02-26 10:48:00
棄用姆貝莫!卡里克找到曼聯(lián) “福登二世”,青訓(xùn)妖星有望上位

棄用姆貝莫!卡里克找到曼聯(lián) “福登二世”,青訓(xùn)妖星有望上位

瀾歸序
2026-03-26 04:39:05
初代丑男何潤(rùn)東的突然爆火,狠狠抽了內(nèi)娛一巴掌

初代丑男何潤(rùn)東的突然爆火,狠狠抽了內(nèi)娛一巴掌

娛樂圈筆娛君
2026-03-24 16:08:36
特朗普據(jù)悉將請(qǐng)?jiān)瞬瘛?埃里森和黃仁勛加入 科技委員會(huì)

特朗普據(jù)悉將請(qǐng)?jiān)瞬瘛?埃里森和黃仁勛加入 科技委員會(huì)

每日經(jīng)濟(jì)新聞
2026-03-25 23:07:37
14.99萬!“史上最便宜”特斯拉來了

14.99萬!“史上最便宜”特斯拉來了

首席品牌觀察
2026-03-24 16:18:39
她差點(diǎn)成為中國(guó)歷史上的第二位女帝,后來為何自己選擇放棄?

她差點(diǎn)成為中國(guó)歷史上的第二位女帝,后來為何自己選擇放棄?

咸説歷史
2026-03-26 03:53:20
西方集體撤退!中國(guó)死磕,為什么全世界,就中國(guó)在拼命搞核聚變?

西方集體撤退!中國(guó)死磕,為什么全世界,就中國(guó)在拼命搞核聚變?

混沌錄
2026-03-25 16:53:19
一旦開戰(zhàn),中國(guó)若發(fā)射一枚東風(fēng)41,得付出多大的代價(jià)?

一旦開戰(zhàn),中國(guó)若發(fā)射一枚東風(fēng)41,得付出多大的代價(jià)?

小正說娛樂
2026-03-19 18:51:30
2026-03-26 11:28:49
聊歷史的阿稼 incentive-icons
聊歷史的阿稼
談歷史
743文章數(shù) 17關(guān)注度
往期回顧 全部

科技要聞

硅谷因AI大裁員?一線工程師戳破真相

頭條要聞

上海36歲女子嫁23歲小伙 拿千萬元房產(chǎn)99%份額"閃離"

頭條要聞

上海36歲女子嫁23歲小伙 拿千萬元房產(chǎn)99%份額"閃離"

體育要聞

35歲替補(bǔ)門將,憑什么入選英格蘭隊(duì)?

娛樂要聞

張雪峰遺產(chǎn)分割復(fù)雜!是否立遺囑成關(guān)鍵

財(cái)經(jīng)要聞

黃仁勛:芯片公司的時(shí)代已經(jīng)結(jié)束了

汽車要聞

一汽奧迪A6L e-tron開啟預(yù)售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

教育
時(shí)尚
手機(jī)
家居
軍事航空

教育要聞

ISAR選修課丨重磅古典占星預(yù)測(cè)課程:整合6大預(yù)測(cè)技法,從入門到實(shí)戰(zhàn)

《非窮盡列舉》,好看又絕望

手機(jī)要聞

米粉都更新了嗎?小米澎湃OS 3.1 重磅推送,實(shí)現(xiàn)安卓蘋果生態(tài)互通

家居要聞

傍海而居 靜觀蝴蝶海

軍事要聞

伊朗重申非交戰(zhàn)國(guó)家船只可安全通過霍爾木茲海峽

無障礙瀏覽 進(jìn)入關(guān)懷版