国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

DeepSeek都把硅谷給整懵了

0
分享至

作者| 高凌朗

編輯| 侯旭

短短一個(gè)月內(nèi),中國人工智能初創(chuàng)公司“DeepSeek(深度求索)“連續(xù)發(fā)布兩款重量級(jí)模型——DeepSeek-V3、DeepSeek-R1,在全球AI領(lǐng)域掀起軒然大波。

據(jù)AI評(píng)估網(wǎng)站Chatbot Arena最新數(shù)據(jù),1月20日開源的DeepSeek-R1在綜合榜單上排名第三,與頂尖推理模型GPT-4o并列。更令人關(guān)注的是,在高難度提示詞、代碼和數(shù)學(xué)等技術(shù)領(lǐng)域,DeepSeek-R1更是力壓群雄,登頂榜首。

AI分析平臺(tái)Artificial-Analysis的基準(zhǔn)測試結(jié)果也顯示,DeepSeek-R1的AI分析質(zhì)量指數(shù)居全球第二,而API定價(jià)僅為GPT-4o的三十分之一。

一系列數(shù)據(jù)立即引發(fā)硅谷震動(dòng),Scale AI創(chuàng)始人Alexander Wang在1月24日接受采訪時(shí)坦言,DeepSeek的表現(xiàn)與美國最頂尖模型不相上下。

在此背景下,剛剛宣布將投資650億美元擴(kuò)建數(shù)據(jù)中心的Meta也被卷入輿論中心。匿名職場社區(qū)teamblind傳出消息:Meta內(nèi)部工程師正在緊急分析DeepSeek的技術(shù)方案。

整個(gè)硅谷之所以變得如此緊張,正是因?yàn)镈eepSeek重新定義了大模型領(lǐng)域的一條規(guī)則:打造一流AI模型,未必需要天價(jià)投入。

DeepSeek成立于2023年7月17日,其根源可追溯至成立于2012年的對(duì)沖基金公司—幻方量化。該公司團(tuán)隊(duì)成員80%以上畢業(yè)于國內(nèi)外頂尖高校,專注于量化投資領(lǐng)域,通過機(jī)器學(xué)習(xí)和高頻交易策略管理約80億美元資產(chǎn)。

幻方量化及其重視技術(shù)研發(fā),先后投資12億元打造"螢火一號(hào)"和"螢火二號(hào)"深度學(xué)習(xí)平臺(tái),擁有超過1萬張英偉達(dá)A100芯片的強(qiáng)大算力儲(chǔ)備。這一雄厚的硬件基礎(chǔ)為DeepSeek的研發(fā)提供了強(qiáng)有力支撐。

幻方量化創(chuàng)始人梁文鋒畢業(yè)于浙江大學(xué)信息與電子工程專業(yè),在量化金融與機(jī)器學(xué)習(xí)領(lǐng)域深耕多年。他于2020年帶領(lǐng)核心技術(shù)團(tuán)隊(duì)獨(dú)立創(chuàng)辦DeepSeek,專注AI大模型研發(fā),并于2023年11月推出首款產(chǎn)品DeepSeekCoder,為后續(xù)技術(shù)創(chuàng)新奠定基礎(chǔ)。

與行業(yè)普遍"砸算力"的做法不同,DeepSeek沒有盲目追求參數(shù)規(guī)模,而是專注于提升訓(xùn)練效率。

DeepSeek團(tuán)隊(duì)采用稀疏的Mixture of Experts(MoE)架構(gòu),僅激活5%~10%的專家網(wǎng)絡(luò)單元,顯著降低了計(jì)算資源消耗。

同時(shí),團(tuán)隊(duì)大膽采用FP8混合精度訓(xùn)練,進(jìn)一步優(yōu)化了顯存占用和計(jì)算效率。這些技術(shù)創(chuàng)新讓DeepSeek實(shí)現(xiàn)了低成本高性能的突破。

說人話就是:DeepSeek的思路更加精打細(xì)算,就像把普通家用車改裝成賽車,用更少的錢實(shí)現(xiàn)更好的表現(xiàn)。

2024年12月26日,DeepSeek推出了擁有6710億參數(shù)、14.8萬億高質(zhì)量token的V3模型。相比之下,業(yè)內(nèi)流傳GPT-4o的模型參數(shù)約為2000億(未經(jīng)Open AI證實(shí))。

最關(guān)鍵的是,DeepSeek-V3僅以557.6萬美元的訓(xùn)練成本和280萬個(gè)GPU小時(shí)的計(jì)算需求,就達(dá)到了與頂尖模型媲美的性能。

另外,DeepSeek-V3的API服務(wù)價(jià)格為每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),每百萬輸出tokens 8元。這一價(jià)格遠(yuǎn)低于GPT-4o等頭部模型。

據(jù)統(tǒng)計(jì),僅在2024年12月的最后6天,DeepSeek的訪問量就暴增164%,達(dá)到1180萬次。

2025年1月20日,DeepSeek再次發(fā)布DeepSeek-R1模型引爆科技圈,該模型的核心突破在于其獨(dú)特的技術(shù)路徑。

根據(jù)DeepSeek最新發(fā)布的技術(shù)白皮書,R1-Zero采用了一種前所未有的"純"強(qiáng)化學(xué)習(xí)方法,完全拋開了預(yù)設(shè)的思維鏈模板和監(jiān)督式微調(diào),僅依靠簡單的獎(jiǎng)懲信號(hào)來優(yōu)化模型行為。

在AIME數(shù)學(xué)競賽中,R1-Zero從最初的15.6%正確率一路攀升至71.0%。更令人驚訝的是,當(dāng)模型對(duì)同一問題進(jìn)行多次嘗試時(shí),準(zhǔn)確率更是達(dá)到了86.7%。在編程領(lǐng)域,模型在Codeforces評(píng)測中達(dá)到2441分的水平,超過了96.3%的人類參與者。

除了上文所述通過MoE以及FP8混合進(jìn)度訓(xùn)練外。DeepSeek-R1還遵循MIT License,允許用戶通過蒸餾技術(shù)借助R1訓(xùn)練其他模型。如此一來,R1模型將大幅減少對(duì)人類反饋強(qiáng)化學(xué)習(xí)的依賴,進(jìn)一步降低了成本。

要知道,現(xiàn)有的人工智能公司在訓(xùn)練過程中,必須掌握大量算力儲(chǔ)備,而算力的背后自然是資金支持。因此,行業(yè)投資者們紛紛驚醒,開始質(zhì)疑傳統(tǒng)AI公司高額投入的必要性。

據(jù)Noah's Arc資本管理公司分析,DeepSeek的模型可能徹底改變AI訓(xùn)練和推理領(lǐng)域的游戲規(guī)則。特別是在OpenAI的"星際之門"計(jì)劃公布5000億美元投資預(yù)算的背景下,DeepSeek的低成本高效能更顯示出其戰(zhàn)略價(jià)值。

DeepSeek的成功正在催生AI產(chǎn)業(yè)發(fā)展模式的變化。根據(jù)中國信息通信研究院的白皮書,全球AI大語言模型數(shù)量已達(dá)1328個(gè),其中36%來自中國,使中國成為僅次于美國的第二大AI技術(shù)貢獻(xiàn)國。

諾貝爾獎(jiǎng)得主、"AI教父"杰弗里·辛頓在2025年1月接受采訪時(shí)指出,中國在STEM教育方面的優(yōu)勢將為AI發(fā)展提供堅(jiān)實(shí)基礎(chǔ)。

根據(jù)之前的行業(yè)預(yù)測顯示,到2027年,最大型模型的訓(xùn)練成本將超過10億美元。Gartner預(yù)計(jì),到2028年主要科技巨頭在AI服務(wù)器上的支出將達(dá)到5000億美元。

在這一背景下,DeepSeek的低成本方案引發(fā)了對(duì)傳統(tǒng)發(fā)展路徑的反思。同時(shí),來自地緣、監(jiān)管、資本等多方面的因素也正在給硅谷施加壓力。

加州大學(xué)伯克利分校AI政策研究員Ritwik Gupta認(rèn)為,DeepSeek的成功表明"AI能力沒有護(hù)城河",中國龐大的系統(tǒng)工程師人才庫正在幫助企業(yè)更高效地利用計(jì)算資源。

事實(shí)上,這種發(fā)展趨勢已經(jīng)開始影響資本市場。

在DeepSeek-R1引發(fā)熱議后,作為“AI石油”的英偉達(dá)股價(jià)于今年1月24日下跌3.12%。

我們認(rèn)為,如果低成本、高性能的開源模型成為主流,可能會(huì)扭轉(zhuǎn)美國公司在AI領(lǐng)域的技術(shù)優(yōu)勢和估值體系。

需要注意的是,在大模型領(lǐng)域逐漸封閉的背景下,DeepSeek選擇了開源模型并公開技術(shù)報(bào)告的差異化路線。

這一決策雖然贏得了開發(fā)者們的廣泛贊譽(yù),但是開源策略也意味著技術(shù)優(yōu)勢難以形成壁壘,競爭對(duì)手可以輕易復(fù)制其模式,這可能會(huì)削弱DeepSeek在未來商業(yè)競爭中的優(yōu)勢地位。

另外,由于DeepSeek團(tuán)隊(duì)更偏重技術(shù)路線,其模型在數(shù)學(xué)、代碼等特定領(lǐng)域表現(xiàn)突出,但在知識(shí)問答及長文本處理等多樣化場景方面可能存在不足。

不管怎樣,DeepSeek讓AI大模型產(chǎn)業(yè)看到了一個(gè)新的方向,這也是這兩天AI行業(yè)的興奮所在。

歡迎關(guān)注我們的其他賬號(hào)

關(guān)注下方備用號(hào),防止失聯(lián)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
1999年東風(fēng)導(dǎo)彈泄密,臺(tái)灣女特工潛伏京都頂級(jí)夜總會(huì),拉總工下水

1999年東風(fēng)導(dǎo)彈泄密,臺(tái)灣女特工潛伏京都頂級(jí)夜總會(huì),拉總工下水

干史人
2026-01-12 11:27:38
A股收評(píng):成交額再爆天量逼近4萬億元!三大指數(shù)漲跌不一,AI應(yīng)用持續(xù)爆發(fā)

A股收評(píng):成交額再爆天量逼近4萬億元!三大指數(shù)漲跌不一,AI應(yīng)用持續(xù)爆發(fā)

格隆匯
2026-01-14 15:09:08
定了!國務(wù)院批準(zhǔn),兩大央企實(shí)施合并重組!

定了!國務(wù)院批準(zhǔn),兩大央企實(shí)施合并重組!

通信頭條
2026-01-13 19:47:29
中國狂拋美債,特朗普緊急發(fā)一道總統(tǒng)令,他認(rèn)為:中國一定會(huì)領(lǐng)情

中國狂拋美債,特朗普緊急發(fā)一道總統(tǒng)令,他認(rèn)為:中國一定會(huì)領(lǐng)情

策略述
2026-01-14 17:14:31
再見,拜仁!“8000萬先生”決定轉(zhuǎn)投AC米蘭!主帥欽點(diǎn)1.8億強(qiáng)援

再見,拜仁!“8000萬先生”決定轉(zhuǎn)投AC米蘭!主帥欽點(diǎn)1.8億強(qiáng)援

頭狼追球
2026-01-14 11:42:05
2026年春節(jié)要凍哭?今年冬天不一般,最冷18天已上線!

2026年春節(jié)要凍哭?今年冬天不一般,最冷18天已上線!

老特有話說
2026-01-13 21:38:13
中戲辟謠僅一天,人民網(wǎng)表態(tài):閆學(xué)晶兒子學(xué)歷問題,一查到底

中戲辟謠僅一天,人民網(wǎng)表態(tài):閆學(xué)晶兒子學(xué)歷問題,一查到底

李健政觀察
2026-01-13 13:43:19
丈母娘逼我還大舅哥110萬外債,拒絕后離婚,3 年后再見他們愣住

丈母娘逼我還大舅哥110萬外債,拒絕后離婚,3 年后再見他們愣住

磊子講史
2025-12-26 15:15:04
大授銜中僅授少將,他的警衛(wèi)員卻被授予大將,他的學(xué)生授元帥

大授銜中僅授少將,他的警衛(wèi)員卻被授予大將,他的學(xué)生授元帥

興趣知識(shí)
2026-01-14 14:35:20
錢都讓陳小群賺走了

錢都讓陳小群賺走了

獨(dú)孤老趙的筆記
2026-01-14 16:10:34
英媒:解雇弗蘭克至少需要800萬鎊,他還有兩年半的合同在身

英媒:解雇弗蘭克至少需要800萬鎊,他還有兩年半的合同在身

懂球帝
2026-01-13 19:39:12
馬斯克在伊朗免費(fèi)部署“星鏈”,有機(jī)構(gòu)估稱已有超5萬臺(tái)接收終端,伊朗當(dāng)局已成功干擾部分終端接收衛(wèi)星信號(hào)

馬斯克在伊朗免費(fèi)部署“星鏈”,有機(jī)構(gòu)估稱已有超5萬臺(tái)接收終端,伊朗當(dāng)局已成功干擾部分終端接收衛(wèi)星信號(hào)

魯中晨報(bào)
2026-01-14 15:31:06
湖南永州醫(yī)生被控強(qiáng)奸兩幼女案再審宣判

湖南永州醫(yī)生被控強(qiáng)奸兩幼女案再審宣判

界面新聞
2026-01-14 12:24:55
深圳男籃官方辟謠:欠薪28月資金鏈斷裂+球員轉(zhuǎn)會(huì)不實(shí) 將法律維權(quán)

深圳男籃官方辟謠:欠薪28月資金鏈斷裂+球員轉(zhuǎn)會(huì)不實(shí) 將法律維權(quán)

醉臥浮生
2026-01-14 15:26:52
岳云鵬稱今年將缺席央視春晚:能耐就這么些,寫不出更好的東西;去年被現(xiàn)場觀眾“貼臉開大”建議別上春晚

岳云鵬稱今年將缺席央視春晚:能耐就這么些,寫不出更好的東西;去年被現(xiàn)場觀眾“貼臉開大”建議別上春晚

觀威海
2026-01-12 10:06:04
破案了!終于搞明白,李亞鵬的嫣然天使兒童醫(yī)院為什么開不下去了

破案了!終于搞明白,李亞鵬的嫣然天使兒童醫(yī)院為什么開不下去了

樂悠悠娛樂
2026-01-14 10:42:33
日本米價(jià)再創(chuàng)新高,每公斤38.8元,民眾不得已把主食改為面條

日本米價(jià)再創(chuàng)新高,每公斤38.8元,民眾不得已把主食改為面條

極目新聞
2026-01-13 10:19:55
股價(jià)再度“一字”跌停!這只白酒股拉響退市警報(bào)

股價(jià)再度“一字”跌停!這只白酒股拉響退市警報(bào)

大眾證券報(bào)
2026-01-14 11:38:16
泰國在建鐵路事故已致29人死亡67人受傷

泰國在建鐵路事故已致29人死亡67人受傷

新京報(bào)
2026-01-14 17:40:12
新國標(biāo)電動(dòng)車翻車!能載人有后視鏡卻賣不動(dòng),車主:我要買舊車!

新國標(biāo)電動(dòng)車翻車!能載人有后視鏡卻賣不動(dòng),車主:我要買舊車!

老特有話說
2026-01-13 22:23:49
2026-01-14 18:11:00
傳播體操 incentive-icons
傳播體操
每個(gè)互聯(lián)網(wǎng)人都該看看。
91文章數(shù) 19關(guān)注度
往期回顧 全部

科技要聞

攜程因涉嫌壟斷被市場監(jiān)管總局調(diào)查

頭條要聞

哈馬斯領(lǐng)導(dǎo)人空缺15個(gè)月后重組在即 2人成為熱門人選

頭條要聞

哈馬斯領(lǐng)導(dǎo)人空缺15個(gè)月后重組在即 2人成為熱門人選

體育要聞

你是個(gè)好球員,我們就拿你交易吧

娛樂要聞

何晴去世30天,許亞軍終于發(fā)聲

財(cái)經(jīng)要聞

姚振華舉報(bào):觀致汽車資產(chǎn)被低價(jià)拍賣

汽車要聞

曝Model Y或降到20萬以內(nèi)!

態(tài)度原創(chuàng)

藝術(shù)
房產(chǎn)
數(shù)碼
時(shí)尚
教育

藝術(shù)要聞

八大山人『山水花鳥冊(cè)』

房產(chǎn)要聞

熱銷17億后!天正·三亞灣壹號(hào),被爆違建!

數(shù)碼要聞

蘋果推送AirPods Pro 3新固件升級(jí) 修復(fù)部分已知漏洞

比變老更可怕的是不會(huì)穿!中年女人掌握4個(gè)技巧,優(yōu)雅不費(fèi)力

教育要聞

鄭州二七教育用91項(xiàng)大獎(jiǎng)交出科技賦能的硬核答卷

無障礙瀏覽 進(jìn)入關(guān)懷版