国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

低價(jià)接入DeepSeek后,百度再掀算力接力賽

0
分享至

文|戴菁

2025年是AI游戲規(guī)則被改寫的一年。

在DeepSeek以中式務(wù)實(shí)震驚全球之前,AI大模型競(jìng)賽是一條由資本和GPU所主導(dǎo)的不計(jì)成本之路,參賽者的技術(shù)信仰只有一個(gè)Scaling Law,大力出奇跡。DeepSeek-R1掀起的AI普及浪潮,相當(dāng)于在大路旁邊開(kāi)辟了一個(gè)分岔,它迫使主要參與者開(kāi)始反思,讓更多人把AI用起來(lái)的前提不僅是技術(shù)領(lǐng)先,還要有足夠低的成本、超預(yù)期的體驗(yàn)。

最直觀的例子是,ChatGPT-o1雖然與DeepSeek能力相當(dāng),但一個(gè)月200美元的訂閱費(fèi)已經(jīng)將大多數(shù)普通人拒之門外。幡然醒悟的OpenAI,將1月31日上線的推理模型o3-mini設(shè)置為免費(fèi)用戶也可使用。

目之所及,AI大模型的花式降本將成為2025年的主線之一。抵達(dá)方式有很多,比如高效算力,又或者算法和工程創(chuàng)新。具體到中國(guó),在DeepSeek的激勵(lì)之下,BAT、字節(jié)、華為等國(guó)內(nèi)AI大廠已經(jīng)加緊在上述方向你追我趕。

2月5日,業(yè)內(nèi)再傳新進(jìn)展——首個(gè)國(guó)產(chǎn)芯片萬(wàn)卡集群正式點(diǎn)亮,本土化AI在高效算力上向前一步。

01

本土自研萬(wàn)卡集群正式點(diǎn)亮

在宣布低價(jià)接入DeepSeek模型兩天后,百度再公布算力降本新進(jìn)展。

2月5日,百度智能云宣布點(diǎn)亮昆侖芯三代萬(wàn)卡集群。這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬(wàn)卡集群。

從全球范圍來(lái)看,以合理成本獲得可靠的算力,在當(dāng)前的AI競(jìng)爭(zhēng)中至關(guān)重要。谷歌、Meta、亞馬遜、特斯拉等公司都在加快自研芯片的進(jìn)程,希望以此打破算力瓶頸、降低模型成本。與微軟因?yàn)镚PU供應(yīng)問(wèn)題而貌合神離的OpenAI,也屢被傳出計(jì)劃自研AI芯片。

不過(guò),擁有自研芯片只是實(shí)現(xiàn)萬(wàn)卡集群的第一步。要訓(xùn)練基礎(chǔ)大模型,需要將一萬(wàn)張以上的加速卡(如GPU、TPU或其他專用AI芯片)組成一個(gè)高性能的「超級(jí)計(jì)算機(jī)」,工程難度極高。

中國(guó)工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民此前表示,當(dāng)下構(gòu)建國(guó)產(chǎn)自主萬(wàn)卡系統(tǒng)充滿挑戰(zhàn),但「至關(guān)重要」。

以百度自研萬(wàn)卡集群為例,它不僅為百度帶來(lái)堅(jiān)實(shí)的算力支持,也有望推動(dòng)模型降本趨勢(shì),成為中國(guó)科技界在人工智能領(lǐng)域的又一次突破。

客觀而言,國(guó)產(chǎn)芯片早期頂多相當(dāng)于AI大廠基礎(chǔ)設(shè)施的一個(gè)「副本」,更多是作為算力供應(yīng)的一個(gè)補(bǔ)充而存在,主要滿足單任務(wù)算力消耗。而在算力空前緊張、技術(shù)追求自主可控的趨勢(shì)下,國(guó)產(chǎn)智算開(kāi)始承受更多期待,集群效能最大化成為核心目標(biāo)。

這個(gè)核心目標(biāo)受市場(chǎng)需求驅(qū)動(dòng)。目前國(guó)內(nèi)客戶對(duì)大模型的關(guān)鍵訴求至少有兩個(gè):一是縮短訓(xùn)練時(shí)間。百度智能云事業(yè)群總裁沈抖此前提到,由于大模型行業(yè)的發(fā)展日新月異,客戶普遍希望能在兩周內(nèi)完成訓(xùn)練,最晚也應(yīng)在一個(gè)月內(nèi)完成。

二是降本。從信息時(shí)代到AI時(shí)代,降低技術(shù)成本曲線是科技行業(yè)永恒的主題。按照目前的硅谷規(guī)律,模型訓(xùn)練成本每年大約能降低四分之一,但這遠(yuǎn)不及市場(chǎng)期待。否則DeepSeek也不會(huì)在美國(guó)引發(fā)「強(qiáng)震」。據(jù)多方測(cè)算,DeepSeek-R1的整體成本約為OpenAI o1模型的1/30。

DeepSeek已經(jīng)讓全世界看到中國(guó)AI花小錢辦大事的務(wù)實(shí)能力?!度A爾街日?qǐng)?bào)》稱之為「夠用就好」策略,英國(guó)《金融時(shí)報(bào)》則直言,「并不是每個(gè)司機(jī)都需要一輛法拉利?!苟俣赛c(diǎn)亮國(guó)產(chǎn)萬(wàn)卡集群,則屬于中國(guó)AI從算力層面尋求成本突破的一個(gè)解法。

理論上,超大規(guī)模并行計(jì)算能力可實(shí)現(xiàn)訓(xùn)練效率躍升,萬(wàn)卡集群可將千億參數(shù)模型的訓(xùn)練周期大幅降低,滿足AI原生應(yīng)用快速迭代的需求;同時(shí)也能支持更大模型與復(fù)雜任務(wù)和多模態(tài)數(shù)據(jù),支撐Sora類應(yīng)用的開(kāi)發(fā)。

另一方面,萬(wàn)卡集群能夠支持多任務(wù)并發(fā)能力,通過(guò)動(dòng)態(tài)資源切分,單集群可同時(shí)訓(xùn)練多個(gè)輕量化模型,通過(guò)通信優(yōu)化與容錯(cuò)機(jī)制,提升集群綜合利用率,實(shí)現(xiàn)訓(xùn)練成本指數(shù)級(jí)下降。

不過(guò)在實(shí)踐中,超大規(guī)模集群的調(diào)度效率至關(guān)重要。比如怎么做模型的拆分,如何將訓(xùn)練、微調(diào)、推理任務(wù)混合部署,都會(huì)影響算力的有效發(fā)揮。

百度能率先點(diǎn)亮自研萬(wàn)卡集群,其實(shí)背后離不開(kāi)百舸AI異構(gòu)計(jì)算平臺(tái)4.0等超前基礎(chǔ)設(shè)施的支撐。

2024年9月升級(jí)的百舸4.0屬于大模型降本的「全能型選手」。僅降低通信瓶頸一項(xiàng),便將帶寬有效性提升到90%以上。在提供容錯(cuò)與穩(wěn)定性機(jī)制上,通過(guò)避免由于單卡故障率隨規(guī)模指數(shù)上升而造成的集群有效性大幅下降,保障有效訓(xùn)練率達(dá)到98%。

據(jù)了解,在百舸4.0的支撐下,百度自研3萬(wàn)卡集群也已經(jīng)在路上。

從行業(yè)發(fā)展角度來(lái)看,百度通過(guò)自研大規(guī)模集群的建設(shè),不僅解決了自身算力供應(yīng)的問(wèn)題,也為整個(gè)行業(yè)提供了新的思路和方向。

02

AI應(yīng)用爆發(fā)的杰文斯悖論

中外科技公司狂卷AI成本,行業(yè)影響深遠(yuǎn)。

如果沒(méi)有DeepSeek「上線20天日活2000萬(wàn)」的現(xiàn)場(chǎng)教學(xué),科技界或許很難將大模型降本帶來(lái)的變量具像化。盡管業(yè)界領(lǐng)袖都認(rèn)為這一天早晚會(huì)到來(lái)。

比如微軟CEO納德拉,在DeepSeek爆發(fā)前夕,他還在社交媒體上布道,「隨著人工智能變得更加高效和普及,我們將看到它的使用量猛增,成為一種永遠(yuǎn)無(wú)法滿足的商品」,經(jīng)濟(jì)學(xué)中的「杰文斯悖論」會(huì)在AI領(lǐng)域復(fù)現(xiàn)。

AI芯片初創(chuàng)公司Groq的首席執(zhí)行官此前直言,運(yùn)行AI模型的成本越低,AI能力顯然就越強(qiáng),「如果推理成本太高,人們就不會(huì)太多使用」,而更高的使用率才能催生更好的模型。

翻譯過(guò)來(lái),英偉達(dá)的軟肋,未嘗不是AI開(kāi)發(fā)者以及整個(gè)AI生態(tài)的幸事。

在移動(dòng)互聯(lián)網(wǎng)時(shí)代,從應(yīng)用層到基礎(chǔ)設(shè)施的倒三角型利益分配,催生了數(shù)量眾多的超級(jí)應(yīng)用和明星獨(dú)角獸,支撐了移動(dòng)生態(tài)的長(zhǎng)久繁榮。而在生成式AI時(shí)代初期,絕大多數(shù)AI投資最終流向了基礎(chǔ)設(shè)施層企業(yè)——強(qiáng)如微軟,其AI基礎(chǔ)設(shè)施投資中約有一半的錢也要用來(lái)買卡。

這一客觀現(xiàn)實(shí)無(wú)形中抬高了AI應(yīng)用開(kāi)發(fā)的門檻。

DeepSeek的崛起,意味著AI行業(yè)的發(fā)展正從硬件基礎(chǔ)設(shè)施層向軟件應(yīng)用層轉(zhuǎn)移?;ㄆ煸谧钚庐a(chǎn)業(yè)研報(bào)中預(yù)測(cè):DeepSeek、百度等中國(guó)模型的高效低成本將有助于加速全球AI應(yīng)用開(kāi)發(fā),可能在全球引發(fā)更多技術(shù)創(chuàng)新,并推動(dòng)2025年人工智能應(yīng)用的拐點(diǎn)。

舉個(gè)例子,百度自研萬(wàn)卡集群所代表的低成本算力,可以支撐Sora類多模態(tài)應(yīng)用的開(kāi)發(fā)。目前海外視頻生成的成本并不算低。Runway生成一條5秒視頻的價(jià)格為1.2美元,Sora生成一個(gè)5秒480P視頻成本約為0.5美元,如果多模態(tài)模型成本繼續(xù)下探,理論上會(huì)有更多的多模態(tài)應(yīng)用出現(xiàn)。

而DeepSeek-R1的高效推理能力,可能會(huì)直接帶來(lái)企業(yè)智能體領(lǐng)域的突破性進(jìn)展。企業(yè)智能體的目標(biāo)是處理工作任務(wù),如果能以更低的推理成本擁有智能體類的AI員工,企業(yè)客戶的盈利能力也將間接得到提升。

為了加速AI應(yīng)用開(kāi)發(fā)的繁榮,在DeepSeek出圈以來(lái),百度智能云、華為云、阿里云、騰訊云、火山引擎等也在爭(zhēng)相接入DeepSeek模型,并以優(yōu)惠條件吸引更多的企業(yè)客戶和開(kāi)發(fā)者。

這其中,百度在「砍門檻」上算是比較激進(jìn)的一家。2月3日百度智能云直接宣布打折——千帆ModelBuilder平臺(tái)上的DeepSeek-R1僅為官方刊例價(jià)的5折,DeepSeek-V3僅為官方刊例價(jià)的3折,并提供限時(shí)免費(fèi)服務(wù)。

「砍門檻」的背后,是百度智能云在推理引擎性能優(yōu)化技術(shù)、推理服務(wù)工程架構(gòu)創(chuàng)新以及推理服務(wù)全鏈路安全保障上的深度融合。

在推理引擎性能上,針對(duì)DeepSeek模型MLA結(jié)構(gòu)的計(jì)算進(jìn)行了極致的性能優(yōu)化,并通過(guò)計(jì)算、通信、內(nèi)存不同資源類型算子的有效重疊及高效的Prefill/Decode分離式推理架構(gòu)等,在核心延遲指標(biāo)TTFT/TPOT滿足SLA的條件下,實(shí)現(xiàn)模型吞吐的大幅度提升。

在推理服務(wù)的工程架構(gòu)上,百度智能云做了嚴(yán)格的推/拉模式的性能對(duì)比。為了進(jìn)一步提升系統(tǒng)的穩(wěn)定性和用戶體驗(yàn),設(shè)計(jì)了請(qǐng)求失敗的續(xù)推機(jī)制,這顯著增強(qiáng)了系統(tǒng)的容錯(cuò)能力和服務(wù)SLA達(dá)標(biāo)率。同時(shí)針對(duì)多輪對(duì)話和system設(shè)定等場(chǎng)景中存在重復(fù)Prompt前綴的情況,實(shí)現(xiàn)了主流的KV-Cache復(fù)用技術(shù),并輔以全局Cache感知的流量調(diào)度策略。

在穩(wěn)定安全保障上,集成了百度智能云獨(dú)家內(nèi)容安全算子,實(shí)現(xiàn)模型安全增強(qiáng)與企業(yè)級(jí)高可用保障,基于大模型全生命周期數(shù)據(jù)安全與模型保護(hù)機(jī)制,在千帆平臺(tái)上的模型均擁有使用安全的安全保障。

DeepSeek模型上線首日,已有超1.5萬(wàn)家客戶通過(guò)千帆平臺(tái)進(jìn)行模型調(diào)用。

「價(jià)格戰(zhàn)」背后,本質(zhì)還是一個(gè)由于AI應(yīng)用所主導(dǎo)的AI生態(tài)之爭(zhēng)。

在這個(gè)過(guò)程中,對(duì)沖基金橋水判斷,AI對(duì)算力的需求不會(huì)放緩,反而可能加速?!附芪乃广U摗顾坪跤啦贿^(guò)時(shí)。

這也是為什么微軟、Meta、谷歌、百度、字節(jié)今年都在算力上加大投入。根據(jù)目前的公開(kāi)信息,微軟計(jì)劃在截至今年6月份的財(cái)年對(duì)AI數(shù)據(jù)中心投資800億美元,Meta今年計(jì)劃在AI基礎(chǔ)設(shè)施等領(lǐng)域投入650億美元。用谷歌CEO皮查伊的話說(shuō),大家都想擁抱更多的發(fā)展機(jī)會(huì)。

在納德拉宣布微軟在 AI 和云基礎(chǔ)設(shè)施方面的800 億美元后,馬斯克轉(zhuǎn)發(fā)了這一消息

縱觀全球AI競(jìng)爭(zhēng),擁有更高性能、更低成本的算力,始終是AI巨頭保證領(lǐng)先地位的重要抓手。

國(guó)內(nèi)頭部企業(yè)如百度,除了已經(jīng)路上的3萬(wàn)卡集群,百舸4.0設(shè)計(jì)之初可支持10萬(wàn)卡用量,這一「留白」為中國(guó)AI企業(yè)更低門檻的創(chuàng)新突破積蓄了一定的空間。

憑借其強(qiáng)大的算力優(yōu)勢(shì)、成本效益以及百舸平臺(tái)的全方位賦能,百度等國(guó)內(nèi)AI公司有望為人工智能的發(fā)展注入新的活力。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
做最壞打算!中國(guó)055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

做最壞打算!中國(guó)055大驅(qū)第二批加速,美媒:還有被美軍扣船隱憂

時(shí)時(shí)有聊
2026-01-08 07:28:37
潘石屹再次預(yù)判樓市,不出意外的話,未來(lái)3年樓市將迎來(lái)3大走向

潘石屹再次預(yù)判樓市,不出意外的話,未來(lái)3年樓市將迎來(lái)3大走向

小裝修
2026-01-06 09:37:06
湖北省經(jīng)濟(jì)和信息化廳原副廳長(zhǎng)郭濤接受審查調(diào)查

湖北省經(jīng)濟(jì)和信息化廳原副廳長(zhǎng)郭濤接受審查調(diào)查

界面新聞
2026-01-08 15:34:45
攤牌了?中企陸續(xù)收到光刻機(jī),外媒:ASML公司不“乖”了

攤牌了?中企陸續(xù)收到光刻機(jī),外媒:ASML公司不“乖”了

豐譚筆錄
2026-01-08 00:11:38
上午突發(fā)利空!10股業(yè)績(jī)暴雷 7公司巨虧,白酒龍頭單季凈利腰斬!

上午突發(fā)利空!10股業(yè)績(jī)暴雷 7公司巨虧,白酒龍頭單季凈利腰斬!

股市皆大事
2026-01-08 08:35:22
樸槿惠出獄生活:住1676平別墅,與小10歲律師為伴,如今生活安逸

樸槿惠出獄生活:住1676平別墅,與小10歲律師為伴,如今生活安逸

顧史
2026-01-07 20:10:11
工齡42年11個(gè)月,個(gè)人賬戶105767.19元,60歲退休,養(yǎng)老金多少?

工齡42年11個(gè)月,個(gè)人賬戶105767.19元,60歲退休,養(yǎng)老金多少?

墜入二次元的海洋
2026-01-08 12:50:18
美國(guó)宣布停止對(duì)索馬里政府所有支援

美國(guó)宣布停止對(duì)索馬里政府所有支援

新華社
2026-01-08 10:36:09
零容忍!國(guó)家出手官媒批評(píng)閆學(xué)晶毫不留情句句捅心窩子引百姓共鳴

零容忍!國(guó)家出手官媒批評(píng)閆學(xué)晶毫不留情句句捅心窩子引百姓共鳴

娛樂(lè)小丸子
2026-01-08 09:36:28
婚變傳聞不到2天,田樸珺不再沉默,二字回應(yīng),王石心里早有底了

婚變傳聞不到2天,田樸珺不再沉默,二字回應(yīng),王石心里早有底了

李健政觀察
2026-01-05 14:49:27
連續(xù)兩場(chǎng)15+助攻!穆雷22分8板17助,沃特森30分,布朗空砍33+7+4

連續(xù)兩場(chǎng)15+助攻!穆雷22分8板17助,沃特森30分,布朗空砍33+7+4

無(wú)術(shù)不學(xué)
2026-01-08 11:29:51
《愛(ài)情公寓》陳美嘉飾演者被曝懷孕!本人親自出面回應(yīng),肚子確實(shí)變大了,但沒(méi)情況

《愛(ài)情公寓》陳美嘉飾演者被曝懷孕!本人親自出面回應(yīng),肚子確實(shí)變大了,但沒(méi)情況

不八卦掌門人
2026-01-08 11:10:08
張梓琳哈爾濱旅游,零下20度快被凍哭,10歲女兒睫毛上都是冰碴

張梓琳哈爾濱旅游,零下20度快被凍哭,10歲女兒睫毛上都是冰碴

娛圈小愚
2026-01-08 10:18:00
麻省理工研究警告:未來(lái)華北平原不宜人類居??!理論依據(jù)是什么?

麻省理工研究警告:未來(lái)華北平原不宜人類居?。±碚撘罁?jù)是什么?

小熊侃史
2026-01-08 07:55:03
現(xiàn)階段,我最認(rèn)同的政治制度

現(xiàn)階段,我最認(rèn)同的政治制度

力哥說(shuō)
2026-01-08 00:38:37
女人染上“性癮”是一種怎樣的體驗(yàn)?可能和你想象得不同

女人染上“性癮”是一種怎樣的體驗(yàn)?可能和你想象得不同

紙上的心語(yǔ)
2025-11-23 11:36:00
勇士險(xiǎn)勝!庫(kù)里31+7+7,賽后字母哥快步走來(lái),一把抱住庫(kù)里

勇士險(xiǎn)勝!庫(kù)里31+7+7,賽后字母哥快步走來(lái),一把抱住庫(kù)里

擔(dān)酒
2026-01-08 13:28:25
李在明訪華,日本產(chǎn)業(yè)界重磅施壓后,高市早苗突然向我國(guó)喊話

李在明訪華,日本產(chǎn)業(yè)界重磅施壓后,高市早苗突然向我國(guó)喊話

肖茲探秘說(shuō)
2026-01-07 21:36:04
26年央視春晚導(dǎo)演官宣彩排!小品領(lǐng)軍人物確認(rèn)回歸,終于等到這天

26年央視春晚導(dǎo)演官宣彩排!小品領(lǐng)軍人物確認(rèn)回歸,終于等到這天

瓜汁橘長(zhǎng)Dr
2026-01-08 10:51:52
不是魯能也不是申花!斯坦重返中超新東家浮出水面,球迷直言意外

不是魯能也不是申花!斯坦重返中超新東家浮出水面,球迷直言意外

張麗說(shuō)足球
2026-01-08 10:11:45
2026-01-08 16:23:00
降噪 incentive-icons
降噪
噪音太多,來(lái)點(diǎn)有意思的吧
321文章數(shù) 1226關(guān)注度
往期回顧 全部

科技要聞

智譜拿下“全球大模型第一股”,憑什么

頭條要聞

中方被指正考慮進(jìn)一步收緊中重稀土出口 日本業(yè)界慌了

頭條要聞

中方被指正考慮進(jìn)一步收緊中重稀土出口 日本業(yè)界慌了

體育要聞

約基奇倒下后,一位故人邪魅一笑

娛樂(lè)要聞

2026春節(jié)檔將有六部電影強(qiáng)勢(shì)上映

財(cái)經(jīng)要聞

微軟CTO韋青:未來(lái)人類會(huì)花錢"戒手機(jī)"

汽車要聞

從量變到"智"變 吉利在CES打出了五張牌

態(tài)度原創(chuàng)

藝術(shù)
家居
數(shù)碼
教育
公開(kāi)課

藝術(shù)要聞

頤和園金光穿洞

家居要聞

理性主義 冷調(diào)自由居所

數(shù)碼要聞

鷹角網(wǎng)絡(luò)與八位堂聯(lián)名推出Retro 87復(fù)古鍵盤新春套裝,售價(jià)499元

教育要聞

中考數(shù)學(xué),求陰影面積?

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版