国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

又一大算力AI芯片發(fā)布!比B200快3倍,剛?cè)谫Y24億元

0
分享至


芯東西(公眾號(hào):aichip001)
作者 ZeR0
編輯 漠影

芯東西2月25日?qǐng)?bào)道,2月24日,英特爾宣布向美國AI芯片獨(dú)角獸SambaNova的超過3.5億美元(約合人民幣24億元)E輪戰(zhàn)略融資注資,具體金額未披露。

同時(shí),SambaNova推出其第五代AI芯片SN50,號(hào)稱這是“唯一一款能夠提供智能體AI所需速度和吞吐量的芯片”,最高速度達(dá)同類芯片的5倍,經(jīng)多芯互連可支持的單模型參數(shù)規(guī)模達(dá)10萬億、上下文長(zhǎng)度達(dá)1000萬個(gè)token。


據(jù)SambaNova披露,與Blackwell B200 GPU相比,SN50的最大速度是其5倍,智能體推理的吞吐量是其3倍以上,這在Meta的Llama 3.3 70B等一系列模型上得到充分體現(xiàn)。


據(jù)外媒報(bào)道,在此之前,英特爾曾討論過以約16億美元(約合人民幣110億元)收購SambaNova,但談判最終破裂。不過雙方均未回應(yīng)過此事。

SambaNova由多位斯坦福大學(xué)教授在2017年創(chuàng)立,在2021年融資后估值達(dá)到50億美元(約合人民幣344億元)。其董事長(zhǎng)是英特爾CEO陳立武。英特爾曾多次投資SambaNova。


在最新公告中,SambaNova與英特爾宣布達(dá)成了一項(xiàng)多年戰(zhàn)略合作計(jì)劃,旨在提供高性能、高性價(jià)比的AI推理解決方案,打造下一代異構(gòu)AI數(shù)據(jù)中心,整合英特爾至強(qiáng)處理器、英特爾GPU、英特爾網(wǎng)絡(luò)和存儲(chǔ)及SambaNova系統(tǒng),以釋放數(shù)十億美元的推理市場(chǎng)機(jī)遇。

消息公布后,英特爾在美東時(shí)間周二股價(jià)漲超5%。

一、5倍算力、4倍網(wǎng)絡(luò)帶寬,能支撐10萬億參數(shù)大模型

SN50芯片基于SambaNova的可重構(gòu)數(shù)據(jù)流單元(RDU)架構(gòu),超低延遲可提供實(shí)時(shí)響應(yīng),能支持數(shù)千個(gè)并發(fā)AI會(huì)話,并通過更高的硬件利用率降低了每個(gè)token的成本。

每塊芯片的算力提高到第四代SN40L的5倍,網(wǎng)絡(luò)帶寬提高至4倍。

SambaRack SN50將16塊SN50芯片組合在一起,可運(yùn)行多達(dá)10萬億個(gè)參數(shù)、1000萬個(gè)token的超大模型。


互連的SambaRack可通過每秒數(shù)TB的互連速度連接多達(dá)256塊芯片,從而縮短首次token生成時(shí)間,并支持更大的批處理規(guī)模,因此可以部署具有更高吞吐量和響應(yīng)速度的模型。

SambaRack的功耗平均僅需20kW,可在現(xiàn)有的風(fēng)冷數(shù)據(jù)中心中運(yùn)行。這為運(yùn)行g(shù)pt-oss等模型的推理服務(wù)提供商帶來了總擁有成本(TCO)優(yōu)勢(shì),其節(jié)能效果是B200 GPU的8倍。


SN50將于2026年下半年開始發(fā)貨。軟銀集團(tuán)將成為首家在日本下一代AI數(shù)據(jù)中心部署SN50的客戶。


二、基于數(shù)據(jù)流、三層內(nèi)存架構(gòu),跑大模型時(shí)更快更高能效

SambaNova團(tuán)隊(duì)認(rèn)為,智能體需要智能、預(yù)測(cè)性和彈性的基礎(chǔ)架構(gòu),要實(shí)現(xiàn)可行智能體,硬件必須能夠即時(shí)適應(yīng)突發(fā)性工作負(fù)載,在專家模型之間無延遲切換。


GPU擅長(zhǎng)AI模型訓(xùn)練,但AI推理是數(shù)據(jù)移動(dòng)和內(nèi)存優(yōu)化方面的挑戰(zhàn),需要不同的架構(gòu)方法。

為了執(zhí)行AI推理,GPU必須多次冗余地調(diào)用片外內(nèi)存,每次內(nèi)存調(diào)用都會(huì)增加處理延遲并消耗能量,會(huì)導(dǎo)致高功耗問題。

在GPU上部署多個(gè)模型的標(biāo)準(zhǔn)方法是將模型加載到高帶寬內(nèi)存(HBM)中,但GPU HBM資源稀缺且成本高昂。

當(dāng)工作負(fù)載需要一個(gè)未加載的模型時(shí),系統(tǒng)必須卸載當(dāng)前模型并獲取新模型,這個(gè)過程通常以秒為單位。即便使用vLLM的1級(jí)睡眠模式,喚醒一個(gè)小型模型也需要0.1到0.8秒。

對(duì)于智能體所需的大型推理模型而言,這種喚醒時(shí)間會(huì)造成3到6秒的延遲。對(duì)于執(zhí)行涉及5個(gè)不同模型的10步推理過程的AI智能體來說,這些延遲累積起來會(huì)達(dá)到30秒,導(dǎo)致實(shí)時(shí)智能體工作流程無法使用。

SambaNova的RDU正是為解決這一問題而設(shè)計(jì)的。

RDU將給定AI模型的計(jì)算圖映射到處理器上數(shù)據(jù)傳輸?shù)淖钣行窂?。這種方法消除了冗余的內(nèi)存調(diào)用,可顯著降低延遲和功耗。


與受限于單卡HBM容量的GPU不同,SN50 RDU采用獨(dú)特的三層內(nèi)存架構(gòu),結(jié)合了片上SRAM、海量HBM和超高速SRAM。

這種分層結(jié)構(gòu)使芯片能承載最大的模型,支持在毫秒級(jí)時(shí)間內(nèi)運(yùn)行和切換多個(gè)模型。

此外,借助SN50,輸入token可緩存在內(nèi)存中,從而減少預(yù)填充處理時(shí)間和請(qǐng)求的首token獲取時(shí)間(TTFT)。


結(jié)合這些優(yōu)勢(shì),其內(nèi)存架構(gòu)非常適合作為智能體的緩存,能夠更高效地處理任務(wù)。

SambaNova還在SambaStack上推出了由RDU支持的可配置模型包,與傳統(tǒng)的GPU架構(gòu)和vLLM等推理框架相比,這些模型包的切換速度更快。

三、與英特爾聯(lián)手,加速推出AI云平臺(tái)

作為多年戰(zhàn)略合作的一部分,英特爾計(jì)劃對(duì)SambaNova進(jìn)行戰(zhàn)略投資,以加速推出基于英特爾技術(shù)的AI云平臺(tái)。

此次合作預(yù)計(jì)將涵蓋三個(gè)關(guān)鍵領(lǐng)域:

(1)AI云擴(kuò)展:SambaNova正在擴(kuò)展其垂直整合的AI云平臺(tái),該平臺(tái)基于英特爾至強(qiáng)處理器構(gòu)建,并針對(duì)大語言模型和多模態(tài)模型進(jìn)行了優(yōu)化。該平臺(tái)將提供低延遲、高吞吐量的AI服務(wù),并由參考架構(gòu)、部署藍(lán)圖以及與系統(tǒng)集成商和軟件供應(yīng)商的合作關(guān)系提供支持。

(2)集成AI基礎(chǔ)設(shè)施:將SambaNova的系統(tǒng)與英特爾的CPU、加速器和網(wǎng)絡(luò)技術(shù)相結(jié)合,為推理、代碼生成、多模態(tài)應(yīng)用和智能體工作流提供可擴(kuò)展的、可用于生產(chǎn)的推理能力。

(3)市場(chǎng)推廣執(zhí)行:通過英特爾的全球企業(yè)、云和合作伙伴渠道進(jìn)行聯(lián)合銷售和聯(lián)合營銷,以加速AI生態(tài)系統(tǒng)的普及。

據(jù)英特爾披露,此次合作是對(duì)英特爾現(xiàn)有數(shù)據(jù)中心GPU投入的補(bǔ)充,并不會(huì)改變其在AI領(lǐng)域的競(jìng)爭(zhēng)戰(zhàn)略,英特爾將繼續(xù)加大對(duì)GPU知識(shí)產(chǎn)權(quán)、架構(gòu)、產(chǎn)品、軟件和系統(tǒng)的投資,并強(qiáng)化其從邊緣到云端AI戰(zhàn)略路線圖。

結(jié)語:AI推理市場(chǎng)迎來新組合

隨著AI推理蓬勃發(fā)展,科技公司們都在尋求更高速度和效率、更低企業(yè)級(jí)AI部署成本的AI硬件基礎(chǔ)設(shè)施方案。

許多云端AI芯片創(chuàng)企都將自家產(chǎn)品的賣點(diǎn)放在了高能效上,既順應(yīng)AI推理需求旺盛的趨勢(shì),又能避開英偉達(dá)強(qiáng)于AI訓(xùn)練的鋒芒。

通過合作,SambaNova可以借助英特爾的全球影響力擴(kuò)大其AI處理器的規(guī)模,英特爾也增強(qiáng)了在AI推理領(lǐng)域的綜合實(shí)力。這將為日趨多元化的AI推理市場(chǎng)提供一個(gè)有競(jìng)爭(zhēng)力的選擇。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
海倫堡地產(chǎn)集團(tuán)創(chuàng)始人黃熾恒滯留香港

海倫堡地產(chǎn)集團(tuán)創(chuàng)始人黃熾恒滯留香港

地產(chǎn)微資訊
2026-03-02 21:10:48
28分輕取國王!東契奇生涯總分超越96.6%的NBA球員,他才25歲

28分輕取國王!東契奇生涯總分超越96.6%的NBA球員,他才25歲

大眼瞄世界
2026-03-03 01:25:03
伊朗12輪打擊已使美以失去“低成本低風(fēng)險(xiǎn)可持續(xù)”的前沿作戰(zhàn)能力

伊朗12輪打擊已使美以失去“低成本低風(fēng)險(xiǎn)可持續(xù)”的前沿作戰(zhàn)能力

李博世財(cái)經(jīng)
2026-03-03 10:26:43
老人睡工地3年工頭從不趕他,工程完工那天,他對(duì)工頭說去見個(gè)人

老人睡工地3年工頭從不趕他,工程完工那天,他對(duì)工頭說去見個(gè)人

流螢敘情
2025-08-20 18:24:36
49歲林心如斷崖式衰老,當(dāng)年的紫薇格格也老了,臉變長(zhǎng) 抬頭紋好多

49歲林心如斷崖式衰老,當(dāng)年的紫薇格格也老了,臉變長(zhǎng) 抬頭紋好多

陳意小可愛
2026-03-01 00:49:59
鴻蒙智行處罰違規(guī)營銷門店

鴻蒙智行處罰違規(guī)營銷門店

每日經(jīng)濟(jì)新聞
2026-03-02 17:08:50
六十年前三線建設(shè)曾被質(zhì)疑,如今看來,毛主席的決策顯現(xiàn)深遠(yuǎn)智慧

六十年前三線建設(shè)曾被質(zhì)疑,如今看來,毛主席的決策顯現(xiàn)深遠(yuǎn)智慧

老踝是個(gè)手藝人
2026-02-23 17:26:29
五周之約與地面行動(dòng):針對(duì)伊朗的“重大機(jī)會(huì)”與敘事斷層風(fēng)險(xiǎn)

五周之約與地面行動(dòng):針對(duì)伊朗的“重大機(jī)會(huì)”與敘事斷層風(fēng)險(xiǎn)

楓葉君評(píng)
2026-03-03 10:03:52
沉默整整9天,毛寧一錘定音,中美戰(zhàn)機(jī)已交手,美方要見中國代表

沉默整整9天,毛寧一錘定音,中美戰(zhàn)機(jī)已交手,美方要見中國代表

丁羂解說
2026-02-26 14:31:05
最后一次!英超一周雙賽,利物浦大勝可進(jìn)前三,切爾西或降至第七

最后一次!英超一周雙賽,利物浦大勝可進(jìn)前三,切爾西或降至第七

嗨皮看球
2026-03-03 10:35:10
不可錯(cuò)過!3月3日中午12:00比賽!中央5套CCTV5、CCTV5+直播表

不可錯(cuò)過!3月3日中午12:00比賽!中央5套CCTV5、CCTV5+直播表

皮皮觀天下
2026-03-03 10:48:02
表面是演員,實(shí)際職務(wù)卻高到嚇人,這四位明星個(gè)個(gè)“深藏不露”

表面是演員,實(shí)際職務(wù)卻高到嚇人,這四位明星個(gè)個(gè)“深藏不露”

丁丁鯉史紀(jì)
2026-03-02 15:06:53
有人痛批,有人竟逆風(fēng)“倒戈”?特朗普極限開戰(zhàn),意外逼出民主黨隱藏20年的政治舊疤

有人痛批,有人竟逆風(fēng)“倒戈”?特朗普極限開戰(zhàn),意外逼出民主黨隱藏20年的政治舊疤

愛下廚的阿釃
2026-03-02 19:59:04
金華這25個(gè)男男女女被曝光,全部不打碼!你認(rèn)識(shí)嗎?最新大曝光來了

金華這25個(gè)男男女女被曝光,全部不打碼!你認(rèn)識(shí)嗎?最新大曝光來了

最金華
2026-03-02 22:44:42
國家安全部:NFC可能成為信息泄露乃至危害國家安全的渠道

國家安全部:NFC可能成為信息泄露乃至危害國家安全的渠道

上觀新聞
2026-02-02 07:09:04
為啥到了川西,要勤洗手,不玩狗?有啥科學(xué)解釋?

為啥到了川西,要勤洗手,不玩狗?有啥科學(xué)解釋?

向航說
2026-02-28 00:35:03
首次曝光!小米機(jī)器人給小米汽車安裝車標(biāo):一氣呵成 還會(huì)先撕膜

首次曝光!小米機(jī)器人給小米汽車安裝車標(biāo):一氣呵成 還會(huì)先撕膜

快科技
2026-03-02 15:23:16
眾星被困中東進(jìn)展!李茂7000租車逃離,周雨彤回京,黃渤驚險(xiǎn)避坑

眾星被困中東進(jìn)展!李茂7000租車逃離,周雨彤回京,黃渤驚險(xiǎn)避坑

喜歡歷史的阿繁
2026-03-03 01:19:54
美軍航母遭襲致560名傷亡,特朗普態(tài)度突變

美軍航母遭襲致560名傷亡,特朗普態(tài)度突變

負(fù)面黑洞
2026-03-03 09:31:55
如果毛主席沒有寫出《沁園春·雪》,他還可以靠哪首詞名揚(yáng)天下?

如果毛主席沒有寫出《沁園春·雪》,他還可以靠哪首詞名揚(yáng)天下?

優(yōu)趣紀(jì)史記
2026-03-02 19:04:55
2026-03-03 11:43:00
芯東西 incentive-icons
芯東西
專注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
2217文章數(shù) 8151關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

霍爾木茲海峽近乎停擺 布油直逼80美元

頭條要聞

牛彈琴:多國對(duì)轟炸保持沉默 西班牙首相確實(shí)是條漢子

頭條要聞

牛彈琴:多國對(duì)轟炸保持沉默 西班牙首相確實(shí)是條漢子

體育要聞

35輪后積分-7,他們?cè)庥鍪飞献钤绲慕导?jí)

娛樂要聞

謝娜霸氣護(hù)夫:喊話薛之謙給張杰道歉

科技要聞

手機(jī)AI在MWC上卷出了新高度

汽車要聞

長(zhǎng)安汽車2月銷量151922輛 環(huán)比逆勢(shì)增長(zhǎng)12.8%

態(tài)度原創(chuàng)

時(shí)尚
本地
健康
教育
游戲

普通人穿衣真的很簡(jiǎn)單!單品選對(duì)、搭配合理,大方舒適又得體

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

教育要聞

高中物理全反射實(shí)驗(yàn)課件

任天堂壓抑了!官號(hào)盛贊《生化危機(jī)9》里昂:好性感

無障礙瀏覽 進(jìn)入關(guān)懷版