国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

又一大算力AI芯片發(fā)布!比B200快3倍,剛?cè)谫Y24億元

0
分享至


芯東西(公眾號(hào):aichip001)
作者 ZeR0
編輯 漠影

芯東西2月25日?qǐng)?bào)道,2月24日,英特爾宣布向美國(guó)AI芯片獨(dú)角獸SambaNova的超過(guò)3.5億美元(約合人民幣24億元)E輪戰(zhàn)略融資注資,具體金額未披露。

同時(shí),SambaNova推出其第五代AI芯片SN50,號(hào)稱(chēng)這是“唯一一款能夠提供智能體AI所需速度和吞吐量的芯片”,最高速度達(dá)同類(lèi)芯片的5倍,經(jīng)多芯互連可支持的單模型參數(shù)規(guī)模達(dá)10萬(wàn)億、上下文長(zhǎng)度達(dá)1000萬(wàn)個(gè)token。


據(jù)SambaNova披露,與Blackwell B200 GPU相比,SN50的最大速度是其5倍,智能體推理的吞吐量是其3倍以上,這在Meta的Llama 3.3 70B等一系列模型上得到充分體現(xiàn)。


據(jù)外媒報(bào)道,在此之前,英特爾曾討論過(guò)以約16億美元(約合人民幣110億元)收購(gòu)SambaNova,但談判最終破裂。不過(guò)雙方均未回應(yīng)過(guò)此事。

SambaNova由多位斯坦福大學(xué)教授在2017年創(chuàng)立,在2021年融資后估值達(dá)到50億美元(約合人民幣344億元)。其董事長(zhǎng)是英特爾CEO陳立武。英特爾曾多次投資SambaNova。


在最新公告中,SambaNova與英特爾宣布達(dá)成了一項(xiàng)多年戰(zhàn)略合作計(jì)劃,旨在提供高性能、高性?xún)r(jià)比的AI推理解決方案,打造下一代異構(gòu)AI數(shù)據(jù)中心,整合英特爾至強(qiáng)處理器、英特爾GPU、英特爾網(wǎng)絡(luò)和存儲(chǔ)及SambaNova系統(tǒng),以釋放數(shù)十億美元的推理市場(chǎng)機(jī)遇。

消息公布后,英特爾在美東時(shí)間周二股價(jià)漲超5%。

一、5倍算力、4倍網(wǎng)絡(luò)帶寬,能支撐10萬(wàn)億參數(shù)大模型

SN50芯片基于SambaNova的可重構(gòu)數(shù)據(jù)流單元(RDU)架構(gòu),超低延遲可提供實(shí)時(shí)響應(yīng),能支持數(shù)千個(gè)并發(fā)AI會(huì)話(huà),并通過(guò)更高的硬件利用率降低了每個(gè)token的成本。

每塊芯片的算力提高到第四代SN40L的5倍,網(wǎng)絡(luò)帶寬提高至4倍。

SambaRack SN50將16塊SN50芯片組合在一起,可運(yùn)行多達(dá)10萬(wàn)億個(gè)參數(shù)、1000萬(wàn)個(gè)token的超大模型。


互連的SambaRack可通過(guò)每秒數(shù)TB的互連速度連接多達(dá)256塊芯片,從而縮短首次token生成時(shí)間,并支持更大的批處理規(guī)模,因此可以部署具有更高吞吐量和響應(yīng)速度的模型。

SambaRack的功耗平均僅需20kW,可在現(xiàn)有的風(fēng)冷數(shù)據(jù)中心中運(yùn)行。這為運(yùn)行g(shù)pt-oss等模型的推理服務(wù)提供商帶來(lái)了總擁有成本(TCO)優(yōu)勢(shì),其節(jié)能效果是B200 GPU的8倍。


SN50將于2026年下半年開(kāi)始發(fā)貨。軟銀集團(tuán)將成為首家在日本下一代AI數(shù)據(jù)中心部署SN50的客戶(hù)。


二、基于數(shù)據(jù)流、三層內(nèi)存架構(gòu),跑大模型時(shí)更快更高能效

SambaNova團(tuán)隊(duì)認(rèn)為,智能體需要智能、預(yù)測(cè)性和彈性的基礎(chǔ)架構(gòu),要實(shí)現(xiàn)可行智能體,硬件必須能夠即時(shí)適應(yīng)突發(fā)性工作負(fù)載,在專(zhuān)家模型之間無(wú)延遲切換。


GPU擅長(zhǎng)AI模型訓(xùn)練,但AI推理是數(shù)據(jù)移動(dòng)和內(nèi)存優(yōu)化方面的挑戰(zhàn),需要不同的架構(gòu)方法。

為了執(zhí)行AI推理,GPU必須多次冗余地調(diào)用片外內(nèi)存,每次內(nèi)存調(diào)用都會(huì)增加處理延遲并消耗能量,會(huì)導(dǎo)致高功耗問(wèn)題。

在GPU上部署多個(gè)模型的標(biāo)準(zhǔn)方法是將模型加載到高帶寬內(nèi)存(HBM)中,但GPU HBM資源稀缺且成本高昂。

當(dāng)工作負(fù)載需要一個(gè)未加載的模型時(shí),系統(tǒng)必須卸載當(dāng)前模型并獲取新模型,這個(gè)過(guò)程通常以秒為單位。即便使用vLLM的1級(jí)睡眠模式,喚醒一個(gè)小型模型也需要0.1到0.8秒。

對(duì)于智能體所需的大型推理模型而言,這種喚醒時(shí)間會(huì)造成3到6秒的延遲。對(duì)于執(zhí)行涉及5個(gè)不同模型的10步推理過(guò)程的AI智能體來(lái)說(shuō),這些延遲累積起來(lái)會(huì)達(dá)到30秒,導(dǎo)致實(shí)時(shí)智能體工作流程無(wú)法使用。

SambaNova的RDU正是為解決這一問(wèn)題而設(shè)計(jì)的。

RDU將給定AI模型的計(jì)算圖映射到處理器上數(shù)據(jù)傳輸?shù)淖钣行窂?。這種方法消除了冗余的內(nèi)存調(diào)用,可顯著降低延遲和功耗。


與受限于單卡HBM容量的GPU不同,SN50 RDU采用獨(dú)特的三層內(nèi)存架構(gòu),結(jié)合了片上SRAM、海量HBM和超高速SRAM

這種分層結(jié)構(gòu)使芯片能承載最大的模型,支持在毫秒級(jí)時(shí)間內(nèi)運(yùn)行和切換多個(gè)模型。

此外,借助SN50,輸入token可緩存在內(nèi)存中,從而減少預(yù)填充處理時(shí)間和請(qǐng)求的首token獲取時(shí)間(TTFT)。


結(jié)合這些優(yōu)勢(shì),其內(nèi)存架構(gòu)非常適合作為智能體的緩存,能夠更高效地處理任務(wù)。

SambaNova還在SambaStack上推出了由RDU支持的可配置模型包,與傳統(tǒng)的GPU架構(gòu)和vLLM等推理框架相比,這些模型包的切換速度更快。

三、與英特爾聯(lián)手,加速推出AI云平臺(tái)

作為多年戰(zhàn)略合作的一部分,英特爾計(jì)劃對(duì)SambaNova進(jìn)行戰(zhàn)略投資,以加速推出基于英特爾技術(shù)的AI云平臺(tái)。

此次合作預(yù)計(jì)將涵蓋三個(gè)關(guān)鍵領(lǐng)域:

(1)AI云擴(kuò)展:SambaNova正在擴(kuò)展其垂直整合的AI云平臺(tái),該平臺(tái)基于英特爾至強(qiáng)處理器構(gòu)建,并針對(duì)大語(yǔ)言模型和多模態(tài)模型進(jìn)行了優(yōu)化。該平臺(tái)將提供低延遲、高吞吐量的AI服務(wù),并由參考架構(gòu)、部署藍(lán)圖以及與系統(tǒng)集成商和軟件供應(yīng)商的合作關(guān)系提供支持。

(2)集成AI基礎(chǔ)設(shè)施:將SambaNova的系統(tǒng)與英特爾的CPU、加速器和網(wǎng)絡(luò)技術(shù)相結(jié)合,為推理、代碼生成、多模態(tài)應(yīng)用和智能體工作流提供可擴(kuò)展的、可用于生產(chǎn)的推理能力。

(3)市場(chǎng)推廣執(zhí)行:通過(guò)英特爾的全球企業(yè)、云和合作伙伴渠道進(jìn)行聯(lián)合銷(xiāo)售和聯(lián)合營(yíng)銷(xiāo),以加速AI生態(tài)系統(tǒng)的普及。

據(jù)英特爾披露,此次合作是對(duì)英特爾現(xiàn)有數(shù)據(jù)中心GPU投入的補(bǔ)充,并不會(huì)改變其在AI領(lǐng)域的競(jìng)爭(zhēng)戰(zhàn)略,英特爾將繼續(xù)加大對(duì)GPU知識(shí)產(chǎn)權(quán)、架構(gòu)、產(chǎn)品、軟件和系統(tǒng)的投資,并強(qiáng)化其從邊緣到云端AI戰(zhàn)略路線圖。

結(jié)語(yǔ):AI推理市場(chǎng)迎來(lái)新組合

隨著AI推理蓬勃發(fā)展,科技公司們都在尋求更高速度和效率、更低企業(yè)級(jí)AI部署成本的AI硬件基礎(chǔ)設(shè)施方案。

許多云端AI芯片創(chuàng)企都將自家產(chǎn)品的賣(mài)點(diǎn)放在了高能效上,既順應(yīng)AI推理需求旺盛的趨勢(shì),又能避開(kāi)英偉達(dá)強(qiáng)于AI訓(xùn)練的鋒芒。

通過(guò)合作,SambaNova可以借助英特爾的全球影響力擴(kuò)大其AI處理器的規(guī)模,英特爾也增強(qiáng)了在AI推理領(lǐng)域的綜合實(shí)力。這將為日趨多元化的AI推理市場(chǎng)提供一個(gè)有競(jìng)爭(zhēng)力的選擇。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
收拾完伊朗,下一個(gè)輪到中國(guó)?以色列發(fā)戰(zhàn)爭(zhēng)威脅,中方送出5個(gè)字

收拾完伊朗,下一個(gè)輪到中國(guó)?以色列發(fā)戰(zhàn)爭(zhēng)威脅,中方送出5個(gè)字

混沌錄
2026-04-20 17:10:08
世體:巴薩將在國(guó)家德比穿奧利維亞聯(lián)名球衣,她也將現(xiàn)場(chǎng)觀戰(zhàn)

世體:巴薩將在國(guó)家德比穿奧利維亞聯(lián)名球衣,她也將現(xiàn)場(chǎng)觀戰(zhàn)

懂球帝
2026-04-21 16:45:04
續(xù)約??!他確定留隊(duì)勇士!

續(xù)約?。∷_定留隊(duì)勇士!

柚子說(shuō)球
2026-04-22 09:11:46
相親20多人,30多歲姑娘被一句爹味發(fā)言整破防:我親爹都不說(shuō)這話(huà)

相親20多人,30多歲姑娘被一句爹味發(fā)言整破防:我親爹都不說(shuō)這話(huà)

半島晨報(bào)
2026-04-22 11:09:27
聯(lián)合國(guó)秘書(shū)長(zhǎng)發(fā)言人在記者會(huì)上用中文問(wèn)好 并表示希望聯(lián)合國(guó)的多語(yǔ)種服務(wù)越來(lái)越好

聯(lián)合國(guó)秘書(shū)長(zhǎng)發(fā)言人在記者會(huì)上用中文問(wèn)好 并表示希望聯(lián)合國(guó)的多語(yǔ)種服務(wù)越來(lái)越好

每日經(jīng)濟(jì)新聞
2026-04-21 14:32:56
乾隆賜劉墉跳河自盡,劉墉接旨后卻回家洗了個(gè)澡,事后才知真高明

乾隆賜劉墉跳河自盡,劉墉接旨后卻回家洗了個(gè)澡,事后才知真高明

芳芳?xì)v史燴
2026-04-21 19:06:57
44歲奧運(yùn)冠軍杜麗韻味十足,從滿(mǎn)臉痘變女神,今是射擊協(xié)會(huì)副主席

44歲奧運(yùn)冠軍杜麗韻味十足,從滿(mǎn)臉痘變女神,今是射擊協(xié)會(huì)副主席

以茶帶書(shū)
2026-04-21 17:17:30
距離起飛不到24小時(shí),賴(lài)清德專(zhuān)機(jī)被“閉門(mén)謝客”,吳釗燮破防

距離起飛不到24小時(shí),賴(lài)清德專(zhuān)機(jī)被“閉門(mén)謝客”,吳釗燮破防

子桑說(shuō)
2026-04-22 10:50:22
女生主動(dòng)起來(lái)有多黏人?網(wǎng)友:這些女的太開(kāi)放了

女生主動(dòng)起來(lái)有多黏人?網(wǎng)友:這些女的太開(kāi)放了

帶你感受人間冷暖
2026-01-27 00:20:06
太扎心了!上海男子年薪百萬(wàn)失業(yè)引不滿(mǎn),新婚3個(gè)月女子就想離婚

太扎心了!上海男子年薪百萬(wàn)失業(yè)引不滿(mǎn),新婚3個(gè)月女子就想離婚

火山詩(shī)話(huà)
2026-04-20 06:12:18
騰訊推出“QQ音樂(lè)暢聽(tīng)耳機(jī)”:提供會(huì)員曲庫(kù)10年暢聽(tīng),399元

騰訊推出“QQ音樂(lè)暢聽(tīng)耳機(jī)”:提供會(huì)員曲庫(kù)10年暢聽(tīng),399元

IT之家
2026-04-20 16:02:11
美國(guó)頂尖科學(xué)家密集死亡,真相撲朔迷離

美國(guó)頂尖科學(xué)家密集死亡,真相撲朔迷離

史政先鋒
2026-04-20 22:00:23
文班亞馬腦震蕩傷退!進(jìn)入腦震蕩程序平均缺7-10天

文班亞馬腦震蕩傷退!進(jìn)入腦震蕩程序平均缺7-10天

體壇周報(bào)
2026-04-22 09:34:11
112名“中國(guó)留學(xué)生”,被調(diào)查

112名“中國(guó)留學(xué)生”,被調(diào)查

中國(guó)新聞周刊
2026-04-22 07:35:10
北京樓市:西直門(mén)臨水豪宅,跌幅26%

北京樓市:西直門(mén)臨水豪宅,跌幅26%

跟著拆哥看房
2026-04-21 20:11:31
勸退!“去客廳化”火了5年,為什么70%家庭最后都偷偷把沙發(fā)搬了回來(lái)?

勸退!“去客廳化”火了5年,為什么70%家庭最后都偷偷把沙發(fā)搬了回來(lái)?

繪本家居
2026-04-10 11:13:39
索尼PS5最新第一方獨(dú)占大作預(yù)載開(kāi)始!高達(dá)83GB

索尼PS5最新第一方獨(dú)占大作預(yù)載開(kāi)始!高達(dá)83GB

游民星空
2026-04-22 10:22:45
全程瞪眼原形畢露,演技被丁勇岱吊打,這位演員不紅是有原因的

全程瞪眼原形畢露,演技被丁勇岱吊打,這位演員不紅是有原因的

冷紫葉
2026-04-20 19:25:48
軍費(fèi)90億卻砸120億?美印看懵,巴鐵清空中國(guó)武器,背后金主攤牌

軍費(fèi)90億卻砸120億?美印看懵,巴鐵清空中國(guó)武器,背后金主攤牌

小蘭聊歷史
2026-04-18 15:27:37
原來(lái)他11年前就已離世!患病3年女兒不愿照看,死后為爭(zhēng)遺產(chǎn)現(xiàn)身

原來(lái)他11年前就已離世!患病3年女兒不愿照看,死后為爭(zhēng)遺產(chǎn)現(xiàn)身

以茶帶書(shū)
2026-03-25 19:34:47
2026-04-22 11:47:00
芯東西 incentive-icons
芯東西
專(zhuān)注AI芯片、半導(dǎo)體產(chǎn)業(yè)媒體
2290文章數(shù) 8153關(guān)注度
往期回顧 全部

財(cái)經(jīng)要聞

伊朗拒絕出席 特朗普宣布延長(zhǎng)?;鹌谙?/h3>

頭條要聞

柬埔寨國(guó)王在京手術(shù) 洪森攜子看望:感謝中方

頭條要聞

柬埔寨國(guó)王在京手術(shù) 洪森攜子看望:感謝中方

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂(lè)要聞

復(fù)婚無(wú)望!baby黃曉明陪小海綿零交流

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

汽車(chē)要聞

四款全球首秀+AI落地 大眾汽車(chē)集團(tuán)在華轉(zhuǎn)型全面提速

態(tài)度原創(chuàng)

教育
時(shí)尚
親子
家居
公開(kāi)課

教育要聞

博主分享數(shù)學(xué)速算技巧,三位數(shù)的平方輕松算出來(lái),網(wǎng)友:干嘛不用計(jì)算器

頂流復(fù)工,已判若兩人

親子要聞

影響心理健康的兩種快樂(lè)因素:一旦失衡,孩子將會(huì)厭學(xué)抑郁

家居要聞

極簡(jiǎn)繪夢(mèng) 克制和諧

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版