国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

曦望發(fā)布推理GPU S3:All-in推理的國產(chǎn)GPU,開始算單位Token成本

0
分享至

在大模型產(chǎn)業(yè)從“能不能跑”走向“算不算得過賬”的階段,GPU 的競爭邏輯正在被重新定義。

1 月 27 日,國產(chǎn) GPU 廠商曦望(Sunrise)在杭州舉辦首屆 Sunrise GPU Summit,發(fā)布新一代推理 GPU 芯片啟望 S3,并同步推出面向大模型推理的超節(jié)點方案及推理云計劃。這是曦望在近一年累計完成約 30 億元戰(zhàn)略融資后的首次系統(tǒng)性技術(shù)亮相。

與當(dāng)前行業(yè)普遍沿用的“訓(xùn)推一體 GPU”路線不同,曦望在 S3 上繼續(xù)選擇了一條相對“反常識”的路線——不追求峰值訓(xùn)練性能,而是 All-in 推理效率與單位成本。



從“拼峰值”到“算單位成本”,推理正在重塑 GPU 設(shè)計目標(biāo)

過去數(shù)年,GPU 的核心競爭指標(biāo)始終圍繞峰值算力、通用性和訓(xùn)練效率展開。但隨著大模型進(jìn)入規(guī);瘧(yīng)用階段,算力消耗的重心正在從訓(xùn)練轉(zhuǎn)向推理。

曦望聯(lián)席 CEO 王勇在發(fā)布會上指出,訓(xùn)練更像一次性、高資本消耗的技術(shù)登高,而推理則是長期、持續(xù)的算力交付過程!爱(dāng)推理成為主要算力消耗場景后,GPU 的商業(yè)價值不再取決于參數(shù)指標(biāo),而是單位 Token 的真實成本!边@一判斷,直接決定了啟望 S3 的設(shè)計方向。

據(jù)介紹,啟望 S3 是一款面向大模型推理深度定制的 GPGPU 芯片,其設(shè)計圍繞真實推理負(fù)載,對算力結(jié)構(gòu)、存儲體系和互聯(lián)方式進(jìn)行了系統(tǒng)級重構(gòu)。

在算力層面,S3 支持從 FP16 到 FP4 的多精度靈活切換,使模型在保證效果的前提下,最大化釋放低精度推理效率。這種設(shè)計更貼合當(dāng)前 MoE 和長上下文模型在推理階段的實際需求。

在存儲層面,S3 采用 LPDDR6 顯存方案,成為國內(nèi)首款采用該方案的芯片。相比 HBM 路線,LPDDR6 更強調(diào)容量與能效比。官方數(shù)據(jù)顯示,S3 的顯存容量較上一代產(chǎn)品提升 4 倍,有效緩解了大模型推理中普遍存在的顯存駐留與訪存瓶頸。

在 DeepSeek V3 / R1 滿血版等主流大模型推理場景中,S3 單位 Token 推理成本較上一代產(chǎn)品下降約 90%。曦望方面稱,這一指標(biāo)已具備工程可復(fù)現(xiàn)性,而非單點實驗室數(shù)據(jù)。

圍繞 S3,曦望同步發(fā)布了面向大模型推理的寰望 SC3 超節(jié)點解決方案。

寰望 SC3 從一開始即面向千億、萬億級參數(shù)多模態(tài) MoE 推理的真實部署需求進(jìn)行設(shè)計。該方案支持單域 256 卡一級互聯(lián),可高效支撐 PD 分離架構(gòu) 與 大 EP(Expert Parallelism)規(guī);渴,顯著提升推理階段的系統(tǒng)利用率與穩(wěn)定性,適配長上下文、多并發(fā)、多專家并行等復(fù)雜推理場景。

在交付形態(tài)上,寰望 SC3 采用 全液冷設(shè)計,具備極致 PUE 表現(xiàn),并支持模塊化交付與快速部署。曦望方面表示,在同等推理能力量級下,該方案可將整體系統(tǒng)交付成本從行業(yè)常見的億元級,降低至千萬元級,實現(xiàn)一個數(shù)量級的下降。

這一“算得過賬”的系統(tǒng)級能力,被視為萬億參數(shù)模型規(guī);瘧(yīng)用的重要前提。

在軟件層面,曦望構(gòu)建了與 CUDA 兼容的基礎(chǔ)軟件體系,覆蓋驅(qū)動、運行時 API、開發(fā)工具鏈、算子庫和通信庫,降低推理應(yīng)用的遷移門檻。目前,該體系已適配 ModelScope 平臺 90% 以上主流大模型形態(tài),包括 DeepSeek、通義千問等。

在曦望看來,推理 GPU 的競爭并不止于芯片本身,而在于能否將硬件能力穩(wěn)定轉(zhuǎn)化為可交付、可計價的推理算力。



GPU 廠商開始下場,推理云平臺成為“最后一公里”

如果說 S3 回答的是“推理算力如何更便宜”,那么曦望與商湯科技、第四范式等生態(tài)伙伴探索的推理云平臺,則試圖解決“推理算力如何更好用”。

通過 GPU 池化與彈性調(diào)度,曦望將底層算力整合為統(tǒng)一的推理算力池,并以 MaaS(Model as a Service)作為核心入口,使企業(yè)無需關(guān)注底層硬件配置與集群運維,即可按需調(diào)用大模型推理能力。這一體系也成為“百萬 Token 一分錢”推理成本合作的重要技術(shù)基礎(chǔ)。

曦望董事長徐冰在會上表示,推理時代的核心不是“把芯片賣出去”,而是能否持續(xù)、穩(wěn)定地把算力轉(zhuǎn)化為可交付的生產(chǎn)力!罢l能持續(xù)降低推理成本,誰就掌握了 AI 產(chǎn)業(yè)的成本曲線!

據(jù)披露,曦望 2025 年推理 GPU 芯片交付量已突破 1 萬片,標(biāo)志著其推理 GPU 路線完成從工程驗證到規(guī);桓兜年P(guān)鍵跨越。

中國工程院院士、浙江大學(xué)信息學(xué)部主任吳漢明指出,推理算力價值的實現(xiàn)離不開協(xié)同,需要芯片設(shè)計、系統(tǒng)集成、軟件開發(fā)到產(chǎn)業(yè)應(yīng)用的全鏈條協(xié)作。

在國產(chǎn) GPU 行業(yè)從“拼參數(shù)”走向“拼單位經(jīng)濟成本”的拐點上,曦望選擇以推理為切口,嘗試重構(gòu) GPU 的產(chǎn)品形態(tài)與算力交付方式。這條 All-in 推理的路徑,正在成為觀察中國推理算力商業(yè)化進(jìn)程的重要樣本。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
師徒對決暗藏殺機!阿韋洛亞率皇馬迎戰(zhàn)穆里尼奧,關(guān)鍵戰(zhàn)不容有失

師徒對決暗藏殺機!阿韋洛亞率皇馬迎戰(zhàn)穆里尼奧,關(guān)鍵戰(zhàn)不容有失

星耀國際足壇
2026-01-27 23:54:27
1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

古書記史
2025-12-11 17:37:45
醫(yī)生發(fā)現(xiàn):天冷堅持戴口罩的人,用不了多久,身體或會有5大變化

醫(yī)生發(fā)現(xiàn):天冷堅持戴口罩的人,用不了多久,身體或會有5大變化

霹靂炮
2025-12-04 22:54:47
58歲那英改走顏值路線?過度醫(yī)美變化大到認(rèn)不出,這是要鬧哪出?

58歲那英改走顏值路線?過度醫(yī)美變化大到認(rèn)不出,這是要鬧哪出?

鋒哥與八卦哥
2026-01-25 13:26:51
0:3!天津女排慘敗,狂輸29分,替補陣容太差,上海外援高效

0:3!天津女排慘敗,狂輸29分,替補陣容太差,上海外援高效

跑者排球視角
2026-01-27 23:02:22
快訊!美國爆發(fā)大規(guī)模混亂,奧巴馬痛罵白宮,特朗普被迫“認(rèn)慫”

快訊!美國爆發(fā)大規(guī);靵y,奧巴馬痛罵白宮,特朗普被迫“認(rèn)慫”

現(xiàn)代小青青慕慕
2026-01-27 09:56:37
快報!伊朗的“幫手”開始回歸!

快報!伊朗的“幫手”開始回歸!

達(dá)文西看世界
2026-01-27 15:52:40
成龍女兒吳卓林結(jié)婚現(xiàn)場曝光,緊握愛人的手,洋溢著甜蜜笑容!

成龍女兒吳卓林結(jié)婚現(xiàn)場曝光,緊握愛人的手,洋溢著甜蜜笑容!

娛樂團(tuán)長
2026-01-13 15:39:28
大媽花50萬買基金,賬號忘了15年,孫子找回看到余額,全家愣住了

大媽花50萬買基金,賬號忘了15年,孫子找回看到余額,全家愣住了

黃家湖的憂傷
2025-08-12 17:05:12
U23亞洲杯結(jié)束第3天 下一屆分檔曝光:中國隊升第三檔 也有壞消息

U23亞洲杯結(jié)束第3天 下一屆分檔曝光:中國隊升第三檔 也有壞消息

侃球熊弟
2026-01-28 00:15:03
塌,都塌,塌點好啊

塌,都塌,塌點好啊

求實處
2026-01-26 19:10:03
支持率暴跌后,高市這下慌了,日本商界發(fā)聲:絕不能離開中國

支持率暴跌后,高市這下慌了,日本商界發(fā)聲:絕不能離開中國

阿銍武器裝備科普
2026-01-26 21:19:28
是什么逼的國企干部上門打人

是什么逼的國企干部上門打人

阿亮評論
2026-01-27 12:11:01
炸鍋了!《紐約時報》急了,中國高校霸榜,西方名校徹底坐不住了

炸鍋了!《紐約時報》急了,中國高校霸榜,西方名校徹底坐不住了

解說阿洎
2026-01-27 16:05:21
利好來了!昨晚,這些公司公告業(yè)績大增

利好來了!昨晚,這些公司公告業(yè)績大增

數(shù)據(jù)寶
2026-01-27 08:08:44
陸游81歲寫下一首梅花詩,短短二十八個字,寫盡人間最美相思!

陸游81歲寫下一首梅花詩,短短二十八個字,寫盡人間最美相思!

銘記歷史呀
2026-01-26 19:50:33
唐朝大將薛仁貴坑殺13萬鐵勒人,強迫鐵勒公主為妾,卻活到了70歲

唐朝大將薛仁貴坑殺13萬鐵勒人,強迫鐵勒公主為妾,卻活到了70歲

銘記歷史呀
2026-01-27 15:01:12
哇塞!神級交易!湖人老鐵太夠意思啦!

哇塞!神級交易!湖人老鐵太夠意思啦!

體育新角度
2026-01-27 17:02:29
臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

顧史
2026-01-21 21:04:39
票房高的嚇人的十大爛片,每部都是業(yè)界奇恥大辱

票房高的嚇人的十大爛片,每部都是業(yè)界奇恥大辱

小Q侃電影
2026-01-27 20:21:44
2026-01-28 00:51:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
12071文章數(shù) 176366關(guān)注度
往期回顧 全部

科技要聞

馬化騰3年年會講話透露了哪些關(guān)鍵信息

頭條要聞

因樓下鄰居關(guān)閉水閥女子家中斷水400天 起訴索賠被駁

頭條要聞

因樓下鄰居關(guān)閉水閥女子家中斷水400天 起訴索賠被駁

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對手現(xiàn)學(xué)?

娛樂要聞

張雨綺風(fēng)波持續(xù)發(fā)酵,曝多個商務(wù)被取消

財經(jīng)要聞

多地對壟斷行業(yè)"近親繁殖"出手了

汽車要聞

標(biāo)配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗車下線

態(tài)度原創(chuàng)

時尚
游戲
親子
本地
公開課

這些韓系穿搭最適合普通人!多穿深色、衣服基礎(chǔ),簡潔耐看

被女隊友踢出戰(zhàn)隊,只因為男隊員太想贏了?

親子要聞

雙職工家庭,孩子上幼兒園后,無老人幫忙,夫妻倆能獨立帶娃嗎?

本地新聞

云游中國|撥開云霧,巫山每幀都是航拍大片

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版