国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

今年,GPU「最大」融資誕生!

0
分享至



All-in 推理!

4 月 20 日,國內全棧自研 AI 推理 GPU 企業(yè)曦望宣布完成新一輪超 10 億元人民幣融資。這是 2026 年 AI 產業(yè)全面邁入“推理落地、智能體普及”時代后,國內 GPU 賽道誕生的最大單筆融資之一。

至此,分拆獨立僅一年多的曦望已累計完成七輪融資,總融資額約 40 億元,成為國內首家估值超百億的純推理 GPU 獨角獸。

本輪融資資金將主要用于新一代啟望 S3 推理 GPU 的規(guī)?;慨a交付、全棧軟件生態(tài)建設,以及 S4/S5 后續(xù)芯片的研發(fā)迭代。


01

智能體元年,

推理算力成最大產業(yè)瓶頸

2026 年被行業(yè)公認為“AI 智能體元年”。隨著大模型從“會聊天”進化為“會思考、會執(zhí)行”的數字員工,推理需求迎來爆發(fā)式增長。英偉達 GTC 2026 大會正式宣告 AI 產業(yè)全面邁入“推理落地、智能體普及”的新時代,將“每瓦 Token 吞吐量”定義為 AI 時代的核心競爭力。這與曦望自創(chuàng)立之初就鎖定的核心戰(zhàn)場高度契合。

“AI 算力基建的重心已徹底切換?!?/strong>曦望董事長徐冰表示,“2026 年 AI 推理計算需求將達到訓練需求的 4-5 倍,推理算力租賃價格半年漲幅近 40%?!?/p>

不同于行業(yè)主流的“訓推一體”路線,曦望從成立第一天起就堅定 All-in 推理賽道,以用戶真實的 Token 成本、單位能耗和服務穩(wěn)定性為芯片設計核心。目前公司已推進三代推理 GPU 迭代、數萬顆 GPU 量產落地,實現(xiàn)了從芯片研發(fā)、產品量產到解決方案交付的完整閉環(huán),并保持“芯片均實現(xiàn)一次性流片成功、流片后性能符合設計預期”的行業(yè)一流標準。

02

啟望 S3:

為 Agentic AI 重構的推理原生架構

2026 年 1 月,曦望正式發(fā)布新一代旗艦產品啟望 S3 推理 GPU。這是國內首款搭載 LPDDR6 且兼容 LPDDR5X 內存的推理 GPU,它沒有盲目照搬高端訓練 GPU 的 HBM 顯存路線,而是基于 Agent 推理的本質需求,從 AI Core 計算架構到內存 IO 系統(tǒng)進行了全鏈路重構。

以 OpenClaw 為代表的智能體推理,“感知-規(guī)劃-執(zhí)行-反饋”高頻循環(huán),帶來了對 KV-cache 密集訪問的全新計算負載。而通用 GPU 面向訓練優(yōu)化,推理實際算力利用率往往遠低于峰值——推理側的效率瓶頸已不再是“算力不夠”,而是“算力用不滿”。

這正是啟望 S3 所押注的結構性機會:放棄訓練能力,專為大模型推理做原生深度定制。通過裁剪訓練態(tài)所需的模塊,將節(jié)省出的晶體管與功耗預算集中投向推理,讓單位面積有效算力效率提升 5 倍以上。

03

計算層:

專為推理而生的 AI Core 架構升級

啟望 S3 通過計算層的深度定制,解決了通用 GPU“算力用不滿”的核心痛點,推理性能較上一代 S2提升 5 倍,目標實現(xiàn) Token成本下降 90%

1

逼近物理極限的算子利用率

大語言模型推理中,GEMM 與 Attention 算子占總計算量的 90%以上,但受限于通用架構的設計約束,這兩項核心算子的實際利用率通常遠低于理論峰值。啟望 S3 將這 GEMM 和 Flash Attention 兩項核心算子的利用率分別推至約 99%與 98%,標稱算力幾乎都轉化為有效吞吐,同樣硬件投入可服務更多并發(fā)請求。

2

Agent 原生的指令集與微架構

采用128-bit 指令集+支持 3D 指令,指令密度領先傳統(tǒng) SIMT 架構;獨立線程調度精準匹配智能體復雜控制流,消除條件跳轉帶來的流水線代價;通過Block cluster 和 Broadcast等技術實現(xiàn)片上數據復用,減少對外帶寬依賴,大幅提升 Agent 多輪推理效率。

3

FP4 全鏈路低精度,吞吐 3-4 倍躍升

原生支持FP16 至 FP4 全鏈路低精度運算,在 DeepSeek V3/R1 等主流模型上實現(xiàn)接近無損的 FP4 推理,吞吐量較 FP16 提升3-4 倍,直接轉化為客戶側的毛利空間和價格彈性。


04

系統(tǒng)層:

三大接口技術破解智能體核心瓶頸

啟望 S3 創(chuàng)新性地集成了三大先進高速接口技術,從內存和 IO 兩個推理時代最核心的瓶頸入手,解決了智能體三大核心瓶頸。

1

LPDDR6 內存接口技術,

解決智能體的"顯存生死線"問題

大模型推理的一個核心特征是,在高并發(fā)、長上下文的主流云端推理場景中,KV Cache 的顯存占比可超過 80%,且隨并發(fā)用戶數線性增長。啟望 S3 采用的LPDDR6方案,在提供足夠推理帶寬的同時,將顯存容量上限大幅提高,且功耗降低 50%,匹配推理場景“大容量、高性價比、低功耗”的核心需求。同時,LPDDR6 與 LPDDR5x 兼容的設計,讓 啟望 S3 可以推出不同顯存規(guī)格的產品版本,覆蓋從邊緣到云端的各類推理場景,無需重新設計芯片。

2

高速 SerDes+SUE 融合互聯(lián)技術,

解決智能體的“多模型協(xié)同瓶頸”

曦望踐行“軟件定義互聯(lián)”的設計思路,對推理場景下的互聯(lián)架構進行了深度優(yōu)化。從超節(jié)點協(xié)議、片上互聯(lián)、片間互聯(lián)、交換設備、高速通信軟件棧協(xié)同設計,實現(xiàn)TCO 與性能兼顧的推理互聯(lián)系統(tǒng)。

Agent 時代的到來,對推理集群的互聯(lián)性能提出了前所未有的要求——一個 Agent 請求會觸發(fā)數十次推理調用,涉及多模型協(xié)同與海量 KV Cache 流轉,如果互聯(lián)帶寬不足、協(xié)議割裂、延遲太高,整個系統(tǒng)的性能會出現(xiàn)超線性下降,集群規(guī)模越大,性能損失越嚴重。

啟望 S3 創(chuàng)新性地在片上原生融合了 Scale-Up 超節(jié)點與 Scale-Out 的雙?;ヂ?lián)底座。在超節(jié)點通信域,啟望 S3 搭載基于以太網的超節(jié)點互聯(lián)引擎,支持 load/store 內存語義與 UVA 統(tǒng)一編址,任意兩卡間一跳直達,為 AllReduce/AlltoAll 等集合通信提供硬件級加速;啟望 S3 選擇基于以太網的超節(jié)點方案,具備雙重優(yōu)勢:既可利舊復用標準以太網交換機,節(jié)省組網成本,又可無縫接入支持超低延遲能力的增強型交換機,將端到端延遲壓縮至百納秒級,性能逼近專有互聯(lián)協(xié)議?;诔?jié)點和 DeepEP 實現(xiàn)的 MoE 超大模型推理系統(tǒng),可以很大程度掩蓋 LPDDR 相較于 HBM 的帶寬劣勢。另外,啟望 S3 在片上集成了 RDMA 通信引擎,專為 PD 分離架構下的超長上下文 KV Cache 傳輸進行優(yōu)化,實現(xiàn)跨節(jié)點 KV Cache 的零拷貝、高吞吐傳輸,突破分離式架構的內存墻瓶頸。在組網上 啟望 S3 支持 32/64/128/256 彈性擴展能力,為不同算力密度的推理場景提供靈活選擇。

3

PCIe Gen6 接口技術,

解決智能體的"資源碎片化"問題

云原生推理時代,超長上下文已成為大模型標配能力,千億參數模型在處理數萬 Token 序列時,單請求 KV Cache 占用可達數百 GB 甚至 TB 級,傳統(tǒng) PCIe 帶寬瓶頸成為制約 KV Cache 高效管理的沉重枷鎖。

啟望 S3 搭載的PCIe Gen6 接口,帶寬較 Gen5 翻倍,可同時滿載多路高速網卡與 NVMe 存儲集群,滿足云原生推理的高并發(fā)數據吞吐需求;通過 PCIe Gen6 的高帶寬讓CPU DRAM 真正成為 啟望 S3 顯存的擴展池??蓸嫿ㄆ?strong>“顯存-DRAM-NVMe”三層異構 KV Cache 架構:

  1. 熱數據駐留顯存保證低延遲的訪問;

  2. 溫數據通過 PCIe Gen6 擴展至 CPU DRAM 實現(xiàn)容量倍增;

  3. 冷數據則下沉至 NVMe SSD 持久化存儲,解決智能體的資源碎片化問題。

05

“推理原生”帶來普惠算力基礎設施

從產業(yè)周期看,訓練側格局已相對固化,而推理側正隨 Agentic AI 放量進入指數級增長通道——多家機構預測,未來五年推理算力市場規(guī)模將超越訓練側數倍,其中 Agent 類負載將貢獻最主要的增量。

啟望 S3 同時具備三個難以共存的要素:

  1. 推理原生的架構前瞻性;

  2. 實現(xiàn) 98-99% 算子利用率的頂尖工程能力;

  3. 完整的生態(tài)適配能力。

“啟望 S3 不是簡單的性能升級,而是一次對 AI 推理成本曲線的重構?!?/strong>徐冰表示,“我們的目標是將推理成本降至‘百萬 Token 一分錢’,讓 AI 像水電一樣成為普惠基礎設施。

06

資本助力推理賽道進入加速期

本輪融資由多家產業(yè)方戰(zhàn)投、地方國資及頭部財務機構共同參與。

杭州資本表示:“本次投資是杭州資本緊扣杭州‘296X’先進制造業(yè)集群建設戰(zhàn)略、深耕人工智能萬億級產業(yè)賽道的重要布局。曦望‘All-in 推理’的戰(zhàn)略選擇具備行業(yè)前瞻性,其在技術創(chuàng)新和產品商業(yè)化方面的能力,是我們決定投資的重要原因。作為長期資本,我們更看重企業(yè)在關鍵技術方向上的持續(xù)投入與落地能力

普華資本表示:“曦望是國內少數真正理解推理場景、并能提供全棧自主可控解決方案的企業(yè)。我們看好公司‘不做訓推一體跟隨者,只做推理賽道領跑者’的戰(zhàn)略選擇?!?/p>

07

聚集頂尖人才,

打造中國 AI 工業(yè)化算力底座

曦望團隊規(guī)模已增長至400人,研發(fā)人員占比80%,匯聚了來自英偉達、AMD、華為海思等國內外頂尖芯片企業(yè)的核心人才,碩士及以上學歷占比80%。團隊融合了芯片設計、高性能計算、AI 算法、軟硬產品的跨行業(yè)人才。

2026 年,曦望將圍繞“落地、兌現(xiàn)、增長”核心原則,全力推進啟望 S3 芯片量產交付,完成與國內外主流大模型、多模態(tài)模型和Agent框架的全面適配。同時,公司已完成啟望 S4 高性能推理 GPU 和啟望 S5 安全可控推理 GPU 的技術路線規(guī)劃,持續(xù)加碼近存計算、光電共封等前沿技術探索。

未來,曦望將繼續(xù)堅守“讓 AI 推理便宜、穩(wěn)定、隨處可用”的核心目標,為中國 AI 發(fā)展鑄造堅實的算力底座。

關于曦望

曦望(Sunrise)是國產全棧自研人工智能算力芯片企業(yè),前身是商湯大芯片部門,2024 年底分拆獨立運營,專注于高性能 GPU 及多模態(tài)場景推理芯片的研發(fā)與商業(yè)化。曦望憑借八年技術沉淀、二十億研發(fā)投入及兩代量產芯片的工程化驗證,已成為國產 GPU 替代的核心力量。公司致力于為千行百業(yè)提供成本降低十倍、能效比突破的智能算力基石,通過技術創(chuàng)新和深度產業(yè)協(xié)同,推動各行業(yè)的智能化發(fā)展,并助力實現(xiàn)通用人工智能(AGI)的普惠化目標。

—— 芯榜 ——

芯榜成立于 2015 年,是半導體垂直領域的產業(yè)媒體與數字化服務平臺。全網覆蓋超 100 萬垂直行業(yè)用戶,核心提供專業(yè)榜單發(fā)布、原創(chuàng)訪談、產業(yè)報告、峰會活動及研究咨詢等服務。已合作近千家半導體生態(tài)企業(yè),聯(lián)動多家基金公司與產業(yè)媒體,助力硬科技產業(yè)發(fā)展。


特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
選擇真的大于努力!0冠凱恩去拜仁奪3冠 17冠小蜘蛛去馬競0冠

選擇真的大于努力!0冠凱恩去拜仁奪3冠 17冠小蜘蛛去馬競0冠

智道足球
2026-04-21 18:12:38
突發(fā)!協(xié)議即將達成,28國聯(lián)手對付中國,名單公布,沒一個是善茬

突發(fā)!協(xié)議即將達成,28國聯(lián)手對付中國,名單公布,沒一個是善茬

游古史
2026-04-22 13:02:50
李夢楊力維馳援?世界杯分組,中國女籃下下簽,和美國意大利同組

李夢楊力維馳援?世界杯分組,中國女籃下下簽,和美國意大利同組

東球貓貓
2026-04-22 08:59:04
中國第二條跨省地鐵,來了

中國第二條跨省地鐵,來了

國民經略
2026-04-22 11:40:31
臺日混血士兵遭連長罵“死日本鬼子” 顧立雄回應了。

臺日混血士兵遭連長罵“死日本鬼子” 顧立雄回應了。

荊楚寰宇文樞
2026-04-21 22:47:47
伊朗代表:美國解除對伊海上封鎖或可成為談判基礎

伊朗代表:美國解除對伊海上封鎖或可成為談判基礎

新京報
2026-04-22 07:35:07
美15艘軍艦封鎖霍爾木茲?中國沉默6天后,一招讓特朗普徹底破防

美15艘軍艦封鎖霍爾木茲?中國沉默6天后,一招讓特朗普徹底破防

歸史
2026-04-18 11:45:15
索尼PS5最新第一方獨占大作預載開始!高達83GB

索尼PS5最新第一方獨占大作預載開始!高達83GB

游民星空
2026-04-22 10:22:45
王亞平上天回來后,36歲為丈夫生下一個女兒,享四項優(yōu)待

王亞平上天回來后,36歲為丈夫生下一個女兒,享四項優(yōu)待

究竟誰主沉浮
2026-03-15 11:03:51
痛心!57歲法國知名女星泳池溺水身亡,曾搭檔李連杰出演《游俠》

痛心!57歲法國知名女星泳池溺水身亡,曾搭檔李連杰出演《游俠》

阿訊說天下
2026-04-20 10:46:31
黑粉攻擊何潤東風波升級!博主怒撕:蹭熱度該適可而止,又老又丑

黑粉攻擊何潤東風波升級!博主怒撕:蹭熱度該適可而止,又老又丑

小徐講八卦
2026-04-19 15:19:03
交完錢就“跑路”?海南一幼兒園突然閉園,上百家庭學費打水漂,老師工資泡湯!

交完錢就“跑路”?海南一幼兒園突然閉園,上百家庭學費打水漂,老師工資泡湯!

蓬勃新聞
2026-04-20 21:48:04
身材豐滿女生,這樣打扮既顯瘦顯腿長,又有女人味

身材豐滿女生,這樣打扮既顯瘦顯腿長,又有女人味

美女穿搭分享
2026-04-20 13:54:46
尹子維的母親曾是邵氏的頂級花旦,驚為天人的美貌,美得讓人窒息

尹子維的母親曾是邵氏的頂級花旦,驚為天人的美貌,美得讓人窒息

上官晚安
2026-04-21 08:56:51
最新:我海軍剛通過橫當水道,日本2架軍機從兩個方向飛了過來

最新:我海軍剛通過橫當水道,日本2架軍機從兩個方向飛了過來

消失的電波
2026-04-21 17:21:58
四川突放大招!27家銀行同一天解散,儲戶存款怎么辦?

四川突放大招!27家銀行同一天解散,儲戶存款怎么辦?

說故事的阿襲
2026-04-21 16:56:44
特朗普的中東騙局被戳穿,炸伊朗、逼談判是演戲,真正目標藏不住

特朗普的中東騙局被戳穿,炸伊朗、逼談判是演戲,真正目標藏不住

西樓知趣雜談
2026-04-22 11:42:50
粉底液將軍,正在毀掉一個行業(yè)

粉底液將軍,正在毀掉一個行業(yè)

難得君
2026-04-20 16:26:29
中國汽車市場份額:法系0.2%,韓系1%,美系6.9%,日系13%

中國汽車市場份額:法系0.2%,韓系1%,美系6.9%,日系13%

狐貍先森講升學規(guī)劃
2026-04-21 09:30:03
實在搞不懂,這么漂亮的女神,為啥也離婚了

實在搞不懂,這么漂亮的女神,為啥也離婚了

動物奇奇怪怪
2026-04-21 17:03:30
2026-04-22 14:36:49
芯榜 incentive-icons
芯榜
中國芯片排行榜
4505文章數 3248關注度
往期回顧 全部

財經要聞

伊朗拒絕出席 特朗普宣布延長停火期限

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

頭條要聞

KTV服務員被指強奸14歲女生 官方通報

體育要聞

一到NBA季后賽,四屆DPOY就成了主角

娛樂要聞

復婚無望!baby黃曉明陪小海綿零交流

科技要聞

凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

汽車要聞

純電續(xù)航301km+激光雷達 宋Pro DM-i飛馳版9.99萬起

態(tài)度原創(chuàng)

房產
時尚
教育
數碼
游戲

房產要聞

狂搶284輪!中海??谠倌弥匕跽?!

頂流復工,已判若兩人

教育要聞

2026 成都新初高中大爆發(fā)!七中 、 樹德、 西川、北二外領銜,9 月集體亮相!

數碼要聞

官宣!追覓硅谷發(fā)布會定檔,4月27日-30日登陸北美

黑旗RE更多實機截圖曝光!愛德華老婆新形象 UI大改

無障礙瀏覽 進入關懷版