国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

36氪首發(fā) | “華為天才少年”創(chuàng)業(yè)連融超4億元,做新一代推理芯片重構(gòu)顯存成本

0
分享至

作者 | 喬鈺杰

編輯 | 袁斯來

硬氪獲悉,國內(nèi)全自研GPGPU創(chuàng)新企業(yè)「北京行云集成電路有限公司」(以下簡稱“行云”)宣布連續(xù)完成Pre-A及Pre-A+多輪融資,融資金額超4億元人民幣。五源資本、賽富投資基金、春華資本聯(lián)合領(lǐng)投,以及北京、江蘇等地方國資、佰維存儲(688525)、金沙江聯(lián)合帶動知名GPU企業(yè)創(chuàng)始人家辦、創(chuàng)維資本等產(chǎn)業(yè)資本跟投。云岫資本連續(xù)多輪服務(wù)并擔(dān)任下一輪獨家融資財務(wù)顧問。

北京行云集成電路有限公司成立于2023年8月,專注針對大模型的新一代推理芯片,致力于使用非3D DRAM架構(gòu)打造超大顯存規(guī)格、CUDA兼容的全自研GPGPU產(chǎn)品,推動AI大模型推理的普惠化。

行云創(chuàng)始人季宇博士,清華大學(xué)計算機系博士,“華為天才少年”計劃的一員,曾在華為海思深度參與昇騰AI芯片的編譯器與架構(gòu)研發(fā)。CTO余洪敏博士,中科院半導(dǎo)體所博士,曾主導(dǎo)百度昆侖芯、海思昇騰等多款芯片的研發(fā)與量產(chǎn),擁有十余款芯片成功流片經(jīng)驗。

當(dāng)前,在大模型架構(gòu)持續(xù)演進的背景下,算力系統(tǒng)的瓶頸正在發(fā)生結(jié)構(gòu)性變化。

季宇在接受硬氪采訪時表示,當(dāng)前算法側(cè)的演進正在重塑硬件設(shè)計邏輯。以MoE(Mixture of Experts)為代表的稀疏模型,在計算效率上更具優(yōu)勢,但需要預(yù)先加載更多專家參數(shù),使得整體對內(nèi)存容量的需求顯著高于傳統(tǒng)Transformer稠密模型。

大模型(千億/萬億參數(shù))的顯存需求已從GB級躍升至TB級,這一過程中,系統(tǒng)成本結(jié)構(gòu)也隨之重構(gòu)——按GB計價的顯存成本,正逐步超過算力芯片本身,成為主導(dǎo)項。因此,“降本的關(guān)鍵已經(jīng)不在算力,而在顯存”季宇稱。

基于這一判斷,行云選擇了一條與主流路徑不同的技術(shù)路線:放棄成本高昂的HBM(高帶寬內(nèi)存),轉(zhuǎn)而采用LPDDR乃至NAND(SSD顆粒)等更低成本的存儲介質(zhì)作為顯存介質(zhì)。通過介質(zhì)替換,使顯存成本降低1到2個數(shù)量級。

但低成本介質(zhì)也意味著單顆粒帶寬較低。為彌補這一短板,行云在架構(gòu)上采用多顆粒、多通道并行的設(shè)計,通過規(guī)模化堆疊將整體帶寬提升至TB級別,以滿足大模型推理對數(shù)據(jù)吞吐的需求。

季宇表示,隨著稀疏化和MoE架構(gòu)的發(fā)展,模型對帶寬的絕對需求正在下降,系統(tǒng)設(shè)計不再需要一味追求極致帶寬,而是可以通過軟硬件協(xié)同,實現(xiàn)成本與效率之間的平衡。

這種思路也體現(xiàn)在行云的整體技術(shù)策略中。季宇強調(diào),公司真正的稀缺性并不在單一芯片指標(biāo),而在于系統(tǒng)級的設(shè)計能力。通過諸如Prefill/Decode分離(PD分離)、KV Cache稀疏化等工程手段,行云能夠更靈活地適配AI應(yīng)用形態(tài)的快速變化,從早期的Chatbot到當(dāng)前逐步興起的Agent場景,降低因芯片研發(fā)周期較長所帶來的技術(shù)滯后風(fēng)險。

產(chǎn)品驗證層面,行云此前推出的“褐蟻一體機”,已嘗試用CPU與通用內(nèi)存構(gòu)建低成本推理方案,驗證稀疏模型在非高端硬件上的可行性。目前,該方案已在DeepSeek的本地化部署場景中落地。


(圖源/企業(yè))

接下來,公司將把重心轉(zhuǎn)向自研芯片的推進。季宇表示,公司今年的核心目標(biāo)是完成芯片流片,并盡快推向市場,以芯片產(chǎn)品作為商業(yè)化的主要抓手。

當(dāng)下,Open Claw的現(xiàn)象級傳播也揭示了市場對消費級硬件承載高質(zhì)量AI的巨大需求。季宇表示,行云希望通過其芯片產(chǎn)品,將低成本、高質(zhì)量的萬億級模型算力真正落地到如龍蝦機等端側(cè)設(shè)備,突破當(dāng)前端側(cè)僅能運行100B小模型的局限,為消費電子市場打開新的想象空間。

CTO余洪敏表示,行云的設(shè)計優(yōu)先級已從追求單芯片極致性能,轉(zhuǎn)變?yōu)閺陌寮壪到y(tǒng)角度追求可擴展性與供應(yīng)鏈穩(wěn)定性。通過分布式設(shè)計和采用成熟工藝與低成本存儲,在系統(tǒng)層面實現(xiàn)成本最優(yōu)與性能體驗一致,這是公司實現(xiàn)算力普惠的重要基礎(chǔ)。

投資方觀點

峰瑞資本副總裁李罡表示:作為天使輪投資人,行云團隊從23年創(chuàng)業(yè)開始,對AI芯片(特別是大模型環(huán)境下的AI芯片)有著極為前瞻的視角和思路。在近三年的模型和應(yīng)用的快速變化中,我們看到行云針對下一代通用大模型的芯片方案和前瞻的設(shè)計思想,不斷得到驗證,始終領(lǐng)先時代半步。

五源資本表示:行云是AI芯片領(lǐng)域少有的‘第一性原理’思考者,季宇博士24年就前瞻性地洞察到MoE稀疏架構(gòu)下硬件瓶頸從算力向顯存遷移的結(jié)構(gòu)性轉(zhuǎn)變——放棄HBM、以LPDDR乃至NAND重構(gòu)顯存成本,不是漸進優(yōu)化,而是通過系統(tǒng)級的軟硬件協(xié)同設(shè)計能力推動行業(yè)范式創(chuàng)新。2026年以來隨著AI模型coding和agent能力持續(xù)增強,AI推理需求爆發(fā),OpenClaw等Agent的現(xiàn)象級破圈,正在將推理算力需求從云端拉向多端,從程序員推向大眾,高效低成本的推理能力成為行業(yè)剛需。伴隨未來推理需求的指數(shù)級增長,行云的技術(shù)路徑將成為推動算力普惠的重要基礎(chǔ)設(shè)施。

賽富投資基金負責(zé)科技賽道的管理合伙人蔣馳華表示:在AI大模型向萬億參數(shù)演進的過程中,降本的關(guān)鍵已經(jīng)不在算力,而在顯存和系統(tǒng)的架構(gòu),特別是在國產(chǎn)算力受限的前提下。季宇和行云團隊展現(xiàn)出了罕見的系統(tǒng)級工程視野,他們跳出了盲目堆砌HBM的行業(yè)定式,通過LPDDR/NAND等介質(zhì)替換與并行架構(gòu)設(shè)計,將顯存和系統(tǒng)成本打下來一到兩個數(shù)量級,進而實現(xiàn)單Token成本極值,符合行業(yè)演進的方向。我們始終聚焦AI與具身智能領(lǐng)域的底層顛覆者。行云兼具前瞻的架構(gòu)創(chuàng)新與扎實的落地能力,賽富很榮幸能在這一輪重倉支持。我們期待行云的新一代推理芯片徹底重構(gòu)算力成本模型,真正實現(xiàn)大模型推理在云端與端側(cè)的全面普惠。

春華資本表示:在國產(chǎn)算力生態(tài)加速構(gòu)建的大背景下。行云敏銳地將設(shè)計重心錨定在顯存成本重構(gòu)上,以LPDDR與NAND替代HBM、通過多通道并行架構(gòu)彌補單顆粒帶寬不足,本質(zhì)上是在重新定義推理芯片的成本架構(gòu)。季宇博士對AI芯片架構(gòu)的演進方向有著超越行業(yè)慣性的深度思考,他對‘降本關(guān)鍵在顯存而非算力’的判斷,始終領(lǐng)先行業(yè)共識半步,且每一步都在被市場持續(xù)驗證;余洪敏博士作為從海思昇騰到百度昆侖芯一路走來的芯片老兵,對芯片從設(shè)計到量產(chǎn)的每一個環(huán)節(jié)都有實戰(zhàn)積累。這種‘敢想’與‘能做’的結(jié)合,讓行云具備了從架構(gòu)創(chuàng)新到產(chǎn)品交付的完整閉環(huán)能力。我們期待行云的首顆自研芯片順利流片,開啟AI推理算力的新一輪成本革命。

佰維存儲科技股份有限公司副總經(jīng)理王燦:在大模型從通用AI向Agent形態(tài)演進的發(fā)展階段,季宇博士展現(xiàn)了極具前瞻性的系統(tǒng)級洞察。他精準地識別出:大模型推理的結(jié)構(gòu)性瓶頸已不再僅僅是算力本身,而是制約規(guī);涞氐母统杀镜拇鎯。行云的核心邏輯非常清晰——通過介質(zhì)替換與架構(gòu)創(chuàng)新,以低成本的LPDDR乃至NAND介質(zhì)挑戰(zhàn)昂貴的HBM霸權(quán),這不僅是物理介質(zhì)的更迭,更是對大模型推理成本結(jié)構(gòu)的底層重構(gòu)。圍繞這一核心路徑,行云構(gòu)建了極致的軟硬件協(xié)同設(shè)計,通過PD分離、分布式擴展等手段,在系統(tǒng)層面實現(xiàn)了性能與成本的平衡。芯片行業(yè),工程經(jīng)驗決定了從‘實驗室架構(gòu)’到‘商業(yè)化量產(chǎn)’的跨度。行云團隊在昇騰、昆侖芯等頂尖項目上積淀的深厚流片與量產(chǎn)經(jīng)驗,是其確定性的來源。在AI Agent爆發(fā)的當(dāng)下,我堅信行云能夠真正擊穿算力成本,讓高質(zhì)量的萬億級模型實現(xiàn)真正的算力普惠。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
徐帆回應(yīng)離婚5個月,馮小剛近況曝光,他的“小心思”再藏不住了

徐帆回應(yīng)離婚5個月,馮小剛近況曝光,他的“小心思”再藏不住了

天天熱點見聞
2026-04-19 08:13:15
重要信號顯現(xiàn)!外資轉(zhuǎn)向,加倉這些A股

重要信號顯現(xiàn)!外資轉(zhuǎn)向,加倉這些A股

新浪財經(jīng)
2026-04-19 20:07:13
伊朗確認將參加2026年美加墨世界杯

伊朗確認將參加2026年美加墨世界杯

界面新聞
2026-04-19 22:44:47
天王山曼城2-1險勝阿森納!哈蘭德進球,英超爭冠進入曼城時間!

天王山曼城2-1險勝阿森納!哈蘭德進球,英超爭冠進入曼城時間!

海浪星體育
2026-04-20 01:28:17
汪小菲松口,馬筱梅野心實現(xiàn),名字取好太敷衍,張?zhí)m不忍了

汪小菲松口,馬筱梅野心實現(xiàn),名字取好太敷衍,張?zhí)m不忍了

觀察鑒娛
2026-04-05 21:16:37
不敢相信她有五十多歲了

不敢相信她有五十多歲了

科學(xué)發(fā)掘
2026-04-19 21:09:22
紅果 “拔管” 引爆短劇圈:90%公司將出局,遲到的行業(yè)大洗牌?

紅果 “拔管” 引爆短劇圈:90%公司將出局,遲到的行業(yè)大洗牌?

老特有話說
2026-03-09 15:16:53
美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

美國洛馬怎么也沒想到,沒繳中國的990億罰單,后果竟如此嚴重了

嘆知
2026-04-19 21:19:26
很多歐美高管訪問中國以后,回國后,為啥都汗毛直立,壓力巨大

很多歐美高管訪問中國以后,回國后,為啥都汗毛直立,壓力巨大

說歷史的老牢
2026-04-19 19:21:36
亞錦賽中國女排選朱婷還是選李盈瑩,趙勇已給出了肯定答案

亞錦賽中國女排選朱婷還是選李盈瑩,趙勇已給出了肯定答案

體育快遞小哥哥
2026-04-19 16:59:40
快訊!伊朗正式通知美國:下一輪談判,不奉陪了!

快訊!伊朗正式通知美國:下一輪談判,不奉陪了!

達文西看世界
2026-04-19 07:15:02
空房交物業(yè)費合理嗎?2026年物業(yè)費新規(guī):這4種情況一分不掏

空房交物業(yè)費合理嗎?2026年物業(yè)費新規(guī):這4種情況一分不掏

老特有話說
2026-04-15 15:11:16
1分29秒,戴維打進尤文意甲主場自2022年8月以來最快進球

1分29秒,戴維打進尤文意甲主場自2022年8月以來最快進球

懂球帝
2026-04-20 03:12:07
徹底怒了!俄軍發(fā)動今年最大打擊,烏克蘭和北約遭重創(chuàng)

徹底怒了!俄軍發(fā)動今年最大打擊,烏克蘭和北約遭重創(chuàng)

兵國大事
2026-04-18 18:17:27
李小冉疑發(fā)文回應(yīng)退出《浪姐》:努力趕上優(yōu)秀的姐姐們

李小冉疑發(fā)文回應(yīng)退出《浪姐》:努力趕上優(yōu)秀的姐姐們

愛吃冰棍的小痞子
2026-04-20 01:07:16
魏建軍現(xiàn)場發(fā)飆:你們沒BBA那個品味

魏建軍現(xiàn)場發(fā)飆:你們沒BBA那個品味

熱點科技
2026-04-19 17:07:34
別被今天的太陽“騙”了!下一波暴雨,馬上到廣東

別被今天的太陽“騙”了!下一波暴雨,馬上到廣東

新浪財經(jīng)
2026-04-19 14:34:10
正大光明官宣!中國艦艇編隊過航橫當(dāng)水道

正大光明官宣!中國艦艇編隊過航橫當(dāng)水道

武器縱論
2026-04-19 21:56:32
陳喬恩不忍了!公開回應(yīng)老公艾倫將私生子帶回家,她才不是軟柿子

陳喬恩不忍了!公開回應(yīng)老公艾倫將私生子帶回家,她才不是軟柿子

八卦王者
2026-04-18 16:41:43
摸景甜胸側(cè),抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

摸景甜胸側(cè),抱李雪琴胳膊,31歲的他綜藝翻車,為何如此沒分寸感

草莓解說體育
2026-04-15 04:23:51
2026-04-20 03:48:49
36氪 incentive-icons
36氪
讓一部分人先看到未來
151179文章數(shù) 2848737關(guān)注度
往期回顧 全部

財經(jīng)要聞

華誼兄弟,8年虧光85億

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米 女子家中坐擁價值上億別墅卻沒法住人

體育要聞

湖人1比0火箭:老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬!內(nèi)娛隔空掀桌第一人

科技要聞

50分26秒破人類紀錄!300臺機器人狂飆半馬

汽車要聞

29分鐘大定破萬 極氪8X為什么這么多人買?

態(tài)度原創(chuàng)

教育
健康
本地
公開課
軍事航空

教育要聞

655家單位、1.29萬個崗位,湖南用心幫大學(xué)生找工作

干細胞抗衰4大誤區(qū),90%的人都中招

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

伊朗逼退美掃雷艇:美方求給15分鐘撤退

無障礙瀏覽 進入關(guān)懷版