国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

芯橋半導(dǎo)體張鑫:從單點智能到群體協(xié)同,芯橋如何打造具身智能的“算力工廠”

0
分享至


4月21日至22日,以“奔赴AGI 重塑未來”為主題的2026中國生成式AI大會(北京站)圓滿舉行。

這場大會集結(jié)73位產(chǎn)學(xué)研投嘉賓,通過1場開幕式、3場專題論壇、6場技術(shù)研討會,全景式解析AI產(chǎn)業(yè)的產(chǎn)業(yè)脈絡(luò)、創(chuàng)新范式、Token經(jīng)濟與中國機會。

議題跨度很大,從大語言模型、多模態(tài)模型、世界模型、智能體、AI眼鏡等前沿模型與應(yīng)用,到數(shù)據(jù)、芯片、存儲、通信、云服務(wù)等基礎(chǔ)設(shè)施。

在這場信息密度超高的大會上,芯橋(北京)半導(dǎo)體有限公司解決方案副總裁張鑫帶來了題為《構(gòu)建感知、決策、執(zhí)行一體化的智能算力工廠》的主題演講。

張鑫指出,從GTC大會黃仁勛提出的算力工廠到Agent落地元年,算力需求正從單點爆發(fā)走向群體協(xié)同。在具身智能場景下,機器人受限于電量與承載面積,無法僅靠單點算力完成任務(wù),必須實現(xiàn)算力的分布式協(xié)同。

基于這一判斷,芯橋半導(dǎo)體推出了五位一體的智能算力架構(gòu),核心思路是算力分層部署。該架構(gòu)具備兩大能力:其一,將大算力、高精度的X200芯片部署在邊緣網(wǎng)關(guān)或集群上,負責(zé)群體路徑規(guī)劃與長時間序列的全模態(tài)模型計算;其二,將低功耗、大顯存的S200芯片部署在機器人邊端,運行影子模型以應(yīng)對斷網(wǎng)或異常情況。

芯橋半導(dǎo)體正圍繞系統(tǒng)級調(diào)度平臺與安全機制進行深度驗證,涵蓋內(nèi)存墻優(yōu)化、模型黑盒應(yīng)對及無網(wǎng)絡(luò)環(huán)境下的本地自主執(zhí)行。芯橋認為,服務(wù)端集群本質(zhì)上是Token工廠,Token經(jīng)濟正從一次性問答轉(zhuǎn)變?yōu)橐蚤L時間為計量單位的持續(xù)工作模式,只有當(dāng)Token成本降到足夠低,推理端才會迎來真正的大爆發(fā)。

以下是演講實錄:

一、算力新戰(zhàn)場:從“單點智能”到“群體協(xié)同”

各位同仁、各位開發(fā)者們,大家好。很榮幸能有這樣一個機會與大家進行交流。這次我們芯橋半導(dǎo)體主要想和大家探討的是:構(gòu)建感知、決策、執(zhí)行一體化的智能算力工廠。


今年大家也看到了,在三月份的GTC大會上,黃仁勛反復(fù)提到了算力工廠,同時還提到了各種芯片的架構(gòu)需要重新調(diào)整。今年是Agent的落地元年,去年底OpenClaw開始爆火,大家都在推測今年的落地到底是什么樣子。那么,今年會不會把所有的推理場景帶火?整個推理場景的硬件服務(wù)器,包括集群、各種各樣的邊緣端場景,到底該怎么用?這其實是今年大家非常關(guān)心的一個話題,我們就著這個話題進行一些討論。

我先簡單介紹一下芯橋。芯橋成立的時間其實不算短,我們有自己的研發(fā)團隊,專門針對GPU芯片進行研發(fā)設(shè)計。今年我們的重點,一個是新芯片的研發(fā),另一個是探索更多芯片的落地場景。


在板卡這個場景上,很多企業(yè)都在買服務(wù)器、建集群,但其實還有很多場景在里面。往年我們落地了很多應(yīng)用,包括視覺的CV模型、LLM(大語言模型),以及現(xiàn)在的多模態(tài)模型,甚至一些Agent在落地時,也都對算力提出了各種要求。

多種場景落地之后,我們發(fā)現(xiàn),今年Agent火爆之后,對卡的要求,或者說對平臺和芯片的要求,也變得多樣了。因為整體需求的爆發(fā),就會導(dǎo)致推理場景不再局限于語言類的模型,而是更偏向于多模態(tài)的,比如具身智能,還有一些世界模型,各種各樣的模型都會涌現(xiàn)出來。在不斷落地的過程中,芯片到底應(yīng)該如何定位呢?今年,我們在董事會討論之后,對整體的拓展方向,以及芯片在未來設(shè)計、落地的方向,都做了深刻的思考。

其中,底層硬件和平臺化的優(yōu)化一定是重中之重。因為現(xiàn)在大家在使用國產(chǎn)芯片時,還是會面臨一定的考驗。我們更希望讓用戶在使用我們的芯片時,能夠非常順滑,無論是以前使用NVIDIA芯片還是NPU芯片,切換到我們這里,甚至在異構(gòu)計算時,都能達到非常絲滑的效果。


二、機器人電量有限?打破單節(jié)點算力天花板

在場景方面,今年春晚的機器人已經(jīng)火得眾所周知,前兩天亦莊的機器人半程馬拉松比賽也很受關(guān)注。在火熱的同時,我們需要思考一個問題:具身智能在單節(jié)點(機器人本身)上的算力是否足夠?如果在單節(jié)點上遇到了內(nèi)存墻或者通信墻,或者遇到其他阻礙,我們應(yīng)該如何調(diào)整?因此,借助春晚的人形機器人和剛結(jié)束的亦莊半馬比賽這兩個熱點,我們就具身智能這個場景展開后續(xù)討論。

目前,我們有很多合作商,大家一起討論具身智能。從整體架構(gòu)來看,未來可能不能只局限于單點計算。因為機器人本身的電量是有限的,其電路板的承載面積也是有限的,這意味著它在單節(jié)點(即一個機器人自身的承載范圍內(nèi))的計算能力存在上限。

大家也看到,在春晚舞臺上,宇樹、銀河等許多機器人實際上是在做群體智能,不再是一個機器人單獨完成工作,而是多個機器人協(xié)同合作。因此,必然會面臨機器人與機器人之間的協(xié)同問題;诖,我們在與供應(yīng)商討論后,提出了一個大膽的假設(shè)和一套五位一體的架構(gòu)方案。該方案涵蓋了從最底層的執(zhí)行層,到最上層的決策層,以及中間過渡的認知層。這一方案整合了芯橋目前所有的芯片產(chǎn)品,力求將各產(chǎn)品的性能最大化地分配和利用。


我們推測,機器人的下一個戰(zhàn)場,除了已經(jīng)明確的單點算力提升之外,還必然面臨群體智能的升級。此時,我們考慮的就不再是單純的算力提升問題,而是算力的協(xié)同問題。我們能否將現(xiàn)有的服務(wù)端、邊緣端、網(wǎng)關(guān)端等各端的算力聯(lián)合起來使用?在服務(wù)端與單點節(jié)點之間的通信效果上,哪些模型、哪些參數(shù)、哪些變量應(yīng)該存儲到何處,才能達到最優(yōu)效果?我們對這些問題進行了深入討論。

三、魚群效應(yīng):X200大算力上云,S200小模型落地

我們得出的結(jié)論是,在類似“魚群效應(yīng)”的場景中,更適合將大算力放在邊緣網(wǎng)關(guān)或直接放在算力集群中。那些長時間序列的事件模型,即持續(xù)運行、時間周期很長且需要全模態(tài)的視覺模型,應(yīng)放置在X200算力集群上。而那些經(jīng)過量化處理的、較小的影子模型,反而應(yīng)該放在機器人的邊端。這樣一來,當(dāng)出現(xiàn)異常情況時,邊端可以及時調(diào)用這些模型進行處理,避免出現(xiàn)路徑干擾、碰撞,或者因故障導(dǎo)致機器人停機、無法恢復(fù)、無法返回原點等問題。


我們在方案設(shè)計過程中,充分考慮了不同芯片以及不同搭配的SoC或網(wǎng)關(guān)端集群計算的效果,重新對架構(gòu)進行了調(diào)整。

像X200這樣大算力、適合集群類終端計算的芯片,反而應(yīng)該放置在邊緣網(wǎng)關(guān)或集群服務(wù)器端,采用高精度(如BF16、FP32)進行計算,承擔(dān)群體項目的整體路徑規(guī)劃任務(wù),確保由上百個節(jié)點組成的群體在路徑規(guī)劃、行為規(guī)劃以及傳感器返回結(jié)果后構(gòu)建下一秒事件模型的實時計算。這些任務(wù)數(shù)據(jù)量極大、精度要求極高,統(tǒng)一由X200芯片完成。


而S200這種邊緣端芯片,在設(shè)計上兼具低功耗和大顯存的特點。它可以滿足邊緣端對影子模型的需求:當(dāng)出現(xiàn)異常時,邊緣端能夠自主進行足夠長時間序列的世界模型計算,保證機器人在下一秒的行為不會與原有規(guī)則或軌跡方案產(chǎn)生過大偏差。同時,大顯存能夠存儲足夠的中間變量,確保機器人有充足的時間完成當(dāng)前工作并歸位。因此,這款芯片非常適合在邊緣端為機器人提供強大的算力以及足夠大的顯存。


當(dāng)前,無論是邊緣端還是服務(wù)端,內(nèi)存墻的問題已經(jīng)非常突出。最近國內(nèi)外許多論文都在探討同一個問題:如何處理長上下文,才能在最有效的存儲空間內(nèi)計算出更多高準(zhǔn)確率的數(shù)據(jù)?此外,在解決了內(nèi)存墻問題之后,能否通過通信手段將更多的顯存整合起來,將單面積很小的顯存匯聚成一個大的顯存池?這也是為了解決通過帶寬來緩解顯存瓶頸的問題。但在邊緣端的單點計算場景中,最直接的方法仍然是擴大顯存,其好處是顯而易見的。

系統(tǒng)層面,我們與眾多供應(yīng)商、具身智能企業(yè)以及算力中心不斷進行磨合與調(diào)整。實際上,我們需要一個宏觀調(diào)控的平臺,這個平臺既要能夠進行精細調(diào)控,也要能夠進行宏觀調(diào)控,包括算力分配、不同模型的切換、不同數(shù)據(jù)的交換以及變量存儲位置的協(xié)調(diào),才能達到最優(yōu)的占比,避免顯存和帶寬的浪費。


再往下到具身智能層面,包括某些傳感器的控制,一直到微觀層面機械手的靈活調(diào)整。這些調(diào)整有的需要CPU,有的需要GPU,許多中間變量需要共存。因此,整個板間設(shè)計和資源調(diào)度需要一個平臺進行合理規(guī)劃和任務(wù)協(xié)調(diào)。

四、極致安全:斷網(wǎng)環(huán)境下的“邊緣自治”

此外,安全問題始終是一個無法回避的話題。從去年的安全會議開始,大家就在討論模型的黑盒問題:它到底是否安全?它內(nèi)部到底進行了怎樣的計算?我們現(xiàn)在仍然不得而知。直到今天,我們?nèi)匀徊磺宄⺄ransformer架構(gòu)內(nèi)部的詳細計算過程,它依舊是黑盒。雖然我們可以通過推理來判斷它給出的結(jié)果好壞,但這屬于安全問題的范疇。

例如,在MoE模型出現(xiàn)之后,Anthropic發(fā)表了一篇論文討論了這樣的問題:模型給出的結(jié)果,究竟是經(jīng)過思考之后得出的,還是先有了結(jié)果再進行思考?這是一個非常底層的安全問題。機器人也同樣存在類似的問題。我們看到它執(zhí)行的結(jié)果與我們的預(yù)期可能可以進行調(diào)試,但如果加入了真正的思考過程,它給出的結(jié)果究竟是我們想要的結(jié)果,還是它想讓我們看到的結(jié)果?

另外,在工廠這種需要精細化工作的場景中,如果出現(xiàn)斷網(wǎng)或斷電的情況,雖然大家都有UPS(不間斷電源),但難免會有部分區(qū)域無法啟動。如果出現(xiàn)斷網(wǎng),盡管現(xiàn)在許多工廠都在做5G或WiFi覆蓋,但仍然存在很多網(wǎng)絡(luò)盲區(qū),例如倉儲區(qū)域,或者像某些保密性極高的場所,其中信號干擾非常強。機器人進入這類場景后,可能會面臨斷網(wǎng)。那么,它一旦踏入這樣的區(qū)域,是否還能繼續(xù)執(zhí)行原有任務(wù)?這一點非常關(guān)鍵。在沒有中心調(diào)度的情況下,本地設(shè)備是否能夠依靠本地的影子模型以及傳感器、CV等多種模型的配合,仍然正確地完成任務(wù)?

針對這些問題,我們在芯片層面進行了嚴(yán)格的探討,并且正在與供應(yīng)商進行實時論證,以確保擁有足夠的算力、優(yōu)質(zhì)的優(yōu)化算子庫,以及重新定義的芯片外設(shè)方案,從而推動機器人在真正的異常情況下,或者在單點無網(wǎng)絡(luò)的計算環(huán)境下,依然能夠優(yōu)質(zhì)地執(zhí)行服務(wù)端分配的任務(wù),并安全地返回有網(wǎng)絡(luò)的環(huán)境或原始出發(fā)點。整個設(shè)計方案仍然圍繞我們五位一體的架構(gòu)展開,并與不同場景和供應(yīng)商進行了相互討論與驗證。

實際上,從今年開始,芯片不僅提供算力,也構(gòu)成了Agent進化的基因。我們的定位與年初GTC上討論的觀點一致:服務(wù)端集群本質(zhì)上就是Token的工廠。Token工廠改變了整個推理的商業(yè)價值,過去的推理是一次性的,我提出一個問題,它給出一個結(jié)果,再問一個,再給一個,這是一個一個、逐步完成的過程。

但今后將不再是這種模式,而是變成一個長時間序列的、持續(xù)且不會停止的工作。因此,整個Token經(jīng)濟將轉(zhuǎn)變?yōu)橐蚤L時間為計量單位的經(jīng)濟,而不是一次性販賣結(jié)果。我們在探討這個問題,以及我們自身芯片產(chǎn)品在未來定位和未來視角時,不再拘泥于現(xiàn)有的訓(xùn)練模式、推理模式、ChatBot或聊天框,而是著眼于整個未來的Token世界和Token經(jīng)濟的運作方式。我們需要考慮,整個單點以及整個生態(tài)架構(gòu)應(yīng)該如何運作,才能使Token經(jīng)濟更具價值,讓我們的芯片幫助Token經(jīng)濟實現(xiàn)最大利益。


正如上午有嘉賓提到的:什么時候Token能夠降到最低成本,什么時候能夠讓更多的OpenClaw用到非常便宜的Token,推理端才會迎來真正的大爆發(fā)。

以上是我的演講內(nèi)容,謝謝大家。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
白冰偷稅被罰再迎噩耗!多部門出手,還有猛料,賬號被禁只是開始

白冰偷稅被罰再迎噩耗!多部門出手,還有猛料,賬號被禁只是開始

北緯的咖啡豆
2026-04-28 16:46:17
新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

新娘臨時要10萬下車費,新郎去取錢卻未歸,新娘趕到婆家瞬間淚目

千秋歷史
2026-02-02 20:23:42
羅伯遜:希金斯歷史排名僅次于奧沙利文,塞爾比是歷史第三的球員

羅伯遜:希金斯歷史排名僅次于奧沙利文,塞爾比是歷史第三的球員

世界體壇觀察家
2026-04-29 06:10:43
電車?yán)@不開的硬傷:不管開多愛惜,十年電池難逃衰減

電車?yán)@不開的硬傷:不管開多愛惜,十年電池難逃衰減

華庭講美食
2026-04-29 05:09:09
林志玲婚后很X福?金莎造人失?

林志玲婚后很X福?金莎造人失?

八卦瘋叔
2026-04-29 11:15:38
世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

世上最失敗4大工程:損失慘重,中國占倆!卻說有意料之外效果?

三毛看世界
2026-04-17 16:43:17
央視《愛情沒有神話》開播!看完4集,我斷言:這劇又要火向全國

央視《愛情沒有神話》開播!看完4集,我斷言:這劇又要火向全國

阿纂看事
2026-04-28 20:45:05
擔(dān)心的事還是發(fā)生,跑丟編制的女護士張水華,又回到了她的怪圈

擔(dān)心的事還是發(fā)生,跑丟編制的女護士張水華,又回到了她的怪圈

金風(fēng)說
2026-04-15 14:42:59
我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

我敢說,大部分會跟我一樣,選擇黑色衣服那個女孩!

草莓解說體育
2026-04-12 17:05:01
情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

情侶在瑞士雪山頂“撒歡”,就這么被全世界直播了···

新歐洲
2026-04-21 19:37:05
平臺回應(yīng)“孕婦自稱花200元買水果遭丈夫咒罵后引產(chǎn)”:系劇情演繹,已處置禁言

平臺回應(yīng)“孕婦自稱花200元買水果遭丈夫咒罵后引產(chǎn)”:系劇情演繹,已處置禁言

齊魯壹點
2026-04-28 17:19:17
明明、天權(quán)出走,俞敏洪公開道歉,上任四個月,孫進對東方甄選做了什么?

明明、天權(quán)出走,俞敏洪公開道歉,上任四個月,孫進對東方甄選做了什么?

搜狐科技
2026-04-28 18:58:17
曼聯(lián)猝不及防!巴薩全面更改拉什福德買斷條款,3000萬歐買斷作廢

曼聯(lián)猝不及防!巴薩全面更改拉什福德買斷條款,3000萬歐買斷作廢

夜白侃球
2026-04-29 09:18:53
比導(dǎo)彈便宜萬倍!中國 LW30 一出場,無人機當(dāng)場變廢鐵

比導(dǎo)彈便宜萬倍!中國 LW30 一出場,無人機當(dāng)場變廢鐵

小蘭聊歷史
2026-04-18 14:25:14
15球4助攻!巴西中場全能鐵腰閃耀意甲,開價5000萬歐,3豪門瘋搶

15球4助攻!巴西中場全能鐵腰閃耀意甲,開價5000萬歐,3豪門瘋搶

零度眼看球
2026-04-29 07:25:39
清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

抽象派大師
2026-04-24 12:23:42
破案了!胡明軒表現(xiàn)低迷,點解,楊鳴道出了原因

破案了!胡明軒表現(xiàn)低迷,點解,楊鳴道出了原因

體育哲人
2026-04-29 11:31:41
4比1!馬刺淘汰開拓者!再見了,楊瀚森

4比1!馬刺淘汰開拓者!再見了,楊瀚森

籃球教學(xué)論壇
2026-04-29 12:59:58
5月1日新規(guī)落地:飯局、人情、私下轉(zhuǎn)賬,全部納入常態(tài)化嚴(yán)管!

5月1日新規(guī)落地:飯局、人情、私下轉(zhuǎn)賬,全部納入常態(tài)化嚴(yán)管!

放開他讓wo來
2026-04-29 11:19:51
堅決抵制境外勢力資助‘躺平網(wǎng)紅”

堅決抵制境外勢力資助‘躺平網(wǎng)紅”

難得君
2026-04-29 10:48:33
2026-04-29 13:23:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11714文章數(shù) 117054關(guān)注度
往期回顧 全部

科技要聞

夭折的造富神話,逼著中國AI回去賺"慢錢"

頭條要聞

男子強奸大嫂又殺人被執(zhí)行死刑 大哥:談不上高興難過

頭條要聞

男子強奸大嫂又殺人被執(zhí)行死刑 大哥:談不上高興難過

體育要聞

巴黎5-4拜仁夜:身價1.55億的“足壇笑話”,成了最硬的底牌

娛樂要聞

單依純演唱會再唱“區(qū)區(qū)三萬天”宣戰(zhàn)

財經(jīng)要聞

多地藥店違規(guī)串換商品套刷醫(yī)保揭秘

汽車要聞

配32寸升降屏 新款別克世紀(jì)CENTURY上市53.99萬起

態(tài)度原創(chuàng)

旅游
本地
手機
公開課
軍事航空

旅游要聞

鄭州能待一整天的40個免費室內(nèi)場館

本地新聞

用青花瓷的方式,打開西溪濕地

手機要聞

谷歌Pixel 11系列手機Tensor G6芯片爆料:7核CPU

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

德國總理默茨:美國正遭受伊朗領(lǐng)導(dǎo)層的羞辱

無障礙瀏覽 進入關(guān)懷版