国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

八位AI算力CEO:2026,算力舊規(guī)則正在作廢

0
分享至



AI越厲害,面臨的瓶頸越「降維」。

作者丨趙之齊 劉伊倫

編輯丨包永剛

自DeepSeek在去年春節(jié)出圈以來,春節(jié)已然成了AI行業(yè)的“狂歡季”。

各大晚會連番登臺的機器人、科技從業(yè)者們在代碼堆里守歲,本身就是一種隱喻:AI正逐漸長成社會運轉(zhuǎn)中不能停下的“基礎(chǔ)設(shè)施”。

站在馬年的新起點,雷峰網(wǎng)對話了算力產(chǎn)業(yè)鏈上八家標桿企業(yè)的CEO,探討AI給算力產(chǎn)業(yè)帶來的種種邏輯重塑。

有趣的是,如今,行業(yè)看待AI的方式正在經(jīng)歷一場集體“降維”:當(dāng)技術(shù)紅利階段性觸達天花板,真正決定行業(yè)生死的命題變得更加具體且真實——

電力缺口、存儲產(chǎn)能瓶頸、算力利用率與成本、硬件連接與算法協(xié)同,乃至AI給組織架構(gòu)帶來的深層顛覆等等……(算力鏈面臨挑戰(zhàn)的更多細節(jié),歡迎添加作者微信Ericazhao23交流)

作為這場變革的親歷者,CEO們親述的八個片段互為印證,共同拼湊出算力產(chǎn)業(yè)當(dāng)下最核心、真實的命題。

01

需求狂飆,基建托底

當(dāng)算力需求越來越大,IDC基建作為根基,會面臨什么新的挑戰(zhàn)?

秦淮數(shù)據(jù) CEO 吳華鵬:GW級智算不是蓋「完美大樓」,而是搭「可拆裝積木」


我是一個有著強烈技術(shù)信仰的人。

親歷互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)風(fēng)起云涌的30年,在當(dāng)前,我強烈感受到數(shù)據(jù)中心行業(yè)正站在由AI重構(gòu)產(chǎn)業(yè)格局的新起點上。

過去一年,GW(吉瓦,10億瓦特)級智算園區(qū)這一“新物種”,已成為行業(yè)發(fā)展的重要方向,但超大規(guī)模算力如何與電力體系適配、協(xié)同,依然挑戰(zhàn)重重。

這一瓶頸的核心在于:算力需求和建設(shè)規(guī)模在爆發(fā)式增長,但新能源體系的支撐能力,尚未完全匹配發(fā)展需求。

具體來看,矛盾主要集中在三個層面:

一方面,GW級園區(qū)一年的耗電量堪比一座中等城市,傳統(tǒng)分步拓建的電力基建模式,面對“整體規(guī)劃預(yù)留、分階段規(guī)模化交付”的建設(shè)需求,已經(jīng)很難滿足。

其二,GW級園區(qū)要求高比例綠電,但高比例新能源接入后,在負荷波動、熱源管理、智能控制等方面,都還沒有足夠成熟的方案應(yīng)對。

而在如此龐大的用電基數(shù)下,效率每提升一個百分點,都意味著巨大的商業(yè)價值——這也讓效率優(yōu)化擁有了前所未有的緊迫性。

而外部的技術(shù)供應(yīng)和市場競爭,仍在給行業(yè)帶來不確定性。

GPU 產(chǎn)能、進口相關(guān)因素,會直接影響算力部署節(jié)奏。同時,頭部企業(yè)扎堆涌入烏蘭察布、中衛(wèi)這類核心節(jié)點,讓優(yōu)質(zhì)電力、土地資源的爭奪越來越激烈,企業(yè)拿資源的難度明顯加大。

整體看下來,行業(yè)競爭的核心,已經(jīng)從“拼規(guī)?!?,轉(zhuǎn)向“規(guī)?!迸c“質(zhì)量”并重。相對完善的能源解決方案,是當(dāng)下數(shù)據(jù)中心企業(yè)突破瓶頸的關(guān)鍵一環(huán)。

在這方面,我們通過與東陽光集團的戰(zhàn)略整合,已經(jīng)取得實質(zhì)性進展。去年9月,東陽光牽頭的銀團以280億元現(xiàn)金收購秦淮數(shù)據(jù)中國區(qū)全部業(yè)務(wù),今年1月完成股權(quán)交割。

過去幾個月,我們已在韶關(guān)、烏蘭察布、宜昌簽約重點項目,“東數(shù)西算”十大集群,秦淮已落子過半。目前,我們投運及在建IT容量近1GW,儲備與規(guī)劃容量達到4GW。接下來還將在烏蘭察布,和東陽光聯(lián)手打造國內(nèi)首個GW級超大規(guī)模綠電直供垂直一體化產(chǎn)業(yè)示范區(qū)

此外,我們還聯(lián)合東陽光以及產(chǎn)業(yè)鏈伙伴,推出全球首個基于SST(固態(tài)變壓器)的算力中心智能直流供電商業(yè)化方案,將于今年4月在張家口懷來正式投運。

這個方案能讓電力轉(zhuǎn)換效率達到98.5%,是業(yè)內(nèi)最高水平;單功率柜輸出功率達1MW,占地面積僅1㎡,相較傳統(tǒng)方案減少50%以上。與此同時,面對AI GPU負載的劇烈波動,這個系統(tǒng)還能主動調(diào)節(jié)供電策略,實時智能應(yīng)對。

這些業(yè)務(wù)進展,為我們建設(shè)GW級園區(qū)奠定了堅實基礎(chǔ)。但我也深知,打造GW級AI算力中心,不是蓋一棟一步到位、極致完美的樓,而是搭一套“可拆裝的積木”——

面對算力、電力、技術(shù)的多重不確定性,解決方法是采用模塊化、分期建設(shè)和能力解耦,達成彈性交付。

AI革命將掀起一場持續(xù)20年的技術(shù)浪潮,在這之中,焦慮和壓力都在所難免,堅守初心就更為關(guān)鍵。結(jié)合我的體悟,我也想與管理者們共勉:

堅持做行業(yè)中的“良幣”,錨定底層邏輯、持續(xù)創(chuàng)新、走長期主義,才能在這場AI革命里立得住、走得遠。

作為基建中同樣重要的參與者,云廠商在AI時代的護城河會是什么?

UCloud CEO 季昕華:AI迭代進入「月更」時代,云廠商面臨跨學(xué)科的認知重塑


當(dāng)下,AI技術(shù)迭代速度極快,幾乎每隔一個月就會出現(xiàn)一次行業(yè)級突破,行業(yè)模型與應(yīng)用的市場熱度呈指數(shù)級增長,這些都要求我們云廠商具備高頻、高強度持續(xù)學(xué)習(xí)的能力,深入理解跨學(xué)科、跨行業(yè)的產(chǎn)業(yè)鏈條,在理解AI技術(shù)本質(zhì)的基礎(chǔ)上,推動業(yè)務(wù)聯(lián)動與生態(tài)合作,才能實現(xiàn)商業(yè)價值的最大化。

我和團隊觀察下來,目前限制行業(yè)突破的核心瓶頸,在于對AI的認知水平

對AI技術(shù)發(fā)展的認知,決定我們跟進的速度;對AI使用效果的認知,決定我們使用的廣度;對AI商業(yè)發(fā)展的認知,決定我們投入的力度;對AI影響能力的認知,決定我們成長的高度。

去年,我們負責(zé)了一項海外千卡智算中心項目,這本身就是一個復(fù)雜度極高的綜合性工程。

我們不僅需要把控產(chǎn)品本身的能力,還必須統(tǒng)籌各類場外因素——從前期的工地勘察、架構(gòu)建設(shè),到中期的物流運輸、測試模擬,再到后期的集群構(gòu)建和優(yōu)化保障,每個環(huán)節(jié)都要統(tǒng)籌到位,挑戰(zhàn)很大。

而在海外落地,難度還要再上一個量級。

我們面對的是多樣化的國家政策與市場環(huán)境,前期要投入大量精力調(diào)研和實地考察;到交付階段,還會遇到許多不可控因素——國際政治形勢、當(dāng)?shù)胤煞ㄒ?guī)、極端天氣、海關(guān)流程等,都可能成為棘手的挑戰(zhàn),導(dǎo)致項目延期。

好在,團隊頂住了壓力,穩(wěn)步推進著項目。當(dāng)客戶最終完成壓力測試,系統(tǒng)平穩(wěn)上線運行的那一刻,我們連續(xù)數(shù)月緊繃的神經(jīng)終于得以放松。

在海外拓展布局的過程中,客戶一直很理解、支持我們。許多新節(jié)點資源一上線,就迅速被客戶采購一空。我們對此深懷感激,并對未來的合作與市場前景保持樂觀。

但與此同時,業(yè)界也普遍感受到:由于內(nèi)存、存儲、CPU等核心硬件產(chǎn)能不足,供應(yīng)鏈正出現(xiàn)顯著波動。這可能引發(fā)各行業(yè)在傳統(tǒng)IT支出上出現(xiàn)結(jié)構(gòu)性調(diào)整,后續(xù)走勢仍需持續(xù)觀察。

并且,每次具有突破性的新模型發(fā)布,都可能重塑競爭格局,使得資源有限的中小企業(yè)面臨更大壓力。正如當(dāng)年GPT系列的出現(xiàn),導(dǎo)致大量傳統(tǒng)NLP公司被洗牌出局,持續(xù)的迭代浪潮可能令類似的歷史再次上演。

做難而正確的事,有如推石上山。我們清醒地知曉其重量與反復(fù),而真正的選擇在于:手不松,步不止。價值,就在這持續(xù)的攀登之中。

在2026年,我們將堅定AI和全球化兩大戰(zhàn)略

AI層面,我們將圍繞六大方向繼續(xù)深入:基礎(chǔ)模型、行業(yè)模型、AI應(yīng)用、AI+硬件、機器人和無人駕駛,以及Agent拓展。例如,AI創(chuàng)新應(yīng)用層面,我們將繼續(xù)以UModelVerse模型服務(wù)平臺為載體,通過token計費方式,讓初創(chuàng)企業(yè)在AI成本支出更為可控;同時,我們推出的Agent Sandbox可以降低AI Agent的生產(chǎn)應(yīng)用門檻,為AI真正自主處理高復(fù)雜度、高風(fēng)險任務(wù)提供基礎(chǔ)設(shè)施級保障。

全球化層面,我們將加速完善全球云計算服務(wù)網(wǎng)絡(luò),計劃在2026年新增更多海外服務(wù)節(jié)點,重點助力中國企業(yè)、尤其是一帶一路沿線市場的出海業(yè)務(wù)發(fā)展。

02

算力決勝點:場景與成本

算力資源完成初步沉淀后,如何將裸金屬高效轉(zhuǎn)化為開發(fā)者可用的“數(shù)字燃料”,成了算力運營商必須回答的命題。

并行科技董事長、CEO 陳健:AI Coding主導(dǎo)Token需求,「高效、穩(wěn)定、低成本」將成為算力服務(wù)競爭焦點


2025年,人工智能領(lǐng)域經(jīng)歷了一場由規(guī)模化應(yīng)用驅(qū)動的深刻變革,大模型Token調(diào)用量爆炸式增長,這一變化直接引發(fā)了算力供需關(guān)系、技術(shù)優(yōu)化焦點和產(chǎn)業(yè)競爭格局的連鎖反應(yīng)。

作為衡量大模型應(yīng)用規(guī)模的核心指標,日均Token調(diào)用量在2025年實現(xiàn)驚人突破,全市場Token使用量同比增長300倍,且全球Token技術(shù)標準統(tǒng)一,采用開源模型的企業(yè)呈現(xiàn)一致發(fā)展態(tài)勢。

一方面,Token需求暴漲的重要場景是AI Coding,業(yè)界預(yù)測到2030年,絕大多數(shù)代碼將由AI自動生成,這既是IT行業(yè)的自我革新,也是AI成為通用技術(shù)的基礎(chǔ)。2025年全年,Token使用量的一半集中在AI Coding領(lǐng)域,也標志著大模型正式進入規(guī)?;a(chǎn)階段。

不過,在我看來,Token使用量激增的核心誘因是成本優(yōu)化。2025年初,DeepSeek憑借極高的性能與成本優(yōu)勢,實現(xiàn)了Token成本10倍的性價比提升,將大模型使用門檻降低一個數(shù)量級。

在這波浪潮中,并行科技也成功將在線服務(wù)的Token成本大幅降低,從一百多元降至幾元,離線模式更是可能降至1元以下,主力Token成本整體下降近30倍,TPS(每秒Token輸出量)也提升10倍,達到行業(yè)前沿水平。

回望2025年,市場呈現(xiàn)“一卡難求——供大于求——年底優(yōu)質(zhì)卡一卡難求”的快速輪回。需求端看,我和團隊認為,當(dāng)前主要分為三類:頭部大模型企業(yè)的超大規(guī)模訓(xùn)練需求(企業(yè)數(shù)量縮減至不足20家,但單家需求量翻倍)、推理服務(wù)需求(含Token生成,達萬卡級別且快速增長)、科研研發(fā)需求(穩(wěn)步增長)。但供給端一側(cè),則因2023-2024年小規(guī)模智算中心無序建設(shè)、供應(yīng)鏈不穩(wěn)定等影響,供給形勢多次反轉(zhuǎn)。

對此,并行科技采取“彈性供給”和高效資源調(diào)度策略,使自有GPU算力利用率在2025年上半年達到85%-90%的飽和狀態(tài),且在12月市場轉(zhuǎn)向供不應(yīng)求前,通過多次大規(guī)模采購提前鎖定優(yōu)質(zhì)算力資源,從容應(yīng)對2026年初優(yōu)質(zhì)算力“一卡難求”的格局。

但2025年算力市場帶來的挑戰(zhàn)仍在繼續(xù):受AI需求暴漲與產(chǎn)能不足的雙重影響,全球顯存、GPU顯存、內(nèi)存及閃存等存儲產(chǎn)品大幅漲價,直接導(dǎo)致服務(wù)器成本翻倍,嚴重制約了算力資源的擴建進程。

不過,在這之中,也蘊含著國產(chǎn)算力的重要發(fā)展機遇。從政策層面和資本市場資金流向來看,國產(chǎn)算力正在呈現(xiàn)出百花齊放的態(tài)勢,從小規(guī)模適配邁向大規(guī)模單集群生態(tài)建設(shè)的新階段,既強調(diào)“大規(guī)?!辈季郑沧⒅亍吧鷳B(tài)”適配,加速與國際市場接軌。

2026年,行業(yè)對未來已經(jīng)達成這些共識:一是推理需求持續(xù)主導(dǎo),隨著模型大規(guī)模部署,推理所需的算力規(guī)模和復(fù)雜度將遠超訓(xùn)練,成為算力消耗的絕對主體;二是Agent成為主流形態(tài),大模型應(yīng)用正從單一問答向能規(guī)劃、執(zhí)行、使用工具的智能體演進,要求底層服務(wù)架構(gòu)重構(gòu);三是價值重心上移,未來競爭焦點不在于單純擁有算力,而在于能否提供高效、穩(wěn)定、低成本的模型服務(wù)和AI應(yīng)用。

總結(jié)而言,2026年將是AI大規(guī)模商業(yè)化應(yīng)用的元年。

成本之外,門檻仍在。如何讓非技術(shù)背景的企業(yè)能在多樣化的算力架構(gòu)上,自由地生長出屬于自己的Agent生態(tài)?

九章云極 CEO 方磊:摒棄「規(guī)模噱頭」,場景適配才是智算產(chǎn)業(yè)的關(guān)鍵「勝負手」


站在2026年的新起點回望,2025年算力市場最大的變化,就是徹底告別了“盲目堆硬件”的狂熱,從“CPU云主導(dǎo)”邁入“GPU云崛起”的關(guān)鍵轉(zhuǎn)型期。

我和團隊最直觀的體會是,2025年行業(yè)核心瓶頸集中于“供需錯配”與“效率不足”

一方面,傳統(tǒng)CPU云適配通用計算,與AI高并行、密集型需求存在本質(zhì)矛盾,而“CPU+GPU混合數(shù)據(jù)中心” 既抬高了成本,又制約了GPU性能的釋放;

另一方面,算法從“深度學(xué)習(xí)”向“強化學(xué)習(xí)”躍遷,算力呈十倍、百倍級增長,但行業(yè)GPU平均利用率僅70%左右,且“裸金屬租賃”模式門檻高,導(dǎo)致中小企業(yè)與開發(fā)者難以高效使用算力,抑制產(chǎn)業(yè)創(chuàng)新活力。

同時,算力需求已進入集中爆發(fā)期:端到端模型訓(xùn)練、仿真測試、車路協(xié)同等場景,都需要10倍以上的算力支撐,對算力的穩(wěn)定性、泛在性提出了更高要求。從全球格局看,國外頭部企業(yè)聚焦超大規(guī)模算力集群與專用芯片研發(fā),核心服務(wù)于高端訓(xùn)練場景,但高昂的成本與封閉的生態(tài)體系,讓廣大中小企業(yè)難以觸及算力資源。

因此,算力的“普惠化”行動勢在必行

2025年,九章云極推出智算云平臺,依托Serverless與強化學(xué)習(xí)相關(guān)技術(shù),實現(xiàn)了萬卡至十萬卡級異構(gòu)算力的統(tǒng)一調(diào)度,將AI智能體訓(xùn)推流程簡化至一行代碼即可啟動,讓更多主體能夠參與到AI創(chuàng)新中來。

與此同時,行業(yè)正經(jīng)歷關(guān)鍵躍遷:競爭核心從預(yù)訓(xùn)練時期的“拼規(guī)?!钡胶笥?xùn)練時期的“拼效率”,強化學(xué)習(xí)作為驅(qū)動模型進化的核心引擎,已成為下一代智算基礎(chǔ)設(shè)施的剛性需求;智能體已從“純對話交互”,轉(zhuǎn)向“復(fù)雜任務(wù)執(zhí)行”,工業(yè)控制、流程自動化、城市治理等實景場景,催生出海量碎片化、動態(tài)化的算力訴求。

基于此,我們團隊也在兩個方向上發(fā)力:

一方面,繼續(xù)推進強化學(xué)習(xí)云的工業(yè)級落地,以全異步訓(xùn)練架構(gòu)、離線回放算法等核心技術(shù),讓中小企業(yè)無需承擔(dān)高昂投入即可完成專家模型訓(xùn)練;

另一方面,針對智能體“執(zhí)行化”轉(zhuǎn)型需求,打通強化學(xué)習(xí)云與工具調(diào)用、復(fù)雜工作流的適配,延續(xù)按度計費的模式,支持一行代碼啟動訓(xùn)練、推理、執(zhí)行,從而匹配從機器人調(diào)度到城市規(guī)劃的多元動態(tài)算力需求。

雖然當(dāng)下行業(yè)里仍有“算力過?!薄捌髽I(yè)無真實算力需求”的聲音,市場也在糾結(jié)“是否要加速推進大規(guī)模、大體量算力布局”。

但我們始終堅持自己的判斷是,AI基礎(chǔ)設(shè)施仍處于發(fā)展上升期,長期潛力巨大。未來有能力開展模型訓(xùn)練的主體會持續(xù)增多,算力需求的增長空間遠未觸頂,所謂“算力過剩”只是短期供需波動的階段性現(xiàn)象,而非行業(yè)終局。

市場的反饋與實際體感也在印證我們的判斷:Forrester調(diào)研顯示,45%的中小企業(yè)選擇智算云服務(wù),12%的獨立開發(fā)者將其作為核心支撐,企業(yè)對AI算力的使用邏輯已轉(zhuǎn)向“經(jīng)濟、彈性”,依托我們的智算云,部分客戶成本直接降低了40%。

最后,我想說說我對這個行業(yè)的理解:行業(yè)的勝負手不是誰的GPU更多,而是誰能放下“規(guī)模噱頭”,深耕場景適配,把算力變成企業(yè)“算著清、用得好”的基礎(chǔ)設(shè)施。

03

軟硬件新戰(zhàn)場

Context Window帶來巨大內(nèi)存消耗、高帶寬DRAM走向供需失衡,需求端的反向施壓,為創(chuàng)新性技術(shù)方案的實現(xiàn)提供機遇。

昉擎科技 CEO 梁軍:Agent爆發(fā)與供應(yīng)趨緊,AI基礎(chǔ)設(shè)施迎來「創(chuàng)新發(fā)展」窗口期


2025年年初,DeepSeek R1的發(fā)布引起巨大反響,Sparse MoE(稀疏混合專家模型)迅速成為主流。過去一年里,模型能力持續(xù)躍升、迭代速度顯著加快,各類應(yīng)用也隨之快速普及。

然而,上層應(yīng)用的繁榮與底層算力的就緒之間存在明顯的時間差。

針對Sparse MoE模型的計算特性,AI Infra在過去一年里實現(xiàn)了多層面的深度優(yōu)化,但由于芯片有固定的開發(fā)節(jié)奏,除了華為超節(jié)點方案外,國內(nèi)其他芯片廠商的對應(yīng)產(chǎn)品仍處于開發(fā)階段,這也制約了相關(guān)業(yè)務(wù)的增長。

瓶頸的出現(xiàn),讓行業(yè)在設(shè)計、部署Scale-Up集群上迅速達成共識。UALink、SUE及ESUN等Scale-Up通信協(xié)議標準進展非常迅速,產(chǎn)業(yè)鏈配套的通信協(xié)議IP、Switch、支持Scale-Up接口的算力芯片,以及Scale-Up集群硬件等各種產(chǎn)品的開發(fā)進展也全面提速。

另一方面,行業(yè)供應(yīng)形勢持續(xù)趨緊:除了眾所周知的高帶寬DRAM供需失衡,還有不少部件、材料都面臨供應(yīng)緊張的境況。

這一緊張態(tài)勢并非單純的周期性波動,而是應(yīng)用范式變革對資源需求的結(jié)構(gòu)性重塑。

Agent應(yīng)用的爆發(fā)式增長,既要滿足超長Context Window(上下文窗口)帶來的巨大內(nèi)存消耗,又需將Token成本壓縮至極致。

與此同時,Agent普及帶來的low latency(低時延推理)需求,正從需求端反向施壓,對系統(tǒng)軟硬件設(shè)計產(chǎn)生深遠影響。

這些變化讓行業(yè)面臨很大挑戰(zhàn),但也帶來發(fā)展機遇。

從模型、應(yīng)用、AI Infra到底層軟硬件,各層面均在高速迭代演進,客觀上催生了巨大的市場機會,也為創(chuàng)新性技術(shù)方案的落地提供了寶貴的窗口期。

這一窗口屬于敢于冒險、擅長系統(tǒng)性思維的團隊。在諸多難題與挑戰(zhàn)之下,我們始終堅持以高標準方案和更基礎(chǔ)性的方式求解,這也讓我們團隊收獲超出預(yù)期的成果。

過去一年我們的多次實踐,都在不斷驗證這一方法論的有效性,也讓我們面對未來的信心更加堅定。

Token需求進入爆發(fā)期后,底層硬件碎片化的“互聯(lián)墻”不容小覷,行業(yè)要如何避免讓算力集群淪為性能孤島?

奇異摩爾 CEO 田陌晨:「互聯(lián)碎片化」成超節(jié)點瓶頸,AI下一戰(zhàn)拼的是交付


這波AI的發(fā)展,對硬件提出了雙重挑戰(zhàn):

一方面,市場上AI大模型數(shù)量快速增長,要求芯片廠商能廣泛且高效地適配;

另一方面,大模型領(lǐng)域技術(shù)迭代極快,多模態(tài)、世界模型等創(chuàng)新層出不窮,如今,市場重心也已經(jīng)明顯轉(zhuǎn)向:一是從追求規(guī)模擴張,轉(zhuǎn)向深耕性能;二是從“生成式AI”,轉(zhuǎn)向“AI Agent”這一形態(tài)。

尤其在推理場景中,不同應(yīng)用場景對Prefill(預(yù)填充)與Decode(解碼)階段的需求不同,對時延、精度、功耗、可靠性等方面的側(cè)重點也不同,這些都會直接影響計算、互聯(lián)與存儲等各個模塊的設(shè)計

這也直接拉高了對硬件團隊的要求:

軟件技術(shù)演進常以“季度”甚至“月”為單位,芯片等硬件的迭代周期卻通常長達數(shù)年,因此,硬件研發(fā)團隊不僅要精通軟硬件深度技術(shù)具備跨領(lǐng)域視野,還需具備前瞻性,能夠預(yù)判未來兩至三年的技術(shù)需求,以提前規(guī)劃硬件設(shè)計。

我們從2021年起,就預(yù)見到AI快速發(fā)展將面臨的網(wǎng)絡(luò)互聯(lián)瓶頸,在布局片內(nèi)互聯(lián)芯粒產(chǎn)品后,也逐步構(gòu)建起面向AI網(wǎng)絡(luò)互聯(lián)的全棧解決方案。

然而,這一路并非坦途:

2024年,我們已前瞻性地在超節(jié)點領(lǐng)域進行了技術(shù)和資源布局,但那時候“超節(jié)點”概念還沒有火起來,我們的工作顯得有些“超前”,這使得公司當(dāng)時的資本化進程一度有些阻力。好在,有中科創(chuàng)星等早期投資人始終如一的信任,以及客戶和合作伙伴的并肩同行,到2025年,超節(jié)點成為AI訓(xùn)推集群的關(guān)鍵技術(shù)焦點。

不過,制約超節(jié)點部署效率與可擴展性的核心瓶頸,也隨之顯現(xiàn):

超節(jié)點內(nèi)部的各個計算單元,要依賴統(tǒng)一、高效的互聯(lián)協(xié)議,才能實現(xiàn)協(xié)同。然而,目前還沒有出現(xiàn)像以太網(wǎng)或移動通信那樣成熟且被廣泛接納的標準體系,這就導(dǎo)致不同廠家的設(shè)備很難兼容、互通,交換機和計算節(jié)點之間的對接方式,都是各家自己定制,這讓系統(tǒng)集成和后期維護都變得更復(fù)雜且麻煩。

盡管最近兩年間,國內(nèi)外已涌現(xiàn)出多項致力于推進標準化的倡議與規(guī)范,如SUE、OISA、ETH-X、UALink等。然而,“生態(tài)碎片化”的解決并非單純的技術(shù)競賽,而是要依賴于產(chǎn)業(yè)鏈上下游的緊密協(xié)作。在我看來,短期內(nèi),多元技術(shù)標準并存的格局還會持續(xù)

針對這一情況,奇異摩爾推出超節(jié)點互聯(lián)芯粒Kiwi G2G IOD——基于我們獨創(chuàng)的HPDE可編程架構(gòu),能支持不同的協(xié)議類型及其升級。

并且,早在2023年,奇異摩爾便作為首批核心生態(tài)成員,深度參與由中國移動牽頭的OISA 1.0協(xié)議制定工作。2025年,公司進一步參與到OISA 2.0協(xié)議的制定中,負責(zé)制定了協(xié)議中互聯(lián)芯粒部分的標準設(shè)計,還開發(fā)了業(yè)界首個OISA Scale up協(xié)議的驗證平臺。

2026年,我相信超節(jié)點的熱度仍會繼續(xù),且會進一步產(chǎn)業(yè)化。這背后也指向一個關(guān)鍵共識:AI時代的競技場,勝負在于交付——無論是觸達用戶的最終應(yīng)用,還是支撐一切的底層硬件,真正拉開差距的,都是交付。

如今,硬件問題也不能僅靠硬件解決,如果無法在指令集與精度層面實現(xiàn)芯片與大模型的深度協(xié)同,算力天花板依然近在咫尺。

清程極智 CEO 湯雄超:「單向適配」不是終局,未來模型與芯片架構(gòu)設(shè)計要互相指導(dǎo)


去年,我們比較關(guān)注大模型的推理部署場景。

印象里最焦慮的時候,可能是春節(jié)后在各種平臺上適配優(yōu)化DeepSeek模型:當(dāng)時我們發(fā)現(xiàn),DeepSeek在一些平臺上很容易能運行起來,但在另一些平臺上卻會面臨很多挑戰(zhàn),算力平臺之間的差距非常大。

經(jīng)過團隊的努力,我們在幾個月后終于實現(xiàn)了計劃中的近10種算力平臺的推理部署方案。對比當(dāng)時,其實可以明顯感受到,國產(chǎn)算力對新發(fā)布模型的支持速度已經(jīng)大幅提升——

從最初模型發(fā)布數(shù)月后才能完成適配,到后來往往新模型發(fā)布后幾天即可適配。去年WAIC大會期間,清程極智的“赤兔”推理引擎更是實現(xiàn)了國產(chǎn)算力對新模型的0 Day支持,讓GLM4.5模型發(fā)布當(dāng)天就能在華為昇騰算力上推理部署。

適配速度的加快,體現(xiàn)了國產(chǎn)算力上的軟件生態(tài)不斷成熟。今年初,我們和T-One孵化器聯(lián)合發(fā)布了一份大模型API服務(wù)行業(yè)報告,在和幾十家做大模型API服務(wù)的伙伴溝通后發(fā)現(xiàn),國產(chǎn)算力是真實可用的,但與此同時,硬件架構(gòu)差異帶來的問題,無法通過軟件手段完全解決。

以往大家認為,軟硬件分別面臨生態(tài)成熟度與絕對性能上的差異,但到了2025年,新興大模型算法架構(gòu)與國際先進算力的硬件架構(gòu)綁定得更加緊密,其影響已經(jīng)超出通常意義上的“軟件生態(tài)”范疇。

例如,去年初開源的DeepSeek-V3/R1模型,是基于FP8數(shù)據(jù)精度原生訓(xùn)練與推理的,但當(dāng)時國產(chǎn)算力硬件架構(gòu)并不支持FP8。我們預(yù)感到后續(xù)會有更多模型采用FP8、FP4這類新興低精度數(shù)據(jù)類型,于是,清程極智就通過軟件的方式,在國產(chǎn)算力上實現(xiàn)了FP8精度的計算,后來又進一步完成了FP4精度的軟件支持。

但這僅僅解決了易用性問題,讓用戶能在國產(chǎn)算力平臺上快速跟進最新大模型與數(shù)據(jù)精度,卻無法從硬件底層真正提升模型的實際運算速度。

而現(xiàn)在,低精度算力已逐漸成為智能算力的主流配置。在海外高端算力芯片中,F(xiàn)P4算力普遍能達到BF16算力的6-8倍。如果國產(chǎn)算力只是在BF16算力上追平海外產(chǎn)品,卻沒有在硬件層面補齊對FP4精度的支持,那么其真實有效算力依然只有海外芯片的零頭,很難形成性價比優(yōu)勢。

好在去年很多國產(chǎn)算力廠商在下一代芯片規(guī)劃中,都提出將支持低精度的算力類型,比如昇騰950就支持FP4。預(yù)計2026年,硬件架構(gòu)的差異有望進一步縮小

但在我看來,國產(chǎn)算力在硬件架構(gòu)上逐步對齊海外特性,還只是早期階段。根本的解決方案,應(yīng)該是國產(chǎn)算力和大模型研發(fā)機構(gòu)更緊密地合作:讓大模型算法的發(fā)展需求指導(dǎo)芯片架構(gòu)的設(shè)計,芯片架構(gòu)也反過來指導(dǎo)大模型的算法設(shè)計

放眼2026,大模型推理對算力的需求仍將保持高速增長,并且,無論是大模型算法架構(gòu)還是底層硬件設(shè)計,都會更加多樣化——

模型方面,去年主流還是基于自回歸解碼的文本類模型,今年則會出現(xiàn)更多擴散模型與多模態(tài)模型;算力方面,除了類GPU架構(gòu)和NPU架構(gòu),一些架構(gòu)更激進的算力也將開始量產(chǎn)。在這樣百花齊放的格局下,可能會碰撞出新的“硬件-算法”協(xié)同的行業(yè)最優(yōu)解。

國產(chǎn)算力在功能上已經(jīng)能滿足大量實際場景的需求,但在絕對性能和性價比上,仍需進一步提升,才能真正建立商業(yè)優(yōu)勢。這需要全行業(yè)共同努力,實現(xiàn)市場化的正向循環(huán)。

04

顛覆全棧

最后,當(dāng)?shù)讓蛹夹g(shù)棧逐步打通、Agent 真正成長為新一代操作系統(tǒng),一個更重磅、更根本的命題也隨之到來:

人類,是否已準備好向 AI 移交決策權(quán)?

PPIO CEO 姚欣:敢不敢放權(quán)給AI,是屬于人類的「奇點時刻」


過去業(yè)界將2045年視為“奇點臨近”,認為跨過奇點后,智能將指數(shù)級迭代、機器進化速度會遠超人類。但在我看來,2025年已經(jīng)過了奇點的拐點。

回看去年,DeepSeek的爆發(fā)讓我們團隊很興奮。一季度我們快速加碼算力、對接需求,全力沖刺MaaS業(yè)務(wù)增長。但到了五六月,市場風(fēng)向突然轉(zhuǎn)變——開發(fā)者更傾向選擇海外價格更高的閉源模型。

這一度讓我們陷入焦慮:PPIO核心業(yè)務(wù)MaaS,跟開源模型生態(tài)息息相關(guān),只有開源模型足夠強,才能帶動MaaS和算力需求增長。但我始終對開源非常堅定——從PC互聯(lián)網(wǎng)到移動互聯(lián)網(wǎng),歷次浪潮幾乎都遵循“閉源開辟、開源統(tǒng)治”的規(guī)律,這一輪AI浪潮也不會例外。

所以我們堅持到九月十月,終于,國內(nèi)大模型迎來爆發(fā)。臨近春節(jié)這段時間,我們也幾乎每天都在對接新模型,春節(jié)大家可能也休息不了。這個過程對我們來說,痛并快樂著。

不過,模型能力只是單點突破,我們始終相信Agent層才是開發(fā)者真正的“操作系統(tǒng)”。去年Agent技術(shù)棧還不成熟,大多停留在概念與雛形階段;但春節(jié)前OpenClaw的誕生,已經(jīng)讓行業(yè)看到全新的機會和希望。

最近還讓我震撼的是,Cursor的CEO拿GPT 5.2寫了三百多萬行代碼,基本復(fù)現(xiàn)了chromium 瀏覽器,要知道寫瀏覽器的難度挑戰(zhàn)和操作系統(tǒng)是一個級別的,由此可以看出,AI已經(jīng)幾乎沒有寫不了的代碼。

在這背后,我也看到了技術(shù)方向上的“會師”:OpenClaw這類Agent的“權(quán)力”太大了,有很大的安全隱患??梢?,今天的AI基礎(chǔ)設(shè)施,已經(jīng)不再僅僅是為人設(shè)計,同時也要為AI服務(wù)——高彈性、高并發(fā)、高任務(wù)響應(yīng)、甚至長時記憶能力,都是AI原生的核心需求

作為經(jīng)歷過互聯(lián)網(wǎng),移動互聯(lián)網(wǎng)多個時代的連續(xù)創(chuàng)業(yè)者,我認為當(dāng)下又是一個重大的技術(shù)范式變遷,我們過去的各類軟硬件都是針對人的使用體驗設(shè)計的,但是行業(yè)正從“以人使用為中心設(shè)計Infra”,轉(zhuǎn)向“以AI或機器為中心設(shè)計的Infra”。我們?nèi)ツ晖瞥龅腁gent沙箱系統(tǒng),恰好就可以成為Agent Infra的核心組件——在保障高效運行的同時,實現(xiàn)安全隔離與風(fēng)險可控。

與此同時,在需求爆發(fā)的背景下,算力的梯次利用與精細化調(diào)度也變得至關(guān)重要。未來算力需求的增長速度會大幅領(lǐng)先于今天算力供應(yīng)速度,行業(yè)會進入一段長期供不應(yīng)求的時段。

而一個愈發(fā)清晰的趨勢是:越是傳統(tǒng)的組件,越容易成為新的瓶頸。

我在本屆CES觀察到,GPU行業(yè)已在為產(chǎn)能實現(xiàn)十倍、百倍增長做準備,但其他組件完全沒跟上,比如硬盤,過去20年每年的產(chǎn)能只上漲平均3%-5%。這就意味著,我們已經(jīng)進入到基礎(chǔ)設(shè)施的綜合博弈,木桶短板效應(yīng)會集中爆發(fā)

因此,我們今年的目標也很明確:全?;腿蚧?。前者是打通從IaaS、MaaS到Agent Infra的端到端技術(shù)能力;后者則是依托不同區(qū)域的資源優(yōu)勢,在日本、歐洲、東南亞等地進一步布局,挖掘更多元的算力供給與市場機會。

我還有個觀察:未來制約AI普及與應(yīng)用深度的關(guān)鍵,不在于技術(shù)或算力,而在于企業(yè)組織能力能否跟上AI的迭代速度。

今年我會在公司內(nèi)部推進全面向AI Native組織轉(zhuǎn)型。這背后是一個根本性命題:當(dāng)機器在效率與智能水平上全面超越人類時,組織與管理者是否敢于放權(quán)

如果我們的決策依然依賴冗長流程、追求100%絕對安全、所有事項最終都需要CEO簽字確認,決策效率必然被嚴重制約。這就是人類史上又一把 “達摩克利斯之劍”:在安全與效率、穩(wěn)定與進化之間,如何做出抉擇?

這將是人類自身的奇點時刻。

作者長期關(guān)注AI算力鏈條,歡迎添加作者微信Ericazhao23交流。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
在美國和以色列襲擊伊朗后,國際油價跳漲,WTI原油期貨大漲10%

在美國和以色列襲擊伊朗后,國際油價跳漲,WTI原油期貨大漲10%

每日經(jīng)濟新聞
2026-03-02 07:10:12
法官問為何不交物業(yè)費,業(yè)主反問:不交稅違法,不交費違法嗎

法官問為何不交物業(yè)費,業(yè)主反問:不交稅違法,不交費違法嗎

蜉蝣說
2026-02-03 16:31:54
定了!2026年3月1日起全國取消這些費用,醫(yī)療政務(wù)殯葬全覆蓋

定了!2026年3月1日起全國取消這些費用,醫(yī)療政務(wù)殯葬全覆蓋

老特有話說
2026-03-01 21:43:31
哈梅內(nèi)伊真死了,二兒子掌控軍隊,三兒子掌控政府,大兒子消失了

哈梅內(nèi)伊真死了,二兒子掌控軍隊,三兒子掌控政府,大兒子消失了

關(guān)系新篇章
2026-03-01 18:00:53
我國首位航天員楊利偉,被授予少將軍銜,退休后能享受什么待遇?

我國首位航天員楊利偉,被授予少將軍銜,退休后能享受什么待遇?

春秋硯
2026-03-02 11:15:08
先享禮遇價25.68萬起,一汽奧迪A5L重塑豪華燃油轎車標桿

先享禮遇價25.68萬起,一汽奧迪A5L重塑豪華燃油轎車標桿

青橙汽車
2025-07-22 08:45:05
江蘇南京一校花太漂亮了,身高170五官精致,美得讓人移不開眼

江蘇南京一?;ㄌ亮?,身高170五官精致,美得讓人移不開眼

三農(nóng)老歷
2026-03-01 22:15:26
隨著中國男籃2連勝,日本送韓國2連敗,本小組3支出線隊基本如下

隨著中國男籃2連勝,日本送韓國2連敗,本小組3支出線隊基本如下

小火箭愛體育
2026-03-01 18:43:21
以軍稱已完成對伊朗各條戰(zhàn)線所有高級領(lǐng)導(dǎo)層“清除行動”

以軍稱已完成對伊朗各條戰(zhàn)線所有高級領(lǐng)導(dǎo)層“清除行動”

國際在線
2026-03-02 07:02:07
以總理宣稱對伊朗之戰(zhàn)“需多久就打多久”

以總理宣稱對伊朗之戰(zhàn)“需多久就打多久”

參考消息
2026-03-01 12:58:06
伊朗代表直接警告美方:我建議你保持禮貌!

伊朗代表直接警告美方:我建議你保持禮貌!

看看新聞Knews
2026-03-01 17:11:05
3-2,36歲阿森納舊將力挽狂瀾:梅開二度+絕殺,率隊逆轉(zhuǎn)里昂

3-2,36歲阿森納舊將力挽狂瀾:梅開二度+絕殺,率隊逆轉(zhuǎn)里昂

凌空倒鉤
2026-03-02 06:52:16
被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場

被震撼到了!哈梅內(nèi)伊一死普京馬上下令,俄羅斯全體高層緊急到場

人間放映廳
2026-03-02 13:47:16
伊朗強援出現(xiàn)!以色列征兵十萬,普京向中國交底,英法德選邊站

伊朗強援出現(xiàn)!以色列征兵十萬,普京向中國交底,英法德選邊站

野史日記
2026-03-02 14:22:05
為何說梅毒病是最臟的???醫(yī)生詳細講解,隔著屏幕都感到頭皮發(fā)麻

為何說梅毒病是最臟的病?醫(yī)生詳細講解,隔著屏幕都感到頭皮發(fā)麻

看世界的人
2026-03-02 10:34:11
女子離鄉(xiāng)返程時兒子沒有送別,看監(jiān)控發(fā)現(xiàn)兒子打開電視把頭埋沙發(fā)下,用聲音掩蓋自己的哭聲

女子離鄉(xiāng)返程時兒子沒有送別,看監(jiān)控發(fā)現(xiàn)兒子打開電視把頭埋沙發(fā)下,用聲音掩蓋自己的哭聲

觀威海
2026-03-01 13:27:08
萬茜自曝上學(xué)時沒人追,看清她的校服照后,網(wǎng)友:這誰敢追??!

萬茜自曝上學(xué)時沒人追,看清她的校服照后,網(wǎng)友:這誰敢追??!

背包旅行
2026-01-17 15:03:45
中國最后一位太監(jiān)孫耀庭自述:晚上伺候娘娘時,鞋底必須藏蒼耳

中國最后一位太監(jiān)孫耀庭自述:晚上伺候娘娘時,鞋底必須藏蒼耳

妙知
2025-08-28 10:19:43
中國交通擁堵的罪魁禍首,并非是車太多?這3座山不移除就白搭

中國交通擁堵的罪魁禍首,并非是車太多?這3座山不移除就白搭

黑哥講現(xiàn)代史
2026-03-01 07:06:09
豆瓣致歉:無法承受巨額損失

豆瓣致歉:無法承受巨額損失

觀察者網(wǎng)
2026-03-02 14:02:06
2026-03-02 15:27:00
雷峰網(wǎng) incentive-icons
雷峰網(wǎng)
關(guān)注智能與未來!
68617文章數(shù) 656082關(guān)注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

頭條要聞

牛彈琴:伊朗之戰(zhàn)比俄烏之戰(zhàn)更生猛 給世界5個深刻教訓(xùn)

體育要聞

卡里克主場5連勝!隊史第2人通過最大考驗

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經(jīng)要聞

中東局勢影響如何?十大券商策略來了

汽車要聞

預(yù)售11.28萬起 狐全新阿爾法S5標配寧德時代

態(tài)度原創(chuàng)

親子
本地
手機
房產(chǎn)
家居

親子要聞

小時候“不合群”的孩子,長大后更有出息?3個優(yōu)勢普通人比不了

本地新聞

津南好·四時總相宜

手機要聞

最高暴漲3000元!史上最猛安卓漲價潮來了 2026年手機出貨量將創(chuàng)13年來新低

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

家居要聞

萬物互聯(lián) 享科技福祉

無障礙瀏覽 進入關(guān)懷版