国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

CPU,為何“偷偷轉(zhuǎn)型”?

0
分享至



Yole Group發(fā)布的《2025年處理器產(chǎn)業(yè)狀況》報(bào)告確認(rèn)了一個(gè)里程碑式的節(jié)點(diǎn):2024年GPU銷售額首次超越了CPU。這標(biāo)志著半導(dǎo)體產(chǎn)業(yè)正式邁入了一個(gè)由加速計(jì)算主導(dǎo)的新周期。在這樣一個(gè)宏觀背景下,一個(gè)核心議題浮出水面:當(dāng)GPU、NPU以及ASIC這些“加速器”逐漸接管大規(guī)模并行計(jì)算任務(wù)時(shí),傳統(tǒng)的中央處理器會(huì)不會(huì)被邊緣化?或者說,它能在新的計(jì)算范式中找到不可替代的位置嗎?

GenAI計(jì)算重心的轉(zhuǎn)移并未消除對(duì)主機(jī)處理器的需求,但卻徹底改變了對(duì)其性能指標(biāo)的定義。過去三十年間,CPU主要依靠提升通用計(jì)算頻率和推測(cè)執(zhí)行效率來推動(dòng)摩爾定律。然而,在面對(duì)萬億參數(shù)模型訓(xùn)練與實(shí)時(shí)推理的高吞吐量需求時(shí),這種通用設(shè)計(jì)原則正遭遇能效比與I/O瓶頸的雙重挑戰(zhàn)。

行業(yè)正在重新審視CPU在AI集群里的位置。過去,它只是個(gè)簡(jiǎn)單的邏輯控制器;現(xiàn)在,它正在演變成異構(gòu)系統(tǒng)的調(diào)度中樞,不僅提供大容量?jī)?nèi)存,還直接負(fù)責(zé)特定的推理任務(wù)。這種轉(zhuǎn)變不僅重構(gòu)了底層技術(shù)架構(gòu),也在深刻影響著市場(chǎng)格局和資本流向,從數(shù)據(jù)中心一直延伸到邊緣設(shè)備。

01

CPU的困境與“轉(zhuǎn)型”

在傳統(tǒng)的以CPU為中心的計(jì)算架構(gòu)中,數(shù)據(jù)處理流程通常由運(yùn)行在CPU上的軟件棧進(jìn)行管理,數(shù)據(jù)需要在網(wǎng)絡(luò)接口、CPU內(nèi)存和深度學(xué)習(xí)加速器(DLA)之間進(jìn)行多次搬運(yùn)。這種基于軟件的數(shù)據(jù)控制機(jī)制在面對(duì)AI工作負(fù)載時(shí),顯現(xiàn)出明顯的效率缺陷。主要問題體現(xiàn)在并行命令的沖突以及數(shù)據(jù)路徑的擁塞,這直接限制了后端加速器的利用率,導(dǎo)致昂貴的硬件資源處于等待狀態(tài),進(jìn)而推高了系統(tǒng)的整體功耗與成本。

更為深層的技術(shù)矛盾,在于處理器微架構(gòu)的設(shè)計(jì)哲學(xué)。現(xiàn)代CPU普遍依賴“推測(cè)執(zhí)行”技術(shù),通過分支預(yù)測(cè)來提前執(zhí)行指令以保持流水線滿載,這種機(jī)制在處理邏輯復(fù)雜的通用程序時(shí)表現(xiàn)優(yōu)異。然而,AI和機(jī)器學(xué)習(xí)工作負(fù)載主要由大規(guī)模的向量和矩陣運(yùn)算構(gòu)成,且內(nèi)存訪問模式往往呈現(xiàn)出高度的不規(guī)則性。在這種場(chǎng)景下,推測(cè)執(zhí)行容易出現(xiàn)預(yù)測(cè)失敗,導(dǎo)致流水線頻繁刷新。被丟棄的計(jì)算指令不僅未能產(chǎn)生有效產(chǎn)出,反而造成了額外的能源浪費(fèi)與延遲。

針對(duì)通用架構(gòu)在AI負(fù)載下的局限性,處理器行業(yè)正在經(jīng)歷第一層維度的革新:微架構(gòu)層面的去推測(cè)化。近期獲得美國(guó)專利商標(biāo)局專利認(rèn)證的“基于時(shí)間的確定性執(zhí)行模型”代表了一種新的設(shè)計(jì)思路。該模型摒棄了復(fù)雜的推測(cè)機(jī)制,引入帶有時(shí)間計(jì)數(shù)器的向量協(xié)處理器,采用靜態(tài)調(diào)度策略。在這一架構(gòu)下,指令僅在數(shù)據(jù)依賴關(guān)系完全解決且操作數(shù)就緒的確定時(shí)刻,才會(huì)被分發(fā)至執(zhí)行單元。

由于執(zhí)行順序和時(shí)間是預(yù)先規(guī)劃且確定的,芯片設(shè)計(jì)可以省去復(fù)雜的寄存器重命名和亂序執(zhí)行控制邏輯,從而在矩陣計(jì)算等任務(wù)中以更低的晶體管開銷和功耗實(shí)現(xiàn)高可擴(kuò)展性。這種確定性執(zhí)行模型在保持與RISC-V等標(biāo)準(zhǔn)指令集兼容的同時(shí),從底層邏輯上適配了AI計(jì)算對(duì)高吞吐量和低延遲的剛性需求。

第二層維度的革新則是系統(tǒng)級(jí)架構(gòu)的“專用化分流”。為了解決I/O瓶頸,行業(yè)開始探索將網(wǎng)絡(luò)排序、服務(wù)質(zhì)量管理(QoS)及數(shù)據(jù)預(yù)處理功能從主機(jī)CPU的軟件棧中剝離,下沉至專用的硬件邏輯中。這種被稱為“網(wǎng)絡(luò)附加處理單元”(NAPU)的設(shè)計(jì)理念,通過在處理器內(nèi)部集成DSP核心、視頻引擎及AI優(yōu)化的網(wǎng)絡(luò)接口,實(shí)現(xiàn)了數(shù)據(jù)路徑的硬件加速。

這不僅釋放了通用CPU核心的算力資源,使其能專注于復(fù)雜的邏輯調(diào)度,還大幅減少了數(shù)據(jù)在不同組件間的無效移動(dòng)。此外,主流x86處理器也在通過集成AMX等專用加速指令集來進(jìn)行自我進(jìn)化,優(yōu)化對(duì)bf16和int8等低精度數(shù)據(jù)類型的處理能力,從而在不依賴外部加速器的情況下,提升CPU自身處理矩陣運(yùn)算的效率。

02

AI 時(shí)代,CPU的應(yīng)用場(chǎng)景

技術(shù)架構(gòu)的演進(jìn)直接映射在市場(chǎng)需求的結(jié)構(gòu)性變化上。盡管訓(xùn)練端對(duì)GPU的需求持續(xù)高漲,但推理端市場(chǎng)正呈現(xiàn)出對(duì)成本和能效的敏感,這為新型CPU提供了廣闊的市場(chǎng)空間。根據(jù)Future Market Insights預(yù)測(cè),美國(guó)數(shù)據(jù)中心CPU需求將保持7.4%的復(fù)合年增長(zhǎng)率。這并非源于對(duì)傳統(tǒng)通用算力的渴求,而是由AI應(yīng)用落地過程中的實(shí)際“經(jīng)濟(jì)賬”所逼出來的。

在推理場(chǎng)景中,并非所有任務(wù)都需要昂貴的GPU集群。對(duì)于大量參數(shù)量在7B至13B之間的中小模型,或者是單用戶的實(shí)時(shí)交互請(qǐng)求,現(xiàn)代服務(wù)器CPU已經(jīng)能夠提供足夠的吞吐量。英特爾的數(shù)據(jù)顯示,雙路服務(wù)器在運(yùn)行特定參數(shù)規(guī)模的Llama模型時(shí),可以達(dá)到滿足實(shí)時(shí)閱讀速度的Token生成率。

更為關(guān)鍵的是,根據(jù)亞信科技和Cast AI的統(tǒng)計(jì),公有云環(huán)境中存在大量利用率低于20%的閑置CPU資源。利用這些已部署的通用算力進(jìn)行AI推理,相比額外采購(gòu)專用加速器,具有顯著的總擁有成本(TCO)優(yōu)勢(shì)。因此,在長(zhǎng)尾應(yīng)用和非高并發(fā)場(chǎng)景下,CPU正在加入AI推理的主力軍,這種“夠用就好”的經(jīng)濟(jì)邏輯支撐了數(shù)據(jù)中心CPU市場(chǎng)的持續(xù)增長(zhǎng)。

除了直接承擔(dān)推理任務(wù),AI大模型對(duì)內(nèi)存容量的渴求也重塑了CPU的市場(chǎng)價(jià)值。隨著模型參數(shù)量突破萬億級(jí)別,GPU的顯存容量日益成為限制推理性能的瓶頸,顯存溢出即意味著服務(wù)中斷。在這一背景下,CPU的主內(nèi)存通過CXL等高速互聯(lián)技術(shù)與GPU共享,實(shí)際上充當(dāng)了加速器的L4緩存。

在英偉達(dá)的GH/GB系列以及華為昇騰的超節(jié)點(diǎn)方案中,高性能CPU與其搭載的大容量DDR內(nèi)存成為了支撐大模型穩(wěn)定運(yùn)行的關(guān)鍵基礎(chǔ)設(shè)施。這意味著市場(chǎng)對(duì)服務(wù)器CPU的評(píng)價(jià)標(biāo)準(zhǔn)正在發(fā)生改變,內(nèi)存通道數(shù)量、帶寬以及與加速器的互聯(lián)速度,成為了比核心頻率更為關(guān)鍵的選型指標(biāo)。

再把視野放寬到邊緣計(jì)算和終端設(shè)備,市場(chǎng)對(duì)“異構(gòu)協(xié)同”的需求已經(jīng)超越了單一芯片的性能。在具身智能、智能終端這些領(lǐng)域,系統(tǒng)設(shè)計(jì)有嚴(yán)格的分工:CPU負(fù)責(zé)低延遲的邏輯控制和實(shí)時(shí)交互,GPU負(fù)責(zé)高并發(fā)計(jì)算,NPU處理持續(xù)運(yùn)行的背景任務(wù)。

行業(yè)專家指出,在語音轉(zhuǎn)文字、復(fù)雜邏輯調(diào)度及實(shí)時(shí)運(yùn)動(dòng)控制等場(chǎng)景中,CPU的響應(yīng)速度優(yōu)于需要批處理才能發(fā)揮效率的GPU。例如在機(jī)器人領(lǐng)域,x86 CPU憑借其在工業(yè)控制領(lǐng)域的軟件生態(tài)積累,配合嵌入式GPU構(gòu)成的主控方案,依然是主流選擇。這種異構(gòu)計(jì)算的市場(chǎng)趨勢(shì)促使CPU必須具備更強(qiáng)的協(xié)同能力,能夠高效地將特定負(fù)載卸載給NPU或GPU,同時(shí)保持對(duì)全局任務(wù)的精準(zhǔn)調(diào)度。

03

AI CPU,巨頭與后起之秀

在技術(shù)轉(zhuǎn)型和市場(chǎng)需求的雙重驅(qū)動(dòng)下,處理器產(chǎn)業(yè)的競(jìng)爭(zhēng)格局正在重塑。一方面,專注于AI專用架構(gòu)的初創(chuàng)企業(yè)開始冒頭;另一方面,傳統(tǒng)巨頭也在忙著調(diào)整戰(zhàn)略,進(jìn)行生態(tài)融合。

以色列芯片企業(yè)NeuReality就是專用化趨勢(shì)的典型。該公司近期完成了3500萬美元的A輪融資,總?cè)谫Y額達(dá)到4800萬美元,其商業(yè)化目標(biāo)直指AI推理服務(wù)器市場(chǎng)。NeuReality推出的NR1芯片實(shí)際上是對(duì)傳統(tǒng)CPU架構(gòu)的一次解構(gòu)與重組,它被定義為“網(wǎng)絡(luò)附加處理單元”(NAPU)。該芯片集成了Arm Neoverse核心,但其核心競(jìng)爭(zhēng)力在于異構(gòu)集成的十六個(gè)通用DSP核心、十六個(gè)音頻DSP核心以及四個(gè)視頻引擎。

通過這種硬件設(shè)計(jì),NeuReality試圖解決傳統(tǒng)CPU在處理AI數(shù)據(jù)流時(shí)的瓶頸,將網(wǎng)絡(luò)排序、數(shù)據(jù)排序及同步等任務(wù)固化在硬件中。其公開數(shù)據(jù)顯示,相較于傳統(tǒng)的CPU中心架構(gòu),NR1能夠?qū)I應(yīng)用的總擁有成本改善10倍。這種專用化芯片的出現(xiàn),標(biāo)志著市場(chǎng)開始接受不再由通用CPU主宰一切,而是由專用宿主處理器來管理AI流水線的理念。

與此同時(shí),傳統(tǒng)芯片巨頭也在積極適應(yīng)這一變化,通過資本運(yùn)作與技術(shù)合作來鞏固生態(tài)地位。2025年9月,英偉達(dá)宣布向英特爾投資50億美元并開展基礎(chǔ)設(shè)施合作,這一商業(yè)動(dòng)作具有極強(qiáng)的信號(hào)意義。盡管英偉達(dá)在加速計(jì)算領(lǐng)域占據(jù)統(tǒng)治地位,但其對(duì)x86生態(tài)的巨額投資表明,在未來相當(dāng)長(zhǎng)的時(shí)間內(nèi),高性能x86 CPU作為異構(gòu)集群的通用底座和生態(tài)入口,其戰(zhàn)略價(jià)值依然不可撼動(dòng)。這與其說是妥協(xié),不如說是對(duì)現(xiàn)實(shí)的承認(rèn)——再?gòu)?qiáng)大的GPU集群,也需要強(qiáng)大的CPU來調(diào)度。

在另一端,Arm架構(gòu)正在服務(wù)器領(lǐng)域發(fā)起強(qiáng)有力的攻勢(shì)。數(shù)據(jù)顯示,Arm架構(gòu)CPU在服務(wù)器市場(chǎng)的份額持續(xù)攀升,預(yù)計(jì)在2025年將占據(jù)全球服務(wù)器出貨量的21.1%。這一增長(zhǎng)不僅得益于AWS等云廠商自研Graviton系列芯片的推動(dòng),也離不開富士通等廠商在歐洲市場(chǎng)的布局。富士通與歐洲云服務(wù)商Scaleway達(dá)成的戰(zhàn)略合作,旨在利用基于Arm架構(gòu)的FUJITSU-MONAKA CPU平臺(tái)構(gòu)建高能效AI推理環(huán)境,這種方案避開了GPU算力的紅海競(jìng)爭(zhēng),轉(zhuǎn)而在綠色計(jì)算和低TCO推理領(lǐng)域?qū)ふ彝黄瓶凇?/p>

然而,互聯(lián)網(wǎng)大廠的實(shí)際部署策略也顯示出市場(chǎng)的復(fù)雜性。盡管自研Arm芯片在成本上具有優(yōu)勢(shì),但在核心的AI訓(xùn)練集群中,為了保證軟件生態(tài)的絕對(duì)兼容性和穩(wěn)定性,x86 CPU依然是首選配置。這表明,未來的處理器市場(chǎng)將不再是單一架構(gòu)的零和博弈,而是進(jìn)入了x86與Arm并存、通用CPU與專用AI CPU互補(bǔ)、CPU與加速器深度協(xié)同的復(fù)雜生態(tài)階段。

在這種格局下,CPU廠商的競(jìng)爭(zhēng)力將不再單純?nèi)Q于核心數(shù)量或頻率,而在于其架構(gòu)是否足夠開放,是否能高效地融入異構(gòu)計(jì)算的流水線,以及是否能為日益多樣化的AI負(fù)載提供最具經(jīng)濟(jì)效益的算力支持。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
霍思燕攜愛犬參加國(guó)際比賽獲得全場(chǎng)總冠軍,杜江自豪發(fā)文

霍思燕攜愛犬參加國(guó)際比賽獲得全場(chǎng)總冠軍,杜江自豪發(fā)文

鋭娛之樂
2025-12-21 08:37:03
追夢(mèng)被驅(qū)逐!勇士半場(chǎng)64-67太陽:?jiǎn)栴}出在這3點(diǎn)!

追夢(mèng)被驅(qū)逐!勇士半場(chǎng)64-67太陽:?jiǎn)栴}出在這3點(diǎn)!

籃壇籃談
2025-12-21 10:49:24
宇樹登臺(tái)王力宏演唱會(huì)獲馬斯克點(diǎn)贊,王興興:“機(jī)器人時(shí)刻還差一個(gè)臨界點(diǎn)”

宇樹登臺(tái)王力宏演唱會(huì)獲馬斯克點(diǎn)贊,王興興:“機(jī)器人時(shí)刻還差一個(gè)臨界點(diǎn)”

第一財(cái)經(jīng)資訊
2025-12-20 13:53:16
倒反天罡!蒙古要在中國(guó)邊境修建鐵絲網(wǎng),以前不是漢人修長(zhǎng)城嗎?

倒反天罡!蒙古要在中國(guó)邊境修建鐵絲網(wǎng),以前不是漢人修長(zhǎng)城嗎?

我心縱橫天地間
2025-12-20 15:52:24
對(duì)越反擊戰(zhàn)期間,先前有 15 個(gè)國(guó)家明確站隊(duì)支持越南,然而戰(zhàn)爭(zhēng)正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

對(duì)越反擊戰(zhàn)期間,先前有 15 個(gè)國(guó)家明確站隊(duì)支持越南,然而戰(zhàn)爭(zhēng)正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

史海孤雁
2025-12-19 17:46:17
CBA又出笑話!一球隊(duì)得53分輸31分,三分球20中1,球迷: 快解散吧

CBA又出笑話!一球隊(duì)得53分輸31分,三分球20中1,球迷: 快解散吧

金山話體育
2025-12-21 08:05:19
1976年毛主席逝世后,派誰空降上海?葉劍英擲地有聲:我提議一人

1976年毛主席逝世后,派誰空降上海?葉劍英擲地有聲:我提議一人

春秋硯
2025-12-20 08:55:09
你無意中發(fā)現(xiàn)過別人哪些秘密?網(wǎng)友:這不是我一個(gè)單身狗能看的

你無意中發(fā)現(xiàn)過別人哪些秘密?網(wǎng)友:這不是我一個(gè)單身狗能看的

帶你感受人間冷暖
2025-12-18 00:10:08
沒有商量余地,中國(guó)直接收回,17萬日本人淚奔,高市闖禍了!

沒有商量余地,中國(guó)直接收回,17萬日本人淚奔,高市闖禍了!

來科點(diǎn)譜
2025-12-20 09:02:35
美司法部公布愛潑斯坦案調(diào)查文件 隱去上千名受害者及家屬信息

美司法部公布愛潑斯坦案調(diào)查文件 隱去上千名受害者及家屬信息

新京報(bào)
2025-12-20 09:57:04
中戲院長(zhǎng)郝戎主動(dòng)投案 ,靳東阿云嘎受影響,有大麻煩了!

中戲院長(zhǎng)郝戎主動(dòng)投案 ,靳東阿云嘎受影響,有大麻煩了!

叨嘮
2025-12-20 00:46:13
女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來上班

女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來上班

梅子的小情緒
2025-12-19 14:04:18
為何說年齡超過72歲的人:即便身體健康,也沒有多少來日方長(zhǎng)?

為何說年齡超過72歲的人:即便身體健康,也沒有多少來日方長(zhǎng)?

健康科普365
2025-12-21 08:05:10
犯了大忌!托卡耶夫去日本明治神宮,必將是其政治生涯的一個(gè)污點(diǎn)

犯了大忌!托卡耶夫去日本明治神宮,必將是其政治生涯的一個(gè)污點(diǎn)

我心縱橫天地間
2025-12-20 15:40:20
不賣!不摘!旅順一棵35年樹齡的圓棗樹成8種鳥類專屬“冬糧倉(cāng)”

不賣!不摘!旅順一棵35年樹齡的圓棗樹成8種鳥類專屬“冬糧倉(cāng)”

半島晨報(bào)
2025-12-20 09:39:58
中國(guó)證監(jiān)會(huì)原主席肖鋼:人工智能技術(shù)快速迭代,導(dǎo)致投資面臨加速折舊風(fēng)險(xiǎn),需構(gòu)建適配金融體系

中國(guó)證監(jiān)會(huì)原主席肖鋼:人工智能技術(shù)快速迭代,導(dǎo)致投資面臨加速折舊風(fēng)險(xiǎn),需構(gòu)建適配金融體系

新浪財(cái)經(jīng)
2025-12-20 17:36:13
瑞典,挪威,芬蘭北歐三國(guó)地處惡劣寒地,經(jīng)濟(jì)實(shí)力為何如此強(qiáng)大呢

瑞典,挪威,芬蘭北歐三國(guó)地處惡劣寒地,經(jīng)濟(jì)實(shí)力為何如此強(qiáng)大呢

向航說
2025-12-17 00:05:03
吳敬中死前對(duì)余則成說:"在天津找穿藍(lán)旗袍的女人,她知道你身份"

吳敬中死前對(duì)余則成說:"在天津找穿藍(lán)旗袍的女人,她知道你身份"

飯小妹說歷史
2025-12-16 16:38:39
天吶!原來大錢是這么來的!網(wǎng)友:難怪我螺絲打到冒煙都賺不到錢

天吶!原來大錢是這么來的!網(wǎng)友:難怪我螺絲打到冒煙都賺不到錢

夜深愛雜談
2025-12-20 17:40:11
楊千嬅開live老公亂入因一事說她黐線,眉毛妝被指似蠟筆小新

楊千嬅開live老公亂入因一事說她黐線,眉毛妝被指似蠟筆小新

粵睇先生
2025-12-21 09:40:17
2025-12-21 11:52:49
半導(dǎo)體產(chǎn)業(yè)縱橫 incentive-icons
半導(dǎo)體產(chǎn)業(yè)縱橫
探索IC產(chǎn)業(yè)無限可能。
2263文章數(shù) 1257關(guān)注度
往期回顧 全部

數(shù)碼要聞

榮耀獵人游戲本開啟“先鋒獵手”招募計(jì)劃,可搶先體驗(yàn)原型機(jī)

頭條要聞

山西宣布廢除煙花爆竹"禁放令" 網(wǎng)友:年味回來了

頭條要聞

山西宣布廢除煙花爆竹"禁放令" 網(wǎng)友:年味回來了

體育要聞

送快船西部墊底!鵜鶘大勝步行者獲4連勝

娛樂要聞

鹿晗關(guān)曉彤戀愛期間毫不避諱?

財(cái)經(jīng)要聞

百年老店陷貼牌爭(zhēng)議 同仁堂必須作出取舍

科技要聞

生態(tài)適配已超95% 鴻蒙下一關(guān):十萬個(gè)應(yīng)用

汽車要聞

-30℃,標(biāo)致508L&凡爾賽C5 X冰雪"大考"

態(tài)度原創(chuàng)

游戲
數(shù)碼
本地
公開課
軍事航空

魔獸世界:安其拉神殿最讓人無法抗拒的武器,哪款能讓你逆襲?

數(shù)碼要聞

三年耐用性測(cè)試揭示:OLED電視可靠性明顯高于LCD

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風(fēng)骨

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

澤連斯基:前線局勢(shì)愈發(fā)艱難

無障礙瀏覽 進(jìn)入關(guān)懷版