国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AMD Strix Halo對線Nvidia DGX Spark,誰最強?

0
分享至

公眾號記得加星標??,第一時間看推送不會錯過。

雖然大多數(shù) GenAI 模型都是在大型數(shù)據(jù)中心集群中進行訓練和運行的,但如今在本地構(gòu)建、測試和原型化 AI 系統(tǒng)的能力仍然非常重要。

直到最近,這還需要高端的多GPU工作站,價格通常高達數(shù)萬美元。隨著Nvidia在10月份推出基于GB10核心的DGX Spark,這一現(xiàn)狀得以改變。雖然性能遠不及后者,但憑借128GB的顯存,該系統(tǒng)本質(zhì)上是一個內(nèi)置的AI實驗室,幾乎可以運行任何AI工作負載。

正如我們在之前的上手體驗中所提到的,Spark 并非市面上首屈一指的選擇,甚至也不是最便宜的。AMD 和蘋果也提供配備大容量統(tǒng)一內(nèi)存的系統(tǒng),這些內(nèi)存由 CPU 和 GPU 共享,這使得它們在人工智能開發(fā)者和愛好者中廣受歡迎。

AMD 的 Ryzen AI Max+ 395 APU(為簡潔起見,我們之后簡稱其為“Strix Halo”)尤其引人注目。Strix Halo 的售價僅為 Spark 的四分之三到一半,并且它基于與 AMD 數(shù)據(jù)中心產(chǎn)品大致相同的 ROCm 和 HIP 軟件棧。這為從桌面到數(shù)據(jù)中心的遷移提供了一條更清晰(盡管未必完全無縫)的路徑。

為了了解 Strix Halo 與 Spark 的性能對比,惠普送來了Z2 Mini G1a工作站,以便我們能夠了解這些 TOPS 小型盒子在各種 AI 工作負載中的表現(xiàn),從單用戶和批量推理到微調(diào)和圖像生成。

系統(tǒng)概述


首先你會注意到,惠普這款產(chǎn)品比Spark大得多。部分原因是英偉達選擇了通過USB-C接口連接的外置電源適配器,而惠普則選擇了稍大一些的機箱,并將電源集成在了一起。

我們通常更喜歡惠普的做法,尤其是因為更大的機箱可以容納更強大的散熱解決方案,盡管 Spark 的做工和質(zhì)感明顯比另一款更勝一籌。

Spark 采用全金屬機身,兼具散熱功能;而 G1a 則更像是惠普的產(chǎn)品,其外觀簡潔,雖然外殼是塑料材質(zhì),但內(nèi)部卻是堅固的金屬機箱。這種設計理念的優(yōu)勢在于其便捷的維護性。打開 G1a 非常簡單,只需按下機器背面的按鈕,然后滑開頂蓋即可。

然而,由于這兩款機器都采用板載 LPDDR5x 內(nèi)存,因此實際上并沒有太多可做的改動?;萜者@款機器配備了兩個標準的 2280 PCIe 4.0 x4 M.2 固態(tài)硬盤,用戶可以自行更換。

相比之下,Spark 更像一臺家用電器,不過它的 SSD 也可以通過移除系統(tǒng)底部的磁性板和四個螺絲來更換。


機器內(nèi)部有兩個鼓風機,從前面吸入冷空氣,然后從后面排出。如果你好奇的話,G1a 的雙 M.2 SSD 就位于這些風扇的正下方,這應該可以防止它們在高負載下過熱。

在機器背面,我們可以看到惠普在 I/O 方面采用了與英偉達截然不同的方法。


從左到右,我們可以看到一個 2.5 GbE RJ45 接口、四個標準 USB 接口(2 個 10 Gbps,2 個 USB 2.0)、兩個 40 Gbps Thunderbolt 接口以及兩個 mini DisplayPort 接口。在機器側(cè)面,你會找到一個 3.5 毫米耳機/麥克風二合一接口和兩個額外的 10 Gbps USB 3.0 接口,分別采用標準 USB 和 USB-C 接口。

您還會注意到兩個空白區(qū)域,可以配置任意數(shù)量的 HP Flex IO 模塊,包括串行、USB 和千兆、2.5 GbE 或 10 GbE 端口。

與此同時,Spark 優(yōu)先考慮多節(jié)點 AI 計算環(huán)境的高速網(wǎng)絡連接。電源按鈕旁邊是四個 USB-C 端口,最左側(cè)的端口用于供電。顯示輸出方面,它配備了一個 HDMI 端口、一個 10GbE RJ45 網(wǎng)絡端口以及兩個 QSFP 模塊,通過系統(tǒng)板載的 ConnectX-7 網(wǎng)卡,可提供總計 200Gbps 的網(wǎng)絡帶寬。

這些端口旨在實現(xiàn)多個 Spark 或其他 GB10 系統(tǒng)的集群化,使用與數(shù)據(jù)中心相同的硬件和軟件。

據(jù)我們了解,您還可以將 G1a 的 Thunderbolt 端口用作高速網(wǎng)絡接口,將多個系統(tǒng)互連在一起,盡管我們無法測試這種使用場景。



需要說明的是,這兩款系統(tǒng)都不是各自芯片組中最便宜的選擇。DGX Spark 的零售價為 3,999 美元,而惠普 Z2 Mini G1a 的配置價格目前約為 2,950 美元。

如果你愿意在存儲、連接或 I/O 方面做出妥協(xié),你可以找到配置類似的 GB10 和 Strix Halo 盒子,價格要便宜得多。

惠普、華碩和其他一些廠商都有Spark的OEM版本,1TB存儲容量的起價約為3000美元。我們也見過售價略高于2000美元的128GB Strix Halo系統(tǒng),不過內(nèi)存短缺似乎推高了價格,而且你也會錯過一些企業(yè)級功能,例如“Pro”版本芯片提供的遠程管理或內(nèi)存加密。

所以,如果您對這兩款系統(tǒng)中的任何一款感興趣,但又覺得價格偏高,或許可以從其他廠商那里找到更優(yōu)惠的價格。就GB10系統(tǒng)而言,除了外觀之外,您并沒有損失太多,畢竟它只是廠商貼牌產(chǎn)品,而非創(chuàng)始版。

CPU性能

在我們深入探討生成式人工智能的性能(我們認為大多數(shù)人都會關心這一點)之前,我們想花點時間談談這些機器各自的 CPU。

Strix Halo 是一款相當有趣的處理器。與桌面級處理器類似,它擁有 16 個完整的 Zen 5 核心,分布在兩個核心復合體芯片 (CCD) 上,最高主頻可達 5.1 GHz。這些 CCD 通過先進的封裝技術與一個 I/O 芯片連接,該芯片負責內(nèi)存、PCIe 和圖形處理。

Z2 Mini G1a 實際上使用了 Pro 版本的芯片,增加了許多硬件安全和管理功能,這對于在批量或敏感環(huán)境中部署這些系統(tǒng)的企業(yè)來說可能很有吸引力。

與此同時,Spark 的 GB10 Grace Blackwell 超級芯片采用與聯(lián)發(fā)科合作開發(fā)的 Arm CPU 芯片,包含 10 個 X925 性能核心和 10 個 Cortex A725 能效核心,總共 20 個核心。

雖然這些核心的速度并不慢,但在我們有限的測試中,AMD 的 Zen 5 微架構(gòu)在我們的 Sysbench、7zip 壓縮/解壓縮和 HandBrake 轉(zhuǎn)碼工作負載中提供了 10% 到 15% 的性能提升。

然而,在代表眾多高性能計算工作負載的 Linpack 高性能基準測試中,G1a 的雙精度浮點運算性能是 Spark 的兩倍多,達到了 1.6 teraFLOPS,而 Spark 的雙精度浮點運算性能為 708 gigaFLOPS。需要注意的是,該成績僅使用 X925 核心獲得,啟用 A725 核心進行測試反而降低了性能,這表明性能可能還有提升空間。

雖然 GenAI 的性能很大程度上依賴于低精度 GPU 浮點運算能力,但 Strix Halo 更強大的 CPU 可能會使其成為那些尋求能夠運行 GenAI 模型的 PC 而不是 AI 設備的用戶的更靈活的選擇。

GenAI 性能

接下來我們來談談 GenAI,我們應該花點時間討論一下這兩個系統(tǒng)所宣稱的性能表現(xiàn)。

盡管英偉達聲稱其人工智能計算能力可達 petaFLOPS,但實際上大多數(shù)用戶永遠無法達到如此高的水平。原因很簡單:要達到如此高的性能,需要結(jié)構(gòu)化稀疏性,而這種特性對推理工作負載幾乎沒有任何益處。

因此,Spark 的峰值性能實際上更接近 500 teraFLOPS(稠密浮點運算/秒),而且僅適用于能夠利用 FP4 數(shù)據(jù)類型的工作負載。通常情況下,這意味著 Spark 實際上會以 8 位或 16 位精度運行,從而將峰值性能分別限制在 250 teraFLOPS 和 125 teraFLOPS。

持續(xù)性能通常會略低于理論值。在最大可達矩陣乘法浮點運算 (MAMF) 基準測試中,我們對 GB10 進行了測試,在 BF16 下達到了 101 teraFLOPS,在 FP8 下達到了 207 teraFLOPS。

那么,G1a 搭載的 Strix Halo 處理器表現(xiàn)如何呢?嗯,這里我們看到了 AMD 的一個最大弱點。雖然 AMD 聲稱其頂級 Strix Halo SKU 的平臺性能可達 126 TOPS,但你很難找到任何一款應用能夠充分利用這一性能。其中 50 TOPS 由 NPU 提供,而 NPU 需要專門的軟件才能發(fā)揮其性能——稍后會詳細介紹。剩余的 TOPS 則由 CPU 和 GPU 共同提供。

Strix Halo 的 GPU 性能不容小覷。據(jù)我們估計(AMD 并未公布該芯片的峰值浮點性能),這款 GPU 在《戰(zhàn)地16》中的峰值性能約為 56 萬億次浮點運算/秒 (teraFLOPS)。在 MAMF 測試中,我們達到了約 82% 的性能,即 46 萬億次浮點運算/秒,這同樣相當不錯。

但由于該 GPU 基于 AMD 較舊的 RDNA 3.5 架構(gòu),因此它不支持 Spark 提供的低精度數(shù)據(jù)類型。

從技術上講,該架構(gòu)確實支持 INT8,但性能與 BF16 基本相同。理論上,它應該能達到 112 TOPS 的 INT4 性能,但關鍵在于找到能夠以這種精度進行計算的軟件。16 個不同的值提供的粒度實在太小了。

從理論上講,這使得 Spark 在原始 AI 計算能力方面比 Strix Halo 具有 2.2-9 倍的性能優(yōu)勢。

雖然我們在測試中反復驗證了這一點,但計算能力只是 GenAI 的一個方面。另一個方面是內(nèi)存帶寬。根據(jù)您的使用場景,它甚至可能使 AMD 和 Nvidia 系統(tǒng)之間的性能差距變得無關緊要。

LLM推斷

我們將首先討論大型語言模型 (LLM) 推理,因為它恰恰說明了為什么更多的 TOPS 和 FLOPS 并不總是能轉(zhuǎn)化為更好的 AI 性能。

為了保持一致性,我們的大部分測試都在 Linux 系統(tǒng)下進行:HP 系統(tǒng)上運行的是 Ubuntu 24.04 LTS,Nvidia 系統(tǒng)上運行的是經(jīng)過輕微定制的發(fā)行版 DGX OS。


僅從 Llama.cpp(在消費級 CPU 和 GPU 上運行 LLM 的最流行框架之一)的單批處理性能來看,我們可以看到 GB10 和 Strix Halo 以類似的速度生成令牌,而 AMD 設備在使用 Vulkan 后端時略占優(yōu)勢。


在單用戶場景下,令牌生成通常會受到內(nèi)存帶寬的瓶頸限制。GB10 聲稱擁有約 273 GB/s 的內(nèi)存帶寬,而 AMD 的 Strix Halo 則擁有約 256 GB/s 的內(nèi)存帶寬。

這或許就是許多人工智能愛好者對Spark剛推出時如此失望的原因之一。只需三分之二到一半的價格,你就能買到一盒Strix Halo,它生產(chǎn)代幣的速度同樣驚人。

然而,如果您查看“首次輸入時間”這一列,就會發(fā)現(xiàn) GB10 的 GPU 速度大約是 Strix Halo 的 2-3 倍,而這僅僅是在處理相對較短的 256 個輸入框提示符時。隨著序列長度的增加,這種差距會更加明顯。這是因為提示符的處理往往很快就會達到計算瓶頸。

對于較短的提示或多回合對話,Llama.cpp 的提示緩存可以有效緩解這種性能不足。在這種情況下,在 AMD 平臺上我們只需要多等待一兩秒,考慮到 Strix Halo 較低的平均售價,那些只想在家運行 LLM 的用戶或許可以忽略這一點。

對于那些工作負載需要將大型文檔輸入模型上下文的用戶來說,Spark 更強大的 GPU 使其具有明顯的優(yōu)勢,但客戶需要權衡這一優(yōu)勢與其更高的價格之間的關系。

多批次性能

除了單批處理性能外,我們還測試了這兩臺機器在大批處理規(guī)模下的性能。用戶通常會將任務批量處理,例如從一堆文檔或電子郵件中提取信息,而不是按順序逐個處理。

在這種情況下,我們使用 vLLM,根據(jù)我們的經(jīng)驗,它比 Llama.cpp 更能優(yōu)雅地處理大批量和并發(fā)情況,而 Llama.cpp 則更適合單用戶應用程序。此外,我們還使用Qwen3-30B-A3B-Instruct-2507的原生 BF16 精度,以避免量化開銷。

為了檢驗機器的性能,我們讓它們處理 1,024 個令牌的輸入,并生成 1,024 個令牌的響應,批處理大小從 1 到 64 不等。


X 軸表示完成批處理作業(yè)所需的時間(以秒為單位),Y 軸表示每個批處理大小下每秒的總吞吐量(以令牌為單位)。

Spark 更快的圖形處理器再次使其在性能上超越了 G1a。雖然這顯然是 Spark 的優(yōu)勢,但除非你經(jīng)常運行批處理作業(yè),否則這種性能優(yōu)勢可能難以察覺,尤其是在你可以安排作業(yè)在夜間運行的情況下。批處理推理并非交互式操作,因此你可以輕松地離開,并在完成后再回來繼續(xù)。

微調(diào)

當我們使用微調(diào)技術通過向模型展示新信息來教會它們新技能時,情況也類似。

微調(diào)需要大量內(nèi)存,對于像 Mistral 7B 這樣的模型,可能需要高達 100 GB 的內(nèi)存。正如我們之前討論過的,LoRA 或 QLoRA 等技術可以顯著減少訓練模型所需的內(nèi)存。

Spark 和 G1a 這兩個平臺都提供高達 128 GB 的內(nèi)存,因此都非常適合這種工作負載,盡管它們的速度并不特別快。


運行 Meta 的 Llama 3.2 3B 完整微調(diào)版后,我們發(fā)現(xiàn) Spark 完成任務的時間大約是 G1a 的三分之二。然而,與 Radeon Pro W7900 或 RTX 6000 Ada 等工作站顯卡相比,后者不僅擁有更高的浮點運算性能,還配備了速度更快的 GDDR6 顯存,Spark 和 G1a 的性能則明顯遜色。

真正有趣的地方在于,當我們開始研究如何在大型模型上使用 QLoRA 時。通常情況下,要在家中對 Llama 3.1 70B 這樣的模型進行微調(diào),需要多張工作站顯卡。但由于它們擁有巨大的內(nèi)存占用,使用 AMD 或 Nvidia 的顯卡完全可以勝任這項工作。


使用相對較小的數(shù)據(jù)集(我們之前已經(jīng)證明,這種規(guī)模的數(shù)據(jù)集足以用來調(diào)整模型的風格),性能表現(xiàn)更符合預期。G1a 完成任務耗時 50 多分鐘,而 Spark 則只需 20 分鐘左右。

對于使用更大數(shù)據(jù)庫或 LoRA 排名的更大規(guī)模的微調(diào)作業(yè),這很容易延長到數(shù)小時甚至數(shù)天,從而使 Spark 的性能優(yōu)勢更加顯著。

但正如我們在多批次推理測試中討論的那樣,除非你經(jīng)常對模型進行微調(diào),否則 Spark 的更高性能可能并不值得付出比 HP、Minisforum、Framework 或任何其他迷你電腦供應商提供的類似配置的 Strix Halo 系統(tǒng)更高的價格。

圖像生成

Spark 的高性能優(yōu)勢在圖像和視頻生成工作負載方面尤為顯著。與微調(diào)類似,圖像生成也是一項對計算和內(nèi)存要求極高的工作負載,但通常不受帶寬限制。

部分原因是圖像模型不像線性模型那樣容易壓縮,否則會嚴重影響輸出質(zhì)量。因此,許多人更傾向于以原始精度運行這些模型,無論是 FP32、BF16 還是 FP8。


在 ComfyUI 中運行 Black Forest Lab 的 FLUX.1 Dev,我們的測試系統(tǒng)相對于其 16 位浮點性能,其擴展性幾乎完全符合預期。

Spark 的 BF16 性能分別為 120 和 125 teraFLOPS,與 AMD 的 Radeon Pro W7900 大致相當,同時比基于 Strix Halo 的 G1a 領先約 2.5 倍,G1a 在我們的測試中實現(xiàn)了約 46 teraFLOPS 的實際性能。

不言而喻,圖像生成顯然不是 Strix 盒子的強項。

那么NPU呢?

得益于AMD收購賽靈思(Xilinx),其Strix Halo APU也配備了性能相當不錯的神經(jīng)網(wǎng)絡處理單元(NPU)。這款XDNA 2 NPU能夠額外提供50 TOPS的AI性能。當然,關鍵在于找到能夠充分利用其性能的軟件。大多數(shù)NPU應用場景都集中在降低音頻和視頻降噪、背景虛化以及光學字符識別等功能的功耗上。

然而,AMD和其他公司已經(jīng)開始利用NPU進行生成式AI應用,但效果參差不齊。得益于Lemonade Server等應用,現(xiàn)在可以完全在NPU上運行LLM(邏輯邏輯模型)。除非你是為了節(jié)省電能,否則目前可能還不需要這樣做。

截至撰稿時,模型支持較為有限,而且NPU似乎無法充分利用GPU的250 GB/s內(nèi)存帶寬。在Windows系統(tǒng)下,我們在NPU上運行Mistral 7B模型時,觀察到解碼性能僅為4-5 tok/s,而我們預期應該接近40 tok/s。

然而,AMD 顯然在力推解耦推理的概念,即將計算密集型的提示處理卸載到 NPU,而將內(nèi)存帶寬密集型的解碼階段則由 GPU 處理。性能有所提升,但仍然不如直接在 GPU 上運行模型。

這種分散式設計對于功耗受限的筆記本電腦來說非常合理,但對于像G1a這樣的臺式機系統(tǒng)來說則不太適用。話雖如此,我們?nèi)匀缓芟肟纯碅MD接下來會如何發(fā)展這項技術。

我們還成功地在Amuse(一款對初學者友好的圖像生成軟件)中運行了 NPU。AMD 最近為 NPU 添加了對直接運行 Stable Diffusion 3 模型的支持,在這種情況下,性能實際上比在 GPU 上運行相同的模型要好得多。


在 NPU 上運行,Amuse 能夠在短短一分多鐘內(nèi)用 20 個步驟生成 1,024 x 1,024 的圖像,而在 GPU 上運行同樣的測試則需要大約兩倍的時間。

需要指出的是,目前該集成功能相當有限,僅在初級模式下且性能滑塊設置為“平衡”時可用。切換到“專家模式”會禁用NPU,強制模型在圖形處理器上運行。

此次集成也僅限于穩(wěn)定擴散3(Stable Diffusion 3),該技術如今已略顯老舊,畢竟它發(fā)布至今已超過一年。不過,很高興看到越來越多的應用程序利用NPU實現(xiàn)除視頻通話背景虛化之外的其他功能。

英偉達的CUDA護城河正在變淺

在 AMD 和 Nvidia 的任何比較中,經(jīng)常出現(xiàn)的一個賣點是軟件兼容性,也就是 CUDA 護城河。

雖然幾乎所有基于 CUDA 的軟件都可以在 Spark 上毫無問題地運行,但這在基于 Strix Halo 的 G1a 上并不能得到保證。

CUDA 近二十年的發(fā)展歷程不容忽視,但盡管 AMD 在 ROCm 和 HIP 庫的軟件支持方面一直落后于其他公司,但該公司在最近幾個月取得了顯著進展。

一年前,我們遇到了很多棘手的問題,比如一些庫要么根本找不到,要么依賴于專門為 AMD 基于 CDNA 的數(shù)據(jù)中心芯片開發(fā)的衍生版本,這意味著它們無法在消費級平臺上運行。如今,這個問題已經(jīng)大大緩解。事實上,我們的大部分 PyTorch 測試腳本無需修改即可在 AMD 平臺上運行。但是,如果說體驗能像在 Spark 上那樣流暢,那就太虛偽了。

很多軟件都可以在AMD的消費級硬件上運行,但這并非總是像直接運行程序那么簡單pip install xyz-package。我們?nèi)匀恍枰啻螐脑创a構(gòu)建庫,或者使用專門為Radeon GPU制作的分支版本——vLLM、BitsandBytes和Flash Attention 2只是其中的幾個例子。

在許多情況下,尤其是在使用更貼近硬件的軟件時,軟件需要針對特定一代的Radeon顯卡進行編譯。Llama.cpp就是一個例子,我們需要針對特定gfx1151目標進行編譯才能使軟件運行。

無論使用哪個平臺,處理這些依賴項都不是一件容易的事,因此很高興看到 AMD 和 Nvidia 提供了預配置好的 Docker 容器,其中包含了您快速上手所需的一切。在我們的 vLLM 測試中,我們同時使用了紅隊和綠隊的 vLLM Docker 容器,以確保獲得最佳性能。

或許我們面臨的最大軟件挑戰(zhàn)并非軟件本身的問題。Strix Halo 基于 AMD 較老的 RDNA 3.5 架構(gòu),這意味著它不支持 Spark Blackwell GPU 提供的許多低精度數(shù)據(jù)類型。因此,我們經(jīng)常被迫以 16 位精度運行模型,即使 FP8 或 FP4 更為理想。

AMD 的 RDNA 4 架構(gòu)通過增加對稀疏性和 FP8 的支持,應該可以解決部分問題。然而,由于 MXFP4 等微縮數(shù)據(jù)類型占用內(nèi)存更小、有效范圍更廣,目前業(yè)界正轉(zhuǎn)向這些類型。

盡管 AMD 正在迅速縮小差距,但英偉達在硬件和軟件方面仍然保持著顯著的領先優(yōu)勢。

你們一直期待的答案來了


我們知道你們肯定會問。是的,這兩臺電腦都能運行《孤島危機》。

在 1440p 分辨率、中等畫質(zhì)下,《孤島危機:重制版》在 G1a 上能達到非常不錯的 90-100 幀。這并不令人意外,因為惠普這款筆記本采用的是 x86 CPU 和來自一家在圖形處理領域擁有悠久歷史的公司的 GPU。

由于 GB10 采用的是 Arm CPU,而 Arm CPU 不支持 32 位指令集,因此在 DGX Spark 上運行這款游戲稍微復雜一些。好在我們最終借助名為 FEX 的工具成功運行了游戲。如果您感興趣,可以在這里找到我們使用的安裝腳本。

遺憾的是,我們無法在Spark上啟用Steam性能顯示,這意味著我們無法獲得具體的性能指標。在中等畫質(zhì)設置下,即使不使用Nvidia的AI圖像增強技術(實際上該技術在游戲中也有效),游戲也能流暢運行。

雖然你可以在 Spark 或其他 GB10 系統(tǒng)上運行游戲,但我們不確定是否會推薦它而不是 Strix Halo 主機或市面上許多更便宜的游戲 PC。

總結(jié)

哪種系統(tǒng)更適合您,實際上取決于您想要一臺專門用于人工智能的機器,還是一臺恰好能夠運行您可能遇到的大多數(shù)人工智能工作負載的電腦。

我們懷疑,看到這里的大部分人可能都屬于后一種情況。如果你打算花2000到4000美元買一臺新電腦,我們認為期望它能做好不止一件事并不過分。


在這方面,惠普的 Z2 Mini G1a 是市面上比較好的選擇之一,尤其適合那些主要關注單批次 LLM 推理而非微調(diào)或圖像生成的用戶。AMD 的 Strix Halo SoC 的計算能力可能不如英偉達的 GB10 系列,但它運行 Windows 和 Linux 系統(tǒng)都很流暢,而且無需任何額外設置即可暢玩您喜愛的游戲。

盡管性能存在差距,但對于為不斷增長的 AI PC 領域構(gòu)建應用程序的軟件工程師來說,即使沒有其他原因,基于 AMD 的系統(tǒng)仍然可能是更好的開發(fā)平臺,原因僅僅是微軟的 NPU 強制要求。

但對于那些真正想要一臺用于原型代理、微調(diào)模型或生成文本、圖像和視頻內(nèi)容的 AI 設備的人來說,Spark 或其 GB10 系列兄弟產(chǎn)品可能是更好的選擇,前提是你能接受它的售價。

在我們的測試中,這臺機器的性能始終比基于 AMD 的 HP 系統(tǒng)高出 2-3 倍,同時還受益于更加成熟活躍的軟件生態(tài)系統(tǒng)。正如我們所展示的,在緊急情況下,您也可以在 Spark 上運行非 AI 工作負載,但這并非它的設計初衷。Spark 的本質(zhì)是一個開箱即用的 AI 實驗室,最適合作為 AI 實驗室使用。

https://www.theregister.com/2025/12/25/amd_strix_halo_nvidia_spark/

(來源:編譯自theregister)

*免責聲明:本文由作者原創(chuàng)。文章內(nèi)容系作者個人觀點,半導體行業(yè)觀察轉(zhuǎn)載僅為了傳達一種不同的觀點,不代表半導體行業(yè)觀察對該觀點贊同或支持,如果有任何異議,歡迎聯(lián)系半導體行業(yè)觀察。

今天是《半導體行業(yè)觀察》為您分享的第4268期內(nèi)容,歡迎關注。

加星標??第一時間看推送,小號防走丟



求推薦


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
西安男子電梯墜亡細節(jié):從十幾層踩空,前兩天小孩被困,剛做保養(yǎng)

西安男子電梯墜亡細節(jié):從十幾層踩空,前兩天小孩被困,剛做保養(yǎng)

鋭娛之樂
2025-12-28 13:49:32
決定臺灣命運的大事將發(fā)生,美媒:若不在談判桌上,那就在桌子上

決定臺灣命運的大事將發(fā)生,美媒:若不在談判桌上,那就在桌子上

諦聽骨語本尊
2025-12-28 18:06:14
宇樹機器人同步模仿測試,突然給工程師送上“惡毒”一腳,馬斯克評論表情亮了

宇樹機器人同步模仿測試,突然給工程師送上“惡毒”一腳,馬斯克評論表情亮了

極目新聞
2025-12-28 10:36:32
有救了!青島海牛獲嶗山可樂4500萬贊助,下賽季不擔心降級了

有救了!青島海牛獲嶗山可樂4500萬贊助,下賽季不擔心降級了

許釔很機智
2025-12-28 16:01:56
浙江天氣:升溫后迎強冷空氣

浙江天氣:升溫后迎強冷空氣

財聞
2025-12-28 17:09:19
他無顯赫出身,靠4任妻子成為知名人物,活到97歲

他無顯赫出身,靠4任妻子成為知名人物,活到97歲

古書記史
2025-12-19 18:18:41
國家發(fā)改委:2026年春節(jié)放假9天并減少調(diào)休!元旦動車/城際有新調(diào)整→

國家發(fā)改委:2026年春節(jié)放假9天并減少調(diào)休!元旦動車/城際有新調(diào)整→

城事特搜
2025-12-27 18:38:10
雙城論壇︱與龔正會面,蔣萬安:只要有心交流,兩岸距離一定不遠

雙城論壇︱與龔正會面,蔣萬安:只要有心交流,兩岸距離一定不遠

星島記事
2025-12-28 15:20:48
壽司店背后的秘密:ICE突襲亞州華人餐廳,揭出數(shù)十人“無休囚籠”

壽司店背后的秘密:ICE突襲亞州華人餐廳,揭出數(shù)十人“無休囚籠”

最英國
2025-12-27 18:09:47
突發(fā)!西部知名地產(chǎn)集團停擺了!

突發(fā)!西部知名地產(chǎn)集團停擺了!

黯泉
2025-12-28 14:42:43
姜昆風波事態(tài)升級,具體行程被扒出,當事人曝視頻并不是拼接

姜昆風波事態(tài)升級,具體行程被扒出,當事人曝視頻并不是拼接

凡知
2025-12-27 17:31:13
6000萬元理財,牛市9個月虧逾80%,圣元環(huán)保:未能第一時間識別作假,實控人父子承諾兜底!記者實探涉事私募公司

6000萬元理財,牛市9個月虧逾80%,圣元環(huán)保:未能第一時間識別作假,實控人父子承諾兜底!記者實探涉事私募公司

每日經(jīng)濟新聞
2025-12-27 22:53:06
如果沒有網(wǎng)絡,我們根本不知道

如果沒有網(wǎng)絡,我們根本不知道

報人劉亞東
2025-12-28 13:41:06
慘遭阿斯頓維拉逆轉(zhuǎn)后,切爾西已決意放棄這位評分5分的水貨球員

慘遭阿斯頓維拉逆轉(zhuǎn)后,切爾西已決意放棄這位評分5分的水貨球員

林子說事
2025-12-28 08:27:07
日本的第二大強援出現(xiàn)!高市早苗拍板,要在中國周邊打造一張巨網(wǎng)

日本的第二大強援出現(xiàn)!高市早苗拍板,要在中國周邊打造一張巨網(wǎng)

時時有聊
2025-12-28 12:23:00
女朋友是體育生是什么體驗?網(wǎng)友:第二天下不來床

女朋友是體育生是什么體驗?網(wǎng)友:第二天下不來床

帶你感受人間冷暖
2025-11-06 00:20:05
存款達標線曝光!這個數(shù)就能碾壓 98% 家庭,你拖后腿了嗎?

存款達標線曝光!這個數(shù)就能碾壓 98% 家庭,你拖后腿了嗎?

復轉(zhuǎn)這些年
2025-12-27 23:47:51
接近零興趣!普京明確表態(tài),俄方不再期待烏軍主動撤出頓巴斯!

接近零興趣!普京明確表態(tài),俄方不再期待烏軍主動撤出頓巴斯!

墨史軒
2025-12-28 17:02:57
搞笑,字母哥在垃圾時間一記風車扣籃引發(fā)公牛隊不滿,賽后沖突

搞笑,字母哥在垃圾時間一記風車扣籃引發(fā)公牛隊不滿,賽后沖突

好火子
2025-12-28 12:34:59
真相大白!王曼昱傷情曝光,2天傷了2個核心,王勵勤要“動手”了

真相大白!王曼昱傷情曝光,2天傷了2個核心,王勵勤要“動手”了

體育就你秀
2025-12-28 18:04:52
2025-12-28 19:32:49
半導體行業(yè)觀察 incentive-icons
半導體行業(yè)觀察
專注觀察全球半導體行業(yè)資訊
12566文章數(shù) 34734關注度
往期回顧 全部

數(shù)碼要聞

AM4老兵不死:銳龍7 5800X登上銷量榜首!前十有4款是AM4

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當過2年幼兒園老師

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車了

財經(jīng)要聞

英偉達的收購史

科技要聞

特斯拉將在華布局自動駕駛?記者求證→

汽車要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

親子
旅游
藝術
房產(chǎn)
數(shù)碼

親子要聞

千萬別把孩子,養(yǎng)成這種“奴隸”?

旅游要聞

【直播】元旦游上海,黃浦普陀專場:黃浦新年三重奏?普陀“半馬蘇河”,靈!

藝術要聞

郭沫若為何輸給康生?只因后者練過一部“百億法帖”,內(nèi)藏古人秘法

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

數(shù)碼要聞

華為FreeClip 2耳夾耳機通過星閃認證,有望近期OTA星閃音頻

無障礙瀏覽 進入關懷版