国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

英偉達(dá)正在封裝世界

0
分享至


出品|虎嗅科技組

作者|陳伊凡

編輯|苗正卿

頭圖|視覺中國

剛結(jié)束的GTC上,英偉達(dá)傳遞出的一個關(guān)鍵信號是,其在不斷深化芯片提供商向AI基礎(chǔ)設(shè)施系統(tǒng)提供商的角色轉(zhuǎn)變。

英偉達(dá)正在封裝AI算力層面的基礎(chǔ)設(shè)施?!表f豪創(chuàng)芯創(chuàng)始合伙人王智表示,程序編寫的方式從與硬件高度耦合的機(jī)器語言到匯編語言、到接近自然語言的高級程序語言、再到Windows的GUI、進(jìn)一步出現(xiàn)面向?qū)ο蟮木幊?.....直到用Python這樣主要引用“庫”的“膠水語言”,軟件世界經(jīng)歷了一個不斷將邏輯和功能高度抽象化和封裝的過程,而英偉達(dá)正在AI算力基礎(chǔ)設(shè)施世界展示同樣的故事。

王智解釋,這種高度封裝的好處是,客戶規(guī)避了對復(fù)雜系統(tǒng)中基礎(chǔ)組件的“手搓”式采購和測試,而是可以搭積木,以樂高的方式搭建。英偉達(dá)在將這種封裝不斷擴(kuò)散。

二十年前,英偉達(dá)的殺手锏是CUDA。它不只是一套編程框架,而是一個讓開發(fā)者只管寫算法、不用操心底層硬件的抽象層。CUDA的護(hù)城河不是代碼,是二十年來積累的數(shù)億裝機(jī)量、數(shù)十萬開源項目、以及所有在這套生態(tài)里長大的工程師。

但CUDA只是封裝的第一層,這篇文章要回答的三個問題:

英偉達(dá)的token分層定價,意味著什么?

收購Groq、發(fā)布專用CPU。英偉達(dá)在建立一個比CUDA更大的帝國,這個帝國長什么樣?

當(dāng)這個帝國的邊界不斷擴(kuò)張,創(chuàng)業(yè)公司還有沒有活路?窗口在哪里?

Token分層定價:封裝的結(jié)果

token正在變成大宗商品。

這是黃仁勛在演講中拋出的核心觀點。

封裝的終點,是讓復(fù)雜的東西消失在視野之外。當(dāng)芯片、系統(tǒng)、調(diào)度軟件被一層層封裝起來,用戶感知不到GPU,感知不到算力,感知到的只剩一個單位:token。token是封裝完成之后,唯一暴露在外的接口。它變成大宗商品,是封裝的必然結(jié)果,不是偶然。

黃仁勛在演講中明確說了這句話:“Tokens are the new commodity”(Token是新的大宗商品)。大宗商品成熟之后會自然分層。他不是在描述現(xiàn)狀,他是在預(yù)判一個市場結(jié)構(gòu),然后把英偉達(dá)的硬件產(chǎn)品線,精確地鋪在這個結(jié)構(gòu)的每一層上。

GTC 2026上,英偉達(dá)推出了五層Token定價體系:免費層、中級層、高級層、高速層和超高速層,對應(yīng)不同的token量。

這正如當(dāng)年電信行業(yè)基本沒干成的理想,也就是對數(shù)據(jù)流量進(jìn)行差異化定價。背后是一個更深層的趨勢:算力需求的精細(xì)化。越是嚴(yán)肅的場景,對幻覺的容忍度越低;量化交易這種場景,需要的是微秒級的反應(yīng);自動駕駛和某些具身智能場景需要毫秒級以內(nèi)的反饋速度,還得更快。不同場景的指標(biāo)要求完全不同。

早期的AI應(yīng)用是無差異的,一臺GPU、一套推理框架,所有請求排隊處理。但當(dāng)AI真正進(jìn)入工商業(yè)場景,這種大水漫灌式的供給就開始失效。一家醫(yī)院的影像輔助診斷要的是準(zhǔn)確率,一筆高頻交易要的是微秒級延遲,一個工廠流水線上的實時質(zhì)檢要的是穩(wěn)定吞吐。

算力精細(xì)化的本質(zhì),是讓不同質(zhì)量的算力服務(wù)找到真正需要它的場景。

但這只是表面的邏輯。更深層的,是需求側(cè)的一場根本性變化。從原來的人機(jī)交互,變?yōu)锳gent-to-Agent交互,Agent把token需求從線性變成了指數(shù),人用token是對話,使用量很有限;機(jī)器用token是工作流,單位時間消耗量是人的倍數(shù)。

這種變化已經(jīng)可以在數(shù)據(jù)里看到。今年春節(jié)前后,國內(nèi)大模型的流量出現(xiàn)了異常暴漲。那是國外很多公司在在降本——它們的Agent大量調(diào)用AI接口,而國內(nèi)模型更便宜(因為中國的電便宜),于是悄悄切換了,變相助力了中國模型和token的出海。

英偉達(dá)在建立一個比CUDA更大的帝國

封裝意味著綁定。從GPU到系統(tǒng),從系統(tǒng)到token經(jīng)濟(jì)規(guī)則,英偉達(dá)每封裝一層,外部的替代成本就高一個量級,這也是英偉達(dá)為何要把封裝不斷加深的原因——你會越來越討厭他,但你會越來越離不開他。

過去幾年,這套封裝在訓(xùn)練側(cè)的護(hù)城河是CUDA。但在推理側(cè),CUDA的優(yōu)勢從來沒有那么明顯。

原因在于訓(xùn)練和推理的計算邏輯根本不同。GPU是并行計算的機(jī)器,擅長同時處理成千上萬個相同的操作,這正是訓(xùn)練神經(jīng)網(wǎng)絡(luò)所需要的。CUDA是駕馭GPU的語言,二十年的生態(tài)積累讓它無可替代。但推理不是這樣工作的:推理要的不是并行的暴力計算,而是低延時、快響應(yīng)、靈活的任務(wù)調(diào)度。GPU做推理,就像用一輛大卡車去跑快遞,力氣有余,靈活不足。

過去兩年,很多人盯著這個裂縫,覺得推理側(cè)是繞開CUDA、挑戰(zhàn)英偉達(dá)的窗口。

CPU同理,GPU負(fù)責(zé)算,CPU負(fù)責(zé)管。GPU是工廠的流水線,負(fù)責(zé)大規(guī)模并行運算;CPU是工廠的調(diào)度室,負(fù)責(zé)決定任務(wù)的順序、工具的調(diào)用、數(shù)據(jù)的流向。在AI推理場景里,一個Agent接到任務(wù)后,要決定先調(diào)用哪個工具、再調(diào)用哪個模型、結(jié)果怎么傳遞——這些控制流的工作,恰恰是CPU的主場。

英偉達(dá)之前也并非沒有CPU,只是沒有那么強(qiáng)。

但這一次,黃仁勛明確提出,今年是英偉達(dá)的推理年。過去幾年,隨著模型深入現(xiàn)實世界,推理的需求開始爆發(fā)。推理硬件已被提升到核心地位。

英偉達(dá)的首席科學(xué)家Bill Dally在一次對話中提到,訓(xùn)練更吃內(nèi)存容量,而推理則考驗計算、內(nèi)存帶寬、容量和通信之間的資源配比。他表示,推理內(nèi)部也存在差異。比如預(yù)填充(Prefill)階段更像訓(xùn)練:一次性處理大量數(shù)據(jù),屬于密集計算型,受通信能耗主導(dǎo)。而到了解碼(Decode)階段,為了優(yōu)化延遲,你通常在做極瘦矩陣運算,這會變成極端的帶寬受限和延遲受限。

Bill Dally提出了一個預(yù)判,未來至少會分化出三類硬件:一類針對訓(xùn)練和預(yù)填充,一類針對解碼,而解碼類硬件內(nèi)部甚至還會進(jìn)一步細(xì)分。

英偉達(dá)宣布了和芯片廠商Groq的整合。訓(xùn)練是計算密集型,HBM(高帶寬內(nèi)存)是最優(yōu)解;推理是存儲密集型,需要的是低延時、大容量的快速存儲。Groq的LPU正是為此而生:基于SRAM,片上集成,速度遠(yuǎn)快于DRAM,極低延時。

同時英偉達(dá)發(fā)布了新的CPU,這款CPU專門為算力中心優(yōu)化設(shè)計,放到其他場景反而不合適,跟英特爾打的不是同一場仗。但顯然,英偉達(dá),正在構(gòu)筑一個比CUDA更大的帝國。

王智說,英偉達(dá)正在成為算力時代的蘋果,芯片自己做,操作系統(tǒng)自己做,硬件自己做,應(yīng)用自己控制。只不過耦合比蘋果更復(fù)雜。

創(chuàng)業(yè)公司的機(jī)會還有嗎

所有人都在問同一個問題:英偉達(dá)的帝國在擴(kuò)大,推理市場也被它納入版圖,創(chuàng)業(yè)公司還有活路嗎?

關(guān)鍵在于,英偉達(dá)不會做所有的事,它的強(qiáng)項是系統(tǒng)級、規(guī)?;慕桓?,是面向數(shù)據(jù)中心的整體解決方案。而邊緣場景和中等定制化場景的特點恰恰相反:和特定場景高度綁定,需要定制化能力。一個工廠的質(zhì)檢攝像頭、一輛自動駕駛汽車的車載芯片、一個手術(shù)機(jī)器人的感知模塊——這些邊緣側(cè)場景對計算的需求是高度定制化和異構(gòu)的。

這里就是可重構(gòu)計算的機(jī)會所在??芍貥?gòu)計算解決的是一個根本矛盾:通用芯片效率低,專用芯片太死板。如果我們拿流水線的工人做類比,普通芯片就像流水線工人,招進(jìn)來只會擰螺絲,讓他去焊接?不會,得重新招人。CPU像萬能工人,什么都能干,但什么都干得不夠快??芍貥?gòu)芯片呢,它像一個可以反復(fù)“回爐培訓(xùn)”的工人,今天把他訓(xùn)練成焊接工,明天把他重新訓(xùn)練成噴漆工,后天再訓(xùn)練成質(zhì)檢員。人沒換,但技能跟著任務(wù)走,每次都能以"專業(yè)工人"的效率干活。AI時代的問題是,任務(wù)今天是這個模型、明天是那個模型,總不能每換一個任務(wù)就重新招一批專業(yè)工人。

可重構(gòu)計算也是中國半導(dǎo)體領(lǐng)域少數(shù)幾個與國際差距相對較小的方向之一。

王智最近在看一些可重構(gòu)計算的公司,成本更低,部署更快,適合中等程度的定制場景。

那么推理是否還有機(jī)會?王智認(rèn)為,推理領(lǐng)域?qū)儆谀壳皣鴥?nèi)剛上市(岸)的頭部算力芯片公司的機(jī)會。推理側(cè)的需求剛剛開始爆發(fā),場景綁定的特性也給了差異化的可能。但他同時說,這也是很大的挑戰(zhàn),抓不住,就很難走到下一個階段。

判斷一個公司是否抓住了機(jī)會,他給了一個具體標(biāo)準(zhǔn):是不是足夠快地認(rèn)清推理才是重點,而不是繼續(xù)把資源押在為了上市而做的、跟隨英偉達(dá)的訓(xùn)練芯片路線上。

這個標(biāo)準(zhǔn)比看起來更苛刻。許多已經(jīng)上市或臨近上市的國內(nèi)芯片公司,此前的商業(yè)邏輯是:做一款"夠用"的訓(xùn)練芯片,講一個替代英偉達(dá)的故事,完成上市。而新的邏輯需要他們放棄路徑依賴,基于中國豐富的應(yīng)用場景重新建立產(chǎn)品定義和客戶關(guān)系。

總之,領(lǐng)先者的優(yōu)勢越來越明顯,錢、技術(shù)團(tuán)隊、客戶綁定……剩下的機(jī)會不多了。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4844267.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
界面調(diào)查|一位“90后”網(wǎng)約車司機(jī)之死:被騙網(wǎng)貸、被催債和致命的絕望

界面調(diào)查|一位“90后”網(wǎng)約車司機(jī)之死:被騙網(wǎng)貸、被催債和致命的絕望

界面新聞
2026-03-29 10:33:24
日本爆發(fā)抗議:高市道歉!小泉道歉!中國對不起!

日本爆發(fā)抗議:高市道歉!小泉道歉!中國對不起!

觀威海
2026-03-29 12:43:40
不到24小時局勢突變!伊朗剛制定停戰(zhàn)條件,美國就空襲伊朗核設(shè)施

不到24小時局勢突變!伊朗剛制定停戰(zhàn)條件,美國就空襲伊朗核設(shè)施

軍機(jī)Talk
2026-03-28 23:03:54
中美俄石油儲量對比:俄800億桶,美國超700億桶,中國有多少?

中美俄石油儲量對比:俄800億桶,美國超700億桶,中國有多少?

共工之錨
2026-03-28 20:15:22
國家一級女演員陳麗云被逮捕!

國家一級女演員陳麗云被逮捕!

許三歲
2026-03-28 09:24:30
香港頂級富二代共進(jìn)早餐,何超瓊李澤楷坐中間,霍啟剛鄭志雯也在

香港頂級富二代共進(jìn)早餐,何超瓊李澤楷坐中間,霍啟剛鄭志雯也在

八斗小先生
2026-03-29 11:40:18
殲20總設(shè)計師被除名:頂頭上司受賄7億判死緩,事發(fā)全過程被還原

殲20總設(shè)計師被除名:頂頭上司受賄7億判死緩,事發(fā)全過程被還原

博士觀察
2026-03-28 21:02:35
北京戶口也有今天?丫挺燥啊

北京戶口也有今天?丫挺燥啊

阿亮評論
2026-03-29 10:52:52
沙特油輪繞開霍爾木茲抵達(dá)日本:世界油閥,被一腳踹開了!

沙特油輪繞開霍爾木茲抵達(dá)日本:世界油閥,被一腳踹開了!

老馬拉車莫少裝
2026-03-29 11:19:25
震驚!網(wǎng)傳武漢一酒店2205房,公示多位知名藝人曾入住,引發(fā)熱議

震驚!網(wǎng)傳武漢一酒店2205房,公示多位知名藝人曾入住,引發(fā)熱議

火山詩話
2026-03-28 07:30:57
日本1-0蘇格蘭!熱身賽4連勝 伊東純也替補(bǔ)絕殺 3天后過招英格蘭

日本1-0蘇格蘭!熱身賽4連勝 伊東純也替補(bǔ)絕殺 3天后過招英格蘭

我愛英超
2026-03-29 05:50:02
以軍稱打擊伊朗的臨時指揮中心

以軍稱打擊伊朗的臨時指揮中心

界面新聞
2026-03-29 13:35:01
漢馬驚現(xiàn)“腿精天花板”!網(wǎng)傳195cm,本人:我才186,別夸張!

漢馬驚現(xiàn)“腿精天花板”!網(wǎng)傳195cm,本人:我才186,別夸張!

觀察鑒娛
2026-03-29 09:41:19
韓國歌手暴雨中濕透仍全開麥,這照片直接封神了!

韓國歌手暴雨中濕透仍全開麥,這照片直接封神了!

東方不敗然多多
2026-03-29 01:08:36
伊朗突襲成功!美國被打懵,遭開戰(zhàn)最大重創(chuàng)!

伊朗突襲成功!美國被打懵,遭開戰(zhàn)最大重創(chuàng)!

大嘴說天下
2026-03-28 19:30:43
俄羅斯:擬自4月1日起禁止汽油出口 優(yōu)先保障俄國內(nèi)市場供應(yīng)

俄羅斯:擬自4月1日起禁止汽油出口 優(yōu)先保障俄國內(nèi)市場供應(yīng)

每日經(jīng)濟(jì)新聞
2026-03-28 18:40:36
孕婦做陰超下體被男醫(yī)生看光,丈夫大鬧醫(yī)院尋死,現(xiàn)場畫面太鬧心

孕婦做陰超下體被男醫(yī)生看光,丈夫大鬧醫(yī)院尋死,現(xiàn)場畫面太鬧心

潮鹿逐夢
2026-03-28 10:59:56
恥辱?韓國男足千場里程碑吞0-4!韓媒震驚:3后衛(wèi)防線崩潰+災(zāi)難

恥辱?韓國男足千場里程碑吞0-4!韓媒震驚:3后衛(wèi)防線崩潰+災(zāi)難

我愛英超
2026-03-29 06:18:23
伊朗女孩這場模仿秀,比任何抗議都狠

伊朗女孩這場模仿秀,比任何抗議都狠

老馬拉車莫少裝
2026-03-27 22:59:05
半夜偷家!300萬比亞迪車主一覺醒來,高德說沒就沒了

半夜偷家!300萬比亞迪車主一覺醒來,高德說沒就沒了

華庭講美食
2026-03-29 10:11:32
2026-03-29 13:59:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
26002文章數(shù) 687637關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

網(wǎng)約車司機(jī)被騙網(wǎng)貸后車內(nèi)輕生:我不想死 但扛不住了

頭條要聞

網(wǎng)約車司機(jī)被騙網(wǎng)貸后車內(nèi)輕生:我不想死 但扛不住了

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂要聞

張凌赫事件持續(xù)升級!官方點名怒批

財經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

家居
手機(jī)
房產(chǎn)
本地
親子

家居要聞

曲線華爾茲 現(xiàn)代簡約

手機(jī)要聞

華為何剛預(yù)告小藝Claw新特性,可推每日健康報告、制定運動計劃

房產(chǎn)要聞

首日430組來訪,單日120組認(rèn)籌!??谑讉€真四代,徹底爆了!

本地新聞

在濰坊待了三天,沒遇到一個“濰坊人”

親子要聞

睡著的兩個姐妹,不安分的小樣,媽媽在旁邊心被萌化!

無障礙瀏覽 進(jìn)入關(guān)懷版