国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

對話知存科技CEO王紹迪:存算一體如何重塑AI計算的未來

0
分享至

當(dāng)大模型時代呼嘯而來,算力成為制約 AI 發(fā)展的關(guān)鍵瓶頸。傳統(tǒng)的馮·諾依曼架構(gòu)中,數(shù)據(jù)在存儲單元和計算單元之間頻繁“搬運”,不僅耗費時間,更消耗了 60% 至 90% 的無用功耗,形成了難以逾越的“存儲墻”和“功耗墻”。

存算一體技術(shù)正是為破解這一困局而生。它將計算與存儲融合在一起,讓數(shù)據(jù)在存儲單元內(nèi)部就近完成計算,從根本上解決了數(shù)據(jù)搬運的問題。2024 年,隨著三星與 SK 海力士推動 LPDDR6-PIM 技術(shù)標(biāo)準(zhǔn)化,以及多款存算一體 AI 芯片相繼出貨,這一技術(shù)正加速從實驗室走向產(chǎn)業(yè)應(yīng)用。據(jù)預(yù)測,2025 年全球存算一體芯片市場規(guī)模將突破 120 億美元,中國占比達 30%。

在這一賽道上,知存科技是最早入局、堅持最久的玩家之一。2017 年,創(chuàng)始人王紹迪博士畢業(yè)后回國創(chuàng)業(yè),帶領(lǐng)團隊實現(xiàn)了存算一體芯片的量產(chǎn),產(chǎn)品已應(yīng)用于二十多款消費電子產(chǎn)品。2025 年 9 月,知存科技入選《麻省理工科技評論》年度“50 家聰明公司”,他們的上榜理由是“突破傳統(tǒng)芯片存儲與計算分離的架構(gòu),在能效、計算并行度、功耗等多個維度獲得顯著提升”。

本期對話,我們與王紹迪博士深入探討存算一體技術(shù)的原理與前景,從內(nèi)存漲價的底層邏輯,到端側(cè)大模型的算力困局,再到 AI 時代芯片產(chǎn)業(yè)的競爭格局,試圖勾勒出一幅由高效算力驅(qū)動的智能未來圖景。

以下是對話正文:

DeepTech:歡迎王紹迪博士做客 DeepTalk,能否先簡單介紹一下自己和知存科技?

王紹迪:我是知存科技的創(chuàng)始人兼 CEO。公司 2017 年底成立,到現(xiàn)在已經(jīng)八年了,時間過得很快。知存和我一直專注在存算一體芯片這個賽道,應(yīng)該是這個領(lǐng)域中最早做的,也是堅持到現(xiàn)在最久的。目前在這個領(lǐng)域做得還算領(lǐng)先,也有一定的成果。

DeepTech:了解到你博士學(xué)的并不是存算一體,創(chuàng)業(yè)時為什么選擇這個賽道?

王紹迪:存算一體在我博士剛開始的時候,也就是 2011 年,其實既沒有 AI 也沒有存算一體這個概念。那時候深度學(xué)習(xí)還沒火,AlexNet 這些卷積神經(jīng)網(wǎng)絡(luò)是 2012 年左右才開始受關(guān)注。但到我博士快畢業(yè)時,AI 已經(jīng)很熱門了,雖然還沒落地到產(chǎn)業(yè)界,但大家都預(yù)測未來會是 AI 的時代。

我博士期間從 2014 年開始做了很多跟存儲器有關(guān)的工作?飚厴I(yè)時我意識到,如果 AI 未來能力越來越強,算法模型越來越大,對存儲器的依賴會遠(yuǎn)遠(yuǎn)超過現(xiàn)在的 CPU 和 GPU。所以那時候就覺得,用存儲器直接去計算 AI 可能是個好方向。博士最后一年,我們已經(jīng)開始做一些存算一體的工作,寫了一些 proposal,后來也得到了幾千萬的項目資助。但我沒有參與進去,proposal 寫完之后就畢業(yè)回國開始創(chuàng)業(yè)做存算一體了。

DeepTech:你博士階段做存儲器,今年內(nèi)存漲價是個熱門話題,你怎么看?

王紹迪:這個其實比較有意思。我們看到這兩年大模型發(fā)展很快,對 GPU 的需求最大,英偉達股價都漲到快 5 萬億美金了。

如果我們拆開一個 GPU 芯片看,里面可能有 2 個 GPU 計算的核心顆粒,但有五百多個內(nèi)存顆!@些都是高帶寬內(nèi)存(HBM),不是普通手機或 PC 上用的 DDR 內(nèi)存,帶寬要高得多。

現(xiàn)在手機、個人電腦的內(nèi)存和閃存都在漲價,其實是因為高帶寬內(nèi)存需求太大了。高帶寬內(nèi)存性能好、賣得貴、利潤高,從去年開始韓國海力士在高端內(nèi)存領(lǐng)域收入和利潤上反超了三星和美光。大家都知道這是好生意,幾大內(nèi)存廠商全部開始轉(zhuǎn)產(chǎn)高帶寬內(nèi)存,把原先生產(chǎn) DDR 的產(chǎn)能都轉(zhuǎn)過去了。一些落后的產(chǎn)品比如 LPDDR4 完全不生產(chǎn)了,這些廠商同時也生產(chǎn)固態(tài)硬盤、手機存儲卡,一部分產(chǎn)能也被轉(zhuǎn)走。所以高帶寬內(nèi)存需求大,把所有產(chǎn)能都吸走了,反而導(dǎo)致 LPDDR 和普通內(nèi)存、存儲都缺貨漲價。

DeepTech:所以本質(zhì)上不是為了減產(chǎn)而減產(chǎn),而是把產(chǎn)能換到了更掙錢的賽道?這是不是給國內(nèi)廠商一些機會?

王紹迪:非常對。國內(nèi)內(nèi)存廠商比如長鑫,它的 LPDDR4 、 LPDDR5 產(chǎn)品原先面臨很大的價格競爭,現(xiàn)在因為這樣一個機會,價格就可以上漲了。包括閃存廠商,整體是利好的。

DeepTech:內(nèi)存漲價對存算一體有影響嗎?還是說這反而是你們的機會?

王紹迪:其實跟我們沒有太大關(guān)系。存算一體雖然也有“存”字,涉及很多存儲器技術(shù),但目前還不會用商業(yè)化的存儲廠商產(chǎn)線去生產(chǎn)。它用的是一些存儲器的原理,在常規(guī)的邏輯代工廠做生產(chǎn),所以產(chǎn)能方面是不相關(guān)的。

另外,很多人覺得存算一體是存儲器,但它雖然“存”在前面,實際上是個計算芯片?梢园阉(dāng)成用存儲器做計算,像 GPU、 CPU 這類能夠完成計算的東西,而不是存儲芯片。

DeepTech:能不能深入介紹一下存算一體的計算范式?

王紹迪:我舉個例子。比如我想做 2 加 3 這個計算,在現(xiàn)在的芯片架構(gòu)中,2 和 3 要從存儲器里讀出來,讀到 CPU 之后做加法,結(jié)果是 5,再把 5 存回存儲器。一次計算涉及讀兩次數(shù)、做一次加法、寫一次數(shù),三次讀寫操作加一次計算操作。

這里面消耗時間最大、功耗最高的,實際上是把數(shù)據(jù)從存儲器里讀出來、再寫回去的過程。為什么代價大?可以理解成存儲器陣列特別大。如果從三四個人中找一個人很快,但從一個幾萬人的學(xué)校里找一個人,從找到他到他走到校門口,時間就特別長。

現(xiàn)在計算算力越來越強,存儲容量越來越大,就像一個幾十萬人的大規(guī)模場地,我們要從中間找出兩個人做計算,再放回原位,算起來是挺容易的事,但找人、放回去的過程是最大的瓶頸。

存算一體為什么能解決這個問題?因為 AI 計算是非常規(guī)整的陣列級計算,雖然能力很強,但基礎(chǔ)方式很簡單——乘法和加法占了 90%,而且是相鄰數(shù)據(jù)之間的交互,F(xiàn)在的做法是雖然數(shù)據(jù)站成方陣,還是要把人拉出來拉很遠(yuǎn)做計算,代價很大。存算一體就是把相鄰的數(shù)據(jù)在存儲器內(nèi)部直接做乘法加法。乘法加法并不復(fù)雜,不需要到復(fù)雜的 CPU、 GPU 去算,在存儲器內(nèi)部就能實現(xiàn),不用跑那么遠(yuǎn)。就像兩個鄰居開門問一句“吃飯了嗎”,各回各家就行了,甚至不用出單元門,效率會高很多。

DeepTech:傳輸過程是瓶頸還是找數(shù)據(jù)的過程是瓶頸?

王紹迪:分情況看。在不同的芯片上,傳輸路徑長度不一樣。從存儲器里找數(shù)的代價肯定很大,傳輸路徑代價也很大。比如從 5 公里外的小區(qū)找一個人,他從小區(qū)里出來是一段路程,打車過來 5 公里又是很長的時間。

高帶寬內(nèi)存做的事情就是把存儲器和計算芯片放近。比如從 5 公里外改成 10 米外隔一條馬路的小區(qū),中間路徑就變短了。但從小區(qū)里找人的代價還是存在的。

從手機或個人電腦來看,找人和傳輸?shù)拇鷥r都很大;從現(xiàn)在的高性能計算來看,從“小區(qū)”里找人出來的代價更大一些,傳輸相對代價小一些。

DeepTech:這個代價體現(xiàn)在什么方面?是性能下降、發(fā)熱還是延遲?

王紹迪:這些其實是一致的。發(fā)熱意味著代價大,意味著做工多——人走 100 米和 1 公里做的工不一樣。做的工多,走的距離長,速度就慢,性能就下降。這些是同時產(chǎn)生的。

但發(fā)熱還有一個因素:高帶寬內(nèi)存可能同時有 1,024 或 2,048 條通路連到 GPU 上,手機上可能是 144 根線。高帶寬內(nèi)存之所以帶寬高,就是因為連的通路多。同樣發(fā)熱量下,它傳輸?shù)臄?shù)據(jù)會多一些,因為距離近但并行度高。

DeepTech:蘋果把 SOC 和內(nèi)存一體封裝,是不是就是你說的距離變近?華為的超節(jié)點用光傳輸,是不是用光的傳輸密度來提升效率?

王紹迪:對,蘋果把內(nèi)存和 SOC 封裝在一起,距離可能在幾毫米的級別。英偉達的 GPU 內(nèi)存和芯片也是幾毫米的級別。

光計算是另一個故事。常規(guī)的方式是這個人打車過來 5 公里,光計算可能是坐磁懸浮或高鐵。同樣五分鐘路程,可以從 20 公里甚至 100 公里外到達。光計算的傳輸速度和密度更大,距離可以遠(yuǎn),但消耗的能耗低。

DeepTech:存算一體相當(dāng)于中間這個路程消失了,找到人之后直接計算?

王紹迪:對?梢岳斫獬稍葍蓚人在某個小區(qū)某個單元同一層樓,比如都在五層是鄰居,現(xiàn)在做計算要把他倆叫出來到辦公室,問一句“吃飯了嗎”——因為 AI 里做計算就是乘法加法,很簡單,就像問一句話。用存算一體的方式,兩個鄰居開門問一句“吃飯了嗎”,回答完各回各家就行了,甚至都不用出單元門,效率就更高。

DeepTech:所以存算一體是把存儲和計算放在一起,計算效率和密度都更高,比蘋果的一體封裝是更深層次的架構(gòu)升級?

王紹迪:可以理解成針對 AI 這種計算需求,找到了一個適合它的計算方式。

DeepTech:現(xiàn)在手機都在推 AI 計算,存算一體芯片能用在手機上嗎?

王紹迪:手機上還沒有。傳統(tǒng)芯片架構(gòu)針對 AI 的計算需求會不斷優(yōu)化,但架構(gòu)本身如果不是針對 AI 設(shè)計的,優(yōu)化只是小部分改進。比如 CPU 也在優(yōu)化 AI 計算性能、圖形渲染性能,但所有能力始終不如 GPU,因為 GPU 天生就是針對圖形渲染設(shè)計的,同時也比 CPU 更適合 AI。存算一體本身就是針對 AI 設(shè)計的,在效率上會比 GPU 更高。

存算一體的特點是功耗可以很低。目前我們的存算一體芯片已經(jīng)用在很多消費電子產(chǎn)品當(dāng)中,比如耳機。耳機平時工作就在幾毫瓦級別,在這個功耗下想做復(fù)雜的 AI 算法是很困難的。但存算一體可以讓幾毫瓦功耗下的計算能力比原有芯片高出 50 到 100 倍。我們現(xiàn)在有客戶用類似 Transformer 這種大模型算法在耳機上做聲音處理。

舉個直接的例子:原先耳機的降噪或拾音,需要把噪聲識別出來,從聲音里摳掉,還原干凈的人聲。但這類算法有上限,去噪的同時會損失人聲,沒辦法做到徹底干凈,F(xiàn)在用大模型的能力做降噪,算法變成:我知道你在說什么,知道你的音色、語氣,重新生成一段干凈的聲音。生成過程中就沒有原始噪音了,效果更好。

DeepTech:相當(dāng)于兩個應(yīng)用場景,降噪是我耳朵聽到的噪音降低,拾音是我打電話時降低背景音。

王紹迪:對,這塊還有很多場景。聲音處理就像圖像處理一樣,現(xiàn)在都在 AI 化,有識別類的、低功耗識別類的,大概有七八種不同場景,各種各樣的算法。

DeepTech:相當(dāng)于在追求極致功耗的場景下把 AI 運行起來,F(xiàn)在跑大模型功耗特別高,傳統(tǒng)架構(gòu)可能有功耗極限?

王紹迪:對,F(xiàn)在云端跑算法是幾百瓦級別,手機能提供的功耗大概幾瓦,中間差 100 倍。如果想把同樣的算法從云端移到手機,能效得提高 100 倍。這在現(xiàn)有基礎(chǔ)上很難突破,20 年前摩爾定律發(fā)展很快時,可能十年差不多有 100 倍提升,但現(xiàn)在很難看到未來十年有 100 倍提升了。

DeepTech:摩爾定律是不是已經(jīng)失效了?

王紹迪:傳統(tǒng)意義上的摩爾定律很早就失效了。最近十年大家用各種方式給摩爾定律“續(xù)命”,但自從 AI 出來之后,更多是在做架構(gòu)和工程上的創(chuàng)新,而不是直接 scaling 先進制程。

DeepTech:存算一體目前大概需要多少納米制造?

王紹迪:存算一體的概念現(xiàn)在比較廣泛,我把它分為兩部分:近存計算和存內(nèi)計算。

打個比方,如果在樓外邊設(shè)一個處理點,人從樓里出來到處理點辦事,這叫近存計算——相當(dāng)于把原先集中辦公的地方放到每個居民樓外邊。存內(nèi)計算是不需要單獨的處理人員,兩個鄰居直接對話,這種叫存內(nèi)計算。

近存計算還是很依賴工藝的,工藝越先進越好,性能會越強,同時要挑戰(zhàn)怎么把先進工藝跟存儲器工藝更好地結(jié)合。目前業(yè)界有很多人在做這方面的工作,包括大廠和創(chuàng)業(yè)公司,涉及先進集成等技術(shù)。

存內(nèi)計算是更徹底的變化,沒有專門的處理單元,計算單元和存儲單元本身就是一體的。存儲單元只能做簡單的乘法加法,但這正好是 AI 需要的。它對芯片工藝的需求跟現(xiàn)有邏輯工藝完全不一樣。過去 30 年半導(dǎo)體加工工藝都是針對 CPU 優(yōu)化,現(xiàn)在可能針對 GPU 優(yōu)化,讓計算單元、寄存器、緩存性能更好,但跟存算一體的需求不同。

存內(nèi)計算用了很先進的邏輯工藝,并不能帶來性能提升,它需要自己的工藝優(yōu)化方法。我們現(xiàn)在采用的是成熟的半導(dǎo)體工藝,28 納米及以上,在這個工藝下做存儲器的定制,就可以實現(xiàn)存算一體功能,性能也不錯。

DeepTech:相當(dāng)于換了一條賽道。過去卷制程,卷到一納米之后可能就結(jié)束了,現(xiàn)在換一個架構(gòu)邏輯,用更高制程實現(xiàn)先進計算能力。

王紹迪:可以這么理解。

DeepTech:存算一體是做主芯片還是輔助芯片?現(xiàn)在很多 AI 芯片其實是輔助芯片。

王紹迪:這個問題我一直在想。整個芯片領(lǐng)域中,只有做主芯片才有最大的價值。主芯片可能是吃肉,輔助芯片可能連湯都喝不了。

我們看發(fā)展趨勢:97、98 年我上小學(xué)時,所有游戲都在 CPU 上打,那時候還沒有 GPU 或者叫圖形加速卡,畫面很糟糕。后來出了雷神之錘這樣的游戲,CPU 跑不動了,大家就買圖形加速卡,這是最早的 GPU 芯片。

GPU 開始是以輔助芯片的形式出現(xiàn)的,因為大部分任務(wù)都是 CPU 在管理調(diào)度,GPU 只負(fù)責(zé)圖形渲染。游戲打得再多,GPU 都是輔助芯片,因為只做這一個任務(wù)。后來越來越多的應(yīng)用開始用 GPU,包括手機上的圖像處理,CPU 要集成一個 GPU,但還是沒法替代 CPU。

到了 AI 之后,事情發(fā)生了巨大轉(zhuǎn)變。現(xiàn)在數(shù)據(jù)中心百分之七八十運行的是 AI 任務(wù),不是 CPU 任務(wù)了。可以看到,整個數(shù)據(jù)中心突然轉(zhuǎn)變,以 GPU 為主,CPU 變成調(diào)度、數(shù)據(jù)傳輸、網(wǎng)絡(luò)管理的輔助功能了。這個轉(zhuǎn)變就在過去四五年,放到十年前大家都不會想到。

那什么時候在端側(cè) AI 計算任務(wù)會重于其他任務(wù)呢?比如機器人的應(yīng)用,AI 計算任務(wù)肯定高于其他類應(yīng)用,這類任務(wù)的主芯片可能就不是現(xiàn)在的 CPU 了,而是以 AI 計算為主的芯片。未來手機操作系統(tǒng)邏輯也可能改變,比如以智能化操作系統(tǒng)為主,甚至讓 AI 去管理任務(wù)。如果是這種情況,計算需求也不是現(xiàn)在的 CPU 了。

所以很多時候賭的是趨勢。云端已經(jīng)是 GPU 主導(dǎo)的 AI 計算為主了,這個趨勢會慢慢下放到 PC 、手機、機器人。機器人毫無疑問會是 AI 主導(dǎo)的計算,計算任務(wù)發(fā)生變化時,主芯片的角色就會發(fā)生很大變化。

DeepTech:你提到 CPU 和 GPU 的比較,有個經(jīng)典案例是 GPU 打點是一下把整個笑臉打出來,CPU 是一個一個點打。存算一體的通量比 GPU 還高?

王紹迪:對。CPU 一次打一個點,GPU 一次可以打比如 10 萬個點——這 10 萬個點是從存儲器讀出來做計算的。存算一體大概可以達到 10 億個點,就是百倍。

因為存儲器從里面讀數(shù)是由它外圍的周長決定的,像一個方形的存儲器或 CPU、GPU,所有接口都在邊長上。邊長比如 10 毫米,就走 10 毫米的帶寬。存算一體的意思是,因為 AI 計算是矩陣類計算,如果以邊長的形式讀數(shù),一次只能讀一行出來。GPU 相當(dāng)于一次讀一行,讀幾萬次把 10 毫米乘 10 毫米的存儲器數(shù)據(jù)都讀出來。存算一體是一次就把 10 毫米乘 10 毫米里的所有數(shù)據(jù)都完成計算,不需要把它搬出來再搬進去。

用居民樓來比喻:一棟 30 層的樓只有一個單元出口,30 層的人都要排隊出來。GPU 相當(dāng)于整棟樓有 20 個單元口,一次出 20 個人。存算一體相當(dāng)于 20 個單元口都不需要了,所有人都并行在做計算,并行維度比 GPU 更高一個維度。

DeepTech:現(xiàn)在用在 TWS 耳機上,未來會用在機器人上,從輔助芯片可能轉(zhuǎn)變成主芯片。在中間的過渡態(tài),是以小功率設(shè)備為主還是會逐漸演化到大功率設(shè)備?

王紹迪:科技公司要做的事情是不能等需求來了再做。成功的公司都是預(yù)判了未來需求的改變,同時做了很多技術(shù)研發(fā)的提前迭代。英偉達也是在 AI 出來之前,大概 08 、 09 年就開始做 CUDA 做科學(xué)計算,AI 真正開始普及到應(yīng)用是 17 、 18 年左右,英偉達當(dāng)時特別大的算力芯片是 19 、 20 年左右出來的,大模型是 22 、23 年出來的。

對于存算一體公司來說,我們預(yù)判未來會發(fā)生變化,知道未來需求是什么,就要做好怎么把現(xiàn)在 TWS 耳機的小芯片一點點做大,性能做得更強,能適應(yīng)手機、機器人、汽車這些產(chǎn)品。這個過程不是簡單把芯片做大,還要針對存儲器的特殊工藝做修改和改進,讓它更適配性能 scale up。這個過程可能有四五年時間,讓技術(shù)和發(fā)展趨勢同步。

DeepTech:技術(shù)在發(fā)展,市場也在發(fā)展,中間有個調(diào)和的過程。你提到機器人,今年機器人太熱了,分成大腦和小腦。大腦用大模型計算思考,身體做本體控制,F(xiàn)在很多公司大腦和身體是分開的,未來本體上能用 AI 芯片嗎?

王紹迪:本質(zhì)上也可以。拿車來舉例,車的大腦是自動駕駛算法,但車的操控、平衡還是傳統(tǒng)算法。車在原有駕駛操控類算法上加一個自動駕駛大腦,就能完成自動駕駛。

機器人也可以這樣理解:我們現(xiàn)在已經(jīng)有車了,它有基本的平衡和行走能力,但需要的是把自動駕駛能力開發(fā)出來。目前這部分挑戰(zhàn)最大,也是未來價值最大的地方。如果機器人只能走,可能只有觀賞價值——車還有人開,機器人只能走也不行。如果機器人能做事,大腦要更強。大家現(xiàn)在想把機器人從觀賞比賽的機器人,轉(zhuǎn)化成能做有生產(chǎn)力的機器人,所以大腦更重要。

DeepTech:現(xiàn)在機器人不管是比賽還是表演,都側(cè)重平衡能力和運動能力,但核心還是有遙控。把本體架構(gòu)好之后再做大腦。現(xiàn)在端側(cè)是端云協(xié)同,端為輔云為主。如果芯片功率降下來、性能提高了,未來有沒有可能純端側(cè)計算就能完成很多事情?

王紹迪:這不是有沒有可能的問題,機器人未來想很好地商用,必須在端側(cè)完成很多事情。云端計算成本其實很低,延時相對也低,一個請求過去可能 20 毫秒就回來了。但機器人為什么一定要端側(cè)完成?

因為機器人如果只是走到隔壁屋這樣的任務(wù),可以每秒鐘跟云端交互 20 次,每 50 毫秒問一次“我現(xiàn)在怎么走”,云端實時反饋就可以了。但未來機器人用于生產(chǎn)后,是跟物理世界實時交互的:機械手會實時反饋受到的力量,視覺會看到物體怎么移動,皮膚會感知壓力……這些反饋之后,大模型要實時生成計算。這時候端到端延時要做到一毫秒級別,沒辦法在云端做——云端延時做不到這么短。一毫秒是正常操作的機器人,20 毫秒就是一個慢動作的機器人。想讓它有生產(chǎn)能力,反饋鏈路必須越來越短。

端側(cè)現(xiàn)在為什么還要依賴云端?因為沒有這樣一個芯片能把很好的模型跑在端側(cè)。開發(fā)階段對云端依賴很強,但未來必須是端側(cè)。

DeepTech:相當(dāng)于做到端側(cè)就是自主決策,不依賴云端。云端鏈路畢竟涉及通訊過程,延遲做得再短也達不到端側(cè)計算的鏈路。存算芯片已經(jīng)用在小的端側(cè)計算上了,但我一直有個疑問:端側(cè)計算、降噪、運動控制,傳統(tǒng)架構(gòu)也能做,只是存算一體做得更好。有沒有獨特的場景是非存算芯片不可的?

王紹迪:這個問題四五年前我也在問自己。為什么會這么問?因為那時候 AI 算法并不大,算力需求也不大,跟我們剛創(chuàng)業(yè)時預(yù)判的不一樣。我們當(dāng)時預(yù)判 AI 算法會越來越大、性能越來越強,對存算芯片的需求會越來越強。但在 20、21、22 年,算法甚至比 17、18 年的算法還小。那時候端側(cè)芯片成本降得非常低,功耗也非常低。

直到大模型出來,大模型比原先的 CNN 算法基本上大了 1 萬倍左右。大模型出來之后,一下就看到端側(cè)芯片跑不了大模型——現(xiàn)有架構(gòu)跑不了。這時候存算的優(yōu)勢就很大了。

如果做同樣規(guī)模的芯片,存算芯片在端側(cè)的性能,在大模型之前可能是傳統(tǒng)架構(gòu)的兩三倍,現(xiàn)在是 100 倍到 200 倍。手機上想跑云端一樣的模型,要提升 100 倍性能不太現(xiàn)實,只能跑弱一點的模型,但成本比云端還高,能力也沒云端強。

存算一體的機會就在這里:做成同樣成本,可以跑一個性能比云端更強的東西。為什么現(xiàn)在還沒有?因為去年才看到這個轉(zhuǎn)變,去年我們才開始 all in 存算一體往更大規(guī)模做,往手機、機器人方向做。還有幾年的時間。雖然我們當(dāng)時預(yù)判了模型會變大,但也沒那么大膽。21、22 年我們跟很多公司聊,美國一家互聯(lián)網(wǎng)巨頭說,你們這個技術(shù)應(yīng)該做 Transformer。但那時候我們覺得 Transformer 沒有應(yīng)用,只做翻譯,效果也不是特別好,就沒下定決心。到了 22、23 年一看,Transformer 就這么強了。如果早兩年做,相當(dāng)于多了兩年提前研發(fā)的時間。

DeepTech:我們之前試用 GPT-2 的時候覺得不太行,3.5 出來后才覺得是個大方向。

王紹迪:對,感知是類似的。所以像你剛才的問題,哪些東西是端側(cè)現(xiàn)在芯片做不了我們能做的?當(dāng)前可能還不好說,但兩三年后,當(dāng)前芯片提升十倍不太可能,存算一體可以把規(guī)模從 TWS 做到手機、機器人這個級別。

DeepTech:這中間的過程是科學(xué)問題還是工程問題?

王紹迪:兩者都有。科學(xué)問題是解決能做不能做的問題,涉及很多理論未知的東西。比如 Transformer 的計算范式能不能完全映射到存算一體的計算范式中,這是科學(xué)問題。工程問題是怎么把一個 TWS 的小規(guī)模低功耗芯片做大,從 2 毫瓦做到 2 瓦,這是 1,000 倍的規(guī)模。

科學(xué)問題可能花一兩年解決,工程問題可能要花五年以上。我們從 17 年開始創(chuàng)業(yè),到第一個芯片量產(chǎn)是 22 年,花了五年多。從去年開始,我們把存算一體在 CNN 上的能力轉(zhuǎn)化到 Transformer 上,有工程和科學(xué)兩方面的問題?茖W(xué)問題這兩年已經(jīng)大部分解決了,接下來三年主要是工程問題。

DeepTech:面對工程問題,會有生產(chǎn)問題和生態(tài)問題。很多中國產(chǎn)品缺乏生態(tài)——開發(fā)者是否足夠多,生態(tài)是否完善。

王紹迪:我覺得生態(tài)不是做出來的,不是投入大、有人專門做就能做出來。為什么手機現(xiàn)在用 ARM?ARM 當(dāng)時剛開始是非常小的公司,國內(nèi)很多公司把 ARM 買下來,那時候最強的是 x86 的 CPU。但我們看到手機在很小的時候就進入了 ARM 處理器,在 ARM 上長出了很多手機應(yīng)用,ARM 成為手機的主生態(tài)。

操作系統(tǒng)最強的是微軟,但現(xiàn)在看不到微軟的操作系統(tǒng)在手機上。智能手機剛出來時是 iOS 和安卓,所有應(yīng)用都在 iOS 和安卓上開發(fā)出來的。

AI 為什么現(xiàn)在在英偉達生態(tài)上?因為除了英偉達還沒有人針對 AI 做芯片,大家都在針對游戲 GPU 、操作系統(tǒng)做 CPU。英偉達提供了一個強大的算力平臺,比如市場需求是 100T 算力,英偉達推出了 1 萬 T 的平臺,大家在 1 萬 T 的平臺上開發(fā)出 1 萬 T 的算法,然后有了 Transformer,最終有了大模型。

所以生態(tài)是應(yīng)用長在平臺上自然形成的。做成生態(tài)的都是第一個在沒有需求的時間先把它做出來的東西。如果東西已經(jīng)做出來了,大家都在這個平臺上長出應(yīng)用了,再想把應(yīng)用遷移出來挑戰(zhàn)是很大的。Windows 我們用了這么久,所有 Excel 、 Office,有很多 AI 工具比它好用,但過去 20 年沒有人去切換,因為習(xí)慣都在上面長出來的。Office 和 Windows 是在 Intel 的 CPU 上長出來的,我們現(xiàn)在的 PC 也都是 x86 的 CPU 為主。ARM 性能更高,想搶 PC 和服務(wù)器花了十幾年。

DeepTech:蘋果切換 ARM 芯片之后,姿態(tài)也很低去吸引開發(fā)者。

王紹迪:對,后進入者可能得花十幾年、投入超千倍,去搶一個之前只花了半年一年就拿到的生態(tài)位。比如安卓比 Windows Phone 只早了半年一年,但就得到了這么大的收益。

很多時候是在最早期的時候,誰先做出一個平臺,在上面長出應(yīng)用,生態(tài)就形成了。端側(cè)現(xiàn)在沒有大腦,如果能有一個很強的大腦,用這個大腦做出很多產(chǎn)品,生態(tài)循環(huán)起來就成了。

DeepTech:所以有了底座之后,發(fā)展到某個階段,開發(fā)者會自然而然選擇某個基座,從而形成生態(tài)。

王紹迪:廣泛的開發(fā)者是很有智慧的,大家一直在試各種平臺去開發(fā)好應(yīng)用。如果有一個很好的平臺能開發(fā)出別人做不到的應(yīng)用,大家都會涌向這個平臺,生態(tài)就產(chǎn)生了。對于存算一體來說,我們需要在端側(cè)提供一個遠(yuǎn)超現(xiàn)在需求的算力平臺,大家基于它能開發(fā)出非常好的應(yīng)用,這時候才會誕生生態(tài)。

DeepTech:在這個生態(tài)上有沒有可能長出超級應(yīng)用?

王紹迪:我覺得很有可能。拉長到十年、 20 年,大家都覺得它會發(fā)生。比如十年、 20 年后,我們的操作系統(tǒng)是不是 AI 主導(dǎo)的?為什么當(dāng)前不行?因為我們跟很多做這方面的人交流——算不動、跑得慢、功耗高、模型跑不大、能力不強,都是現(xiàn)實平臺的限制。如果有個東西在 2 瓦功耗下提供云端的能力或比云端更強,大家在它上面開發(fā)新的操作系統(tǒng),能不能出來?肯定有很多開發(fā)者愿意去嘗試。有人嘗試成功了,新的應(yīng)用、新的生態(tài)就會出現(xiàn)。

DeepTech:你認(rèn)為有沒有一個里程碑事件可能會達到轉(zhuǎn)折點?

王紹迪:有幾點,但這個判斷肯定不準(zhǔn)。放到三年前也不一定能判斷大模型能做到現(xiàn)在這個程度,未來也有很高的升級空間。

現(xiàn)在大家在端側(cè)的期望是既有記憶能力,又有很強的主動能力——不是我們被動給它需求它才做,而是主動幫我們管理、預(yù)判需求、推薦需求。它需要非常強的個性化和記憶能力。

這部分有很多算法研究,但目前可能是在云端場景下,根據(jù)多輪對話抽取人的特征,還不是在端側(cè)。端側(cè)一直使用手機去抽取記憶、使用習(xí)慣,會很受限,因為存儲、帶寬、算力要求很高。做不到輸入的 token 非常多,可能記半小時記憶就把東西用滿了,拉長到一個月、半年能做出什么效果,大家還沒法嘗試。這是平臺和應(yīng)用開發(fā)互補的關(guān)系。

DeepTech:相當(dāng)于可能出現(xiàn)某個里程碑,讓 AI 能主動提供服務(wù),真正成為 24 小時工作的 AI 助手。之前我們算過一個賬,如果 AI 運行 24 小時,手機可能兩小時就要充一次電。如果功耗降下來、算力升上去,AI 可能真的是常駐在工作,無感化的服務(wù),而不是現(xiàn)在的調(diào)用式。

王紹迪:對,而且現(xiàn)在調(diào)用的時候會把所有計算資源都占滿,其他任務(wù)就跑不了了。

DeepTech:我的手機用的是華為最新系統(tǒng),可以后臺幫我買東西,但一旦后臺在跑,前臺應(yīng)用就非?,甚至?xí)䴕⒑笈_進程,只留一個前臺和一個 AI 模型。

王紹迪:對。未來的手機放到十年后,我們希望它是一個個人助理——不是現(xiàn)在 Siri 、小愛這種,而是更了解自己、幫我們完成所有事兒。比如今天早上我遲到了幾分鐘,它應(yīng)該在我快到地庫的時候,提前幫我發(fā)個信息說“我馬上到了”,F(xiàn)在我還得停下來發(fā)信息。這類主動感知是應(yīng)該做的。

DeepTech:這可能才是未來的殺手級應(yīng)用。

王紹迪:對,長期看肯定會發(fā)生。我們需要做的就是把技術(shù)開發(fā)好,讓應(yīng)用開發(fā)者有這樣的平臺去做這些事情。

DeepTech:你是從國外回國創(chuàng)業(yè)的,目前來看國內(nèi)外的合作交流上,你覺得中國跑得快還是國外跑得快?

王紹迪:過去中國在應(yīng)用上是跑得比國外快的。每一波 AI 技術(shù)發(fā)展之后,國內(nèi)應(yīng)用發(fā)展速度都比國外快,這是大家的刻板印象。17、18 年人臉識別落地在國內(nèi)遠(yuǎn)遠(yuǎn)快于海外,這波大模型其實也是這樣。但中國已經(jīng)參與了很多了。

最近兩年我看到,不僅在應(yīng)用側(cè),在技術(shù)推進側(cè),比如 DeepSeek 這類算法出現(xiàn),也在慢慢追趕。中國的迭代走出了一條獨具特色的道路。現(xiàn)在科學(xué)方面是追趕階段,而且越來越好。應(yīng)用方面一直保持更快的迭代速度。

從長期角度來看,包括我們跟海外合作者交流,他們也看到我們在很多新技術(shù)新應(yīng)用上的發(fā)展速度和需求是快于海外的——可能現(xiàn)在也不是歐美了,就是美國在 AI 上做得更好。很多海外合作方也愿意跟中國企業(yè)合作,因為我們能帶來應(yīng)用方面包括技術(shù)方面新的指引。

DeepTech:美國社交媒體上在討論 AI 泡沫問題,有沒有可能像 00 年代互聯(lián)網(wǎng)泡沫一樣?

王紹迪:這個不好說,因為 AI 比互聯(lián)網(wǎng)更技術(shù)化一些;ヂ(lián)網(wǎng)泡沫時期,技術(shù)發(fā)展相對還是比較明確的。如果我們回過頭看 2000 年,可能會想為什么有互聯(lián)網(wǎng)泡沫?互聯(lián)網(wǎng)那么好。當(dāng)時大家擔(dān)心互聯(lián)網(wǎng)發(fā)展不及預(yù)期,達不到那個程度。很多時候大家對短期期盼很高,但低估了長期發(fā)展。

AI 現(xiàn)在比之前理性了。大家不期望三年就實現(xiàn) AGI 、三年大家都退休了,但拉長 20 年,這些事情肯定可以實現(xiàn)。即使有泡沫,我覺得也會有很多人在這個泡沫中成為最大的機會——就像 2000 年成立的好多巨頭公司都是在互聯(lián)網(wǎng)泡沫那個時候起步的。

DeepTech:會理性很多,互聯(lián)網(wǎng)泡沫那波之后反而進入了快速發(fā)展階段。那波是資本推動,現(xiàn)在大家都更理性了。包括 DeepSeek 出來后很多公司估值要重新定價。

王紹迪:對,估值重塑。但很多時候估值重塑反而會帶來行業(yè)發(fā)展的加速,有人虧了,就給更多人看到賺錢的機會,更多人就會投入進去。

DeepTech:你們公司也是今年麻省理工科技評論“50 家聰明公司”的一員,你怎么看這個評價?

王紹迪:都是非常優(yōu)秀的公司。我們?yōu)槭裁丛诶锩妫课矣X得是因為我們的人才密度比較高。之前我們每年校招里,大概 85% 是 Top 10 學(xué)校的博士,Top 5 的話占了百分之五六十,都是很優(yōu)秀的。同時整個研發(fā)團隊過去三年的能力提升也是超過一倍以上的。我們在人才密度上是非常優(yōu)秀的。

另外還有一點:聰明人需要發(fā)揮的地方。我們現(xiàn)在大概 440 多人,這個規(guī)模正好適合聰明人發(fā)揮。公司不是大公司,但五臟俱全,各個領(lǐng)域都有人。同時我們又在做一個很需要創(chuàng)新的事情,聰明人可以發(fā)揮出很多創(chuàng)新方面的能力。交流還很緊密,大家的 idea 交流很充分。所以在這個層面上,我們肯定算是 50 家聰明公司之一。這個榜單從另外一個角度去評價公司,不是以規(guī)模、場景或估值,反而更看重潛力。

DeepTech:這也是我們做這個榜單的目標(biāo)。

王紹迪:對,聰明的公司要在聰明的時間選擇對的時間做聰明的事兒,這是更重要的。

DeepTech:你當(dāng)年回國創(chuàng)業(yè)的時候也是博士剛畢業(yè),對現(xiàn)在有志的年輕人有什么建議?

王紹迪:每個時代都有每個時代的機會。如果想要工作,就投入到現(xiàn)在 AI 發(fā)展的過程中,這是最好的時代。今年的薪資比去年漲得還高,去年比前年漲得還高,是 AI 快速發(fā)展的階段。

如果是想要創(chuàng)業(yè),我覺得需要再找新的場景。創(chuàng)業(yè)肯定不能是在一個行業(yè)最火的時候去繼續(xù)做這個行業(yè),那時候成功率會非常低。要找到下一個可能三四年之后會開始火的行業(yè),提前進入。不要太關(guān)注怎么把大模型做好、能力做好,更多應(yīng)該關(guān)注大模型能力很好之后怎么用起來,或者其他領(lǐng)域怎么跟大模型結(jié)合,比如健康、生物醫(yī)藥這些。需要對未來有一個預(yù)判。

DeepTech:還是需要長期主義和預(yù)判。就像你剛開始做的時候,已經(jīng)早于行業(yè)發(fā)展。

王紹迪:對,很多研究是在 19 、 20 年才開始做,我們是 17 年成立公司準(zhǔn)備做產(chǎn)業(yè)化的。

運營/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
對越反擊戰(zhàn)期間,先前有 15 個國家明確站隊支持越南,然而戰(zhàn)爭正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

對越反擊戰(zhàn)期間,先前有 15 個國家明確站隊支持越南,然而戰(zhàn)爭正式打響后,它們卻不約而同地選擇了緘口不言,這是為何?

史海孤雁
2025-12-19 17:46:17
烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

烏專家:中國“榨干”蘇聯(lián)遺產(chǎn),我們圖紙都沒看懂,他們造出2.0

動漫里的童話
2025-12-24 19:32:36
張水華疑遭中國田協(xié)除名:無緣官方名單 比她慢1小時的選手卻入圍

張水華疑遭中國田協(xié)除名:無緣官方名單 比她慢1小時的選手卻入圍

風(fēng)過鄉(xiāng)
2025-12-27 18:06:10
已確認(rèn):即將大反轉(zhuǎn)!浙江或在雨雪中跨年

已確認(rèn):即將大反轉(zhuǎn)!浙江或在雨雪中跨年

臺州交通廣播
2025-12-27 20:41:34
蒙哥和忽必烈是一母同胞的兄弟,為何蒙哥當(dāng)上大汗,要打壓忽必烈

蒙哥和忽必烈是一母同胞的兄弟,為何蒙哥當(dāng)上大汗,要打壓忽必烈

阿鄖田間生活
2025-12-27 17:32:13
洪都拉斯新總統(tǒng)上任第一件事,或?qū)⑴c中國斷交?中方回應(yīng)暗藏鋒芒

洪都拉斯新總統(tǒng)上任第一件事,或?qū)⑴c中國斷交?中方回應(yīng)暗藏鋒芒

文史旺旺旺
2025-12-26 19:56:13
廣東宏遠(yuǎn)今日早報!徐杰最新傷情,朱芳雨深夜發(fā)聲,挖出最大水貨

廣東宏遠(yuǎn)今日早報!徐杰最新傷情,朱芳雨深夜發(fā)聲,挖出最大水貨

多特體育說
2025-12-27 07:40:03
為何一定要為小洛熙進行手術(shù)?真實原因曝光,刺痛全網(wǎng)

為何一定要為小洛熙進行手術(shù)?真實原因曝光,刺痛全網(wǎng)

老特有話說
2025-12-25 12:16:26
扣押中國油輪后,美方發(fā)現(xiàn)中國貨輪填滿導(dǎo)彈,白宮的說法終于變了

扣押中國油輪后,美方發(fā)現(xiàn)中國貨輪填滿導(dǎo)彈,白宮的說法終于變了

云上烏托邦
2025-12-27 16:04:34
當(dāng)黑人選民看到,奧巴馬越老越白的時候,產(chǎn)生了強烈的被背叛感!

當(dāng)黑人選民看到,奧巴馬越老越白的時候,產(chǎn)生了強烈的被背叛感!

杰絲聊古今
2025-12-25 19:53:45
周杰倫平安夜曬與妻子昆凌合影,背景畢加索畫作價值近百萬元

周杰倫平安夜曬與妻子昆凌合影,背景畢加索畫作價值近百萬元

翰林濤濤
2025-12-26 21:39:13
天然氣對華毀約,加入歐美稀土戰(zhàn)略,哈薩克斯坦這路誰教他走的?

天然氣對華毀約,加入歐美稀土戰(zhàn)略,哈薩克斯坦這路誰教他走的?

策略述
2025-12-27 17:20:34
為什么越南永遠(yuǎn)修不好南北高鐵?兩千年歷史告訴你答案

為什么越南永遠(yuǎn)修不好南北高鐵?兩千年歷史告訴你答案

勇哥讀史
2025-12-26 15:58:11
法國、德國、英國、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國發(fā)表聯(lián)合聲明

法國、德國、英國、加拿大、丹麥、西班牙、意大利、荷蘭、挪威等14國發(fā)表聯(lián)合聲明

每日經(jīng)濟新聞
2025-12-25 07:29:06
“亂港分子”周庭,棄保潛逃加拿大,揚言永不回國,如今怎么樣了

“亂港分子”周庭,棄保潛逃加拿大,揚言永不回國,如今怎么樣了

甜檸聊史
2025-12-27 10:54:15
一男子每天穿破損羽絨服12小時,確診“羽絨肺” 導(dǎo)致的呼吸衰竭!原因竟是……

一男子每天穿破損羽絨服12小時,確診“羽絨肺” 導(dǎo)致的呼吸衰竭!原因竟是……

杭州之聲
2025-12-27 09:51:19
4前鋒配中鋒!火箭隊排出怪陣?防守強度拉滿,烏度卡不再執(zhí)迷5大

4前鋒配中鋒!火箭隊排出怪陣?防守強度拉滿,烏度卡不再執(zhí)迷5大

熊哥愛籃球
2025-12-27 22:20:09
全員法國人踢非洲杯!這屆非洲杯有多少球員在法國出生?

全員法國人踢非洲杯!這屆非洲杯有多少球員在法國出生?

仰臥撐FTUer
2025-12-26 17:19:06
貴州省人社廳黨組副書記、副廳長高曉昀履新安順市委副書記

貴州省人社廳黨組副書記、副廳長高曉昀履新安順市委副書記

澎湃新聞
2025-12-27 19:02:26
凱特王妃身著“康復(fù)大衣”金發(fā)耀眼,卻被女兒搶風(fēng)頭,養(yǎng)得太好了

凱特王妃身著“康復(fù)大衣”金發(fā)耀眼,卻被女兒搶風(fēng)頭,養(yǎng)得太好了

黃謀仕
2025-12-27 22:18:28
2025-12-27 23:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評論獨家合作
16044文章數(shù) 514438關(guān)注度
往期回顧 全部

科技要聞

小米也漲價了!業(yè)界稱終端再不漲明年必虧

頭條要聞

澤連斯基:烏在領(lǐng)土及扎波羅熱核電站問題上有明確紅線

頭條要聞

澤連斯基:烏在領(lǐng)土及扎波羅熱核電站問題上有明確紅線

體育要聞

NBA教練圈的布朗尼,花了22年證明自己

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財經(jīng)要聞

注意,開始拉物價了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

健康
藝術(shù)
親子
手機
公開課

這些新療法,讓化療不再那么痛苦

藝術(shù)要聞

高160米!北京CBD“瀑布大廈”幕墻封閉!

親子要聞

寶藍爸爸扮演“廚師”開了一家披薩店,太好玩了,快來看看吧!

手機要聞

榮耀第二款“萬級”電池曝光,下月發(fā)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版