国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

挑戰(zhàn)英偉達(dá)算力霸權(quán)?多倫多一家創(chuàng)企將大模型“刻進(jìn)”芯片

0
分享至

在硅谷當(dāng)下的宏大敘事中,算力即權(quán)力。

英偉達(dá)的 GPU 似乎成了通往AGI唯一且昂貴的門票。當(dāng)整個(gè)行業(yè)都在狂熱地堆疊“更大、更貴、更耗電”的 GPU 集群時(shí),一種極具顛覆性的底層技術(shù)叛逆卻在暗處悄然發(fā)生。



近日,一家成立不到三年、位于多倫多的初創(chuàng)公司 Taalas 拋出了一個(gè)讓半導(dǎo)體與 AI 業(yè)界側(cè)目的方案:他們將 Meta 的 Llama 大模型直接“硬連線”(Hardwired)進(jìn)了 ASIC(專用集成電路)芯片。 這并非一次常規(guī)的硬件制程升級(jí),而是一場(chǎng)物理層面的暴力重構(gòu)。

由Tenstorrent前聯(lián)合創(chuàng)始人Ljubisa Bajic帶隊(duì)的這群工程師,不再依賴昂貴的HBM顯存,拋棄了液冷:模型不再是以軟件代碼的形式運(yùn)行在通用硬件上,也不再需要頻繁地從高帶寬顯存(HBM)中吞吐成百上千 GB 的權(quán)重?cái)?shù)據(jù)。Llama 龐大的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)十億參數(shù),被直接固化進(jìn)物理電路,成為了芯片本身——芯片即模型,模型即芯片。

在這塊采用臺(tái)積電6納米工藝、面積達(dá)815平方毫米的芯片上,單用戶運(yùn)行Llama 3.1 8B的推理吞吐達(dá)到了令人瞠目的17,000 tokens/秒。作為對(duì)比,這個(gè)速度是英偉達(dá)最頂尖GPU的數(shù)十倍,是人類閱讀或思考速度的成百上千倍。生成一部詳盡的二戰(zhàn)逐月編年史,僅需0.138秒。

這一反常識(shí)的技術(shù)路線,究竟是打破算力瓶頸的終極突破,還是無(wú)視模型迭代規(guī)律的“刻舟求劍”?

一、歷史的鐘擺:天下苦“內(nèi)存墻”久矣

Taalas 之所以做如此激進(jìn)的嘗試,是因?yàn)楫?dāng)前 AI 產(chǎn)業(yè)有一個(gè)隱疾:內(nèi)存墻(Memory Wall)。

自計(jì)算機(jī)誕生以來(lái),統(tǒng)治整個(gè)行業(yè)的基石是“馮·諾依曼架構(gòu)”,其設(shè)計(jì)中就存在計(jì)算與存儲(chǔ)分離的特點(diǎn):需要計(jì)算時(shí),就從后臺(tái)把數(shù)據(jù)搬運(yùn)到舞臺(tái)上,算完再搬回去。



在模型只有幾兆、幾十兆的時(shí)代,這個(gè)架構(gòu)運(yùn)轉(zhuǎn)良好。但是,當(dāng)大語(yǔ)言模型膨脹到幾百億、上千億參數(shù)時(shí),這一經(jīng)典架構(gòu)正在成為最大的絆腳石。GPU 運(yùn)行大模型進(jìn)行推理時(shí),它并沒(méi)有把大部分精力花在計(jì)算上,而是被迫變成了一個(gè)疲于奔命的“搬運(yùn)工”——海量的模型權(quán)重?cái)?shù)據(jù)需要在顯存和計(jì)算單元之間來(lái)回穿梭,高達(dá) 80% 的功耗和延遲都浪費(fèi)在了這種數(shù)據(jù)的物理搬運(yùn)上。這不僅造就了英偉達(dá)龐大的護(hù)城河,也直接捧紅了價(jià)格極其昂貴的 HBM 存儲(chǔ)芯片。AI行業(yè)苦“內(nèi)存墻”久矣,它讓 AI 推理的成本居高不下,讓數(shù)據(jù)中心變成了吞噬電力的巨獸。

Taalas 的 ASIC 路線,本質(zhì)上是對(duì)這筆“算力稅”的徹底逃避。當(dāng)模型權(quán)重不再是以數(shù)據(jù)的形式存在于內(nèi)存中,而是變成了固化的晶體管開(kāi)閉狀態(tài),數(shù)據(jù)搬運(yùn)的動(dòng)作就在物理層面上被抹除了。

二、絕對(duì)速度與“電子牛馬”:商業(yè)落地的場(chǎng)景價(jià)值

Taalas打破內(nèi)存墻帶來(lái)的最直接后果,是成本和能效比的恐怖斷層。



傳統(tǒng)的GPU數(shù)據(jù)中心是名副其實(shí)的“電老虎”,動(dòng)輒需要液冷伺候。而Taalas的HC1芯片,單顆功耗僅約250W。即使部署10顆芯片,總功耗不過(guò)2.5千瓦,僅靠常規(guī)的空氣冷卻就能穩(wěn)定運(yùn)行。根據(jù)Taalas官方及業(yè)界測(cè)算,其百萬(wàn)Token的推理成本僅為0.0075美元左右,是傳統(tǒng)GPU方案的二十分之一甚至更低。在“唯快不破”和“降本增效”成為行業(yè)鐵律的今天,這組數(shù)據(jù)的沖擊力毋庸多言。

從工程學(xué)的角度來(lái)看,這顯然是一次驚人的效率躍升;而在模型快速迭代的今天,一個(gè)不能更新、不能運(yùn)行其他模型的芯片,聽(tīng)起來(lái)顯然又像個(gè)笑話。但是,如果我們跳出“打造全知全能AGI”的宏大敘事,將目光投向海量的商業(yè)垂直場(chǎng)景,也許會(huì)發(fā)現(xiàn),這種“固化”非但不是缺陷,反而可能是某些場(chǎng)景下的最優(yōu)解。

在真實(shí)的商業(yè)世界里,并非所有場(chǎng)景都需要一個(gè)通曉量子力學(xué)、能寫(xiě)莎士比亞十四行詩(shī)的GPT5甚至更新的模型。大部分場(chǎng)景需要的,是一個(gè)極其穩(wěn)定、便宜、速度極快且不需要休息的“電子牛馬”。



想象一下工業(yè)流水線上的毫秒級(jí)殘次品視覺(jué)識(shí)別、智能汽車?yán)镄枰^對(duì)零延遲響應(yīng)的端側(cè)語(yǔ)音中樞、數(shù)以億計(jì)的家用陪伴機(jī)器人或兒童玩偶……在這些場(chǎng)景中,企業(yè)根本不在乎你能否兼容最新的大模型框架,他們?cè)诤醯氖牵耗懿荒苡脦酌婪值某杀荆咽诸^這件特定的任務(wù)做到光速?

Taalas的HC1,正好可以解決這種“規(guī)?;瘑我蝗蝿?wù)”。當(dāng)17,000 tokens/秒的速度應(yīng)用在語(yǔ)音助手上,AI的回答將比人類的神經(jīng)反射還要快,“等待LLM思考”的轉(zhuǎn)圈動(dòng)畫(huà)將徹底成為歷史。一個(gè)原本需要幾百瓦功率、必須插在液冷服務(wù)器上的大模型,未來(lái)也許只需幾瓦的電量,就能被輕易塞進(jìn)一臺(tái)掃地機(jī)器人、一部智能手機(jī),甚至是一副輕薄的AI眼鏡中。真正的“萬(wàn)物皆 AI”,也只有在算力和功耗被極度壓縮后才可能實(shí)現(xiàn)。

三、刻舟求劍的隱憂:被“凍結(jié)”在芯片里的智慧

盡管如此,鑒于當(dāng)前 AI 算法一日千里的演進(jìn)速度,Taalas 的路線極具風(fēng)險(xiǎn)的另一面也是不容忽視的。將流動(dòng)的軟件代碼固化為冰冷的物理電路,意味著犧牲了靈活性。這里有兩個(gè)極其尖銳的現(xiàn)實(shí)錯(cuò)位。

首先是迭代周期的錯(cuò)位。如今,開(kāi)源大模型的進(jìn)化是以“月”甚至“周”為單位的。但一顆先進(jìn)制程的芯片,從架構(gòu)設(shè)計(jì)、流片到最終量產(chǎn),通常需要 18 到 24 個(gè)月。而當(dāng)它走下產(chǎn)線時(shí),它所“凍結(jié)”的 Llama 模型,在日新月異的算法世界里,是否已經(jīng)淪為一個(gè)落后的“古董”?

再者是容錯(cuò)率的錯(cuò)位。大模型如果出現(xiàn)嚴(yán)重的幻覺(jué)或安全漏洞,可以通過(guò)微調(diào)或推送 OTA 補(bǔ)丁來(lái)迅速修復(fù)。但是,一塊已經(jīng)刻好物理電路的芯片該怎么打補(bǔ)丁呢?一旦芯片內(nèi)固化的模型存在致命缺陷,整批昂貴的芯片大概率只能淪為硅垃圾。



對(duì)于這些致命的商業(yè)風(fēng)險(xiǎn),Taalas也給出了他們的防守策略。首先是微調(diào)的保留, HC1雖然鎖死了基礎(chǔ)權(quán)重,但依然保留了對(duì)低秩自適應(yīng)(LoRA)微調(diào)的支持。這意味著企業(yè)可以在物理大模型的外部,外掛小型的“知識(shí)補(bǔ)丁”來(lái)調(diào)整特定任務(wù)的表現(xiàn)。其次是極速的物理迭代,Taalas CEO 透露,改變模型并不需要重新設(shè)計(jì)整個(gè)底層硅片,而只需更改芯片最上層的兩層金屬層。這種制造工藝的創(chuàng)新,將新模型的硬件化周期壓縮到了驚人的兩個(gè)月,從而幫助模型實(shí)現(xiàn)小幅迭代。

縱然如此,這依然是一場(chǎng)與時(shí)間賽跑的豪賭。在這場(chǎng)博弈中,Taalas試圖用硬件的極致靜態(tài),去捕捉 AI 算法的極致動(dòng)態(tài),不可避免地帶有一些“刻舟求劍”的悲壯色彩。

四、蝴蝶效應(yīng):誰(shuí)在戰(zhàn)栗,誰(shuí)在狂歡?

盡管局限性很明顯,但Taalas這種“模型即芯片”的路線的面世,依然撕開(kāi)了英偉達(dá)絕對(duì)壟斷帝國(guó)的一道裂痕。

英偉達(dá)的地位,很大程度上歸功于其CUDA軟件生態(tài)。全世界的開(kāi)發(fā)者都在用CUDA寫(xiě)程序,這使得硬件的壁壘變成了堅(jiān)不可摧的軟件生態(tài)壁壘。但是,如果AI的盡頭不再需要軟件呢?



Taalas的路線意味著,在推理這個(gè)占據(jù)未來(lái)AI算力90%以上份額的市場(chǎng)中,CUDA的護(hù)城河被徹底繞過(guò)了。模型訓(xùn)練依然離不開(kāi)英偉達(dá)的GPU,但在最終落地應(yīng)用的端側(cè)和專業(yè)推理數(shù)據(jù)中心,ASIC專有芯片正在掀起一場(chǎng)“去英偉達(dá)化”的起義。

另外,隨著生成式AI加速進(jìn)入商業(yè)落地,Taalas之外,Groq、Cerebras、Etched等公司也分別在極速響應(yīng)、海量吞吐、特定算法加速方面進(jìn)行著不同的探索,都有可能一點(diǎn)點(diǎn)蠶食推理市場(chǎng),撼動(dòng)曾經(jīng)固若金湯的英偉達(dá)帝國(guó)。

同時(shí),存儲(chǔ)巨頭的狂歡也極可能降溫。目前,HBM芯片是存儲(chǔ)行業(yè)的超級(jí)印鈔機(jī)。但如果模型權(quán)重被內(nèi)化于電路,對(duì)龐大顯存的依賴將大幅降低。無(wú)存算分離架構(gòu)一旦普及,存儲(chǔ)廠商在 AI 時(shí)代的暴利預(yù)期將被大幅擠壓。

正因如此,Taalas將大模型刻進(jìn)硅片,絕不是AI算力的終點(diǎn),在不遠(yuǎn)的未來(lái),我們也許會(huì)看到算力市場(chǎng)的明顯分化:

云端與訓(xùn)練場(chǎng)依然是英偉達(dá)GPU和通用加速器的天下,用于探索AGI的智力邊界,處理那些最復(fù)雜、最多變的未知任務(wù)。

端側(cè)與流水線則是Taalas這類“物理硬化”芯片的汪洋大海,它們?nèi)缟匙影惚阋耍绻馑侔忝艚?,滲透進(jìn)每一個(gè)路燈、每一臺(tái)家電、每一個(gè)工業(yè)機(jī)器人中。

甚至,當(dāng)我們把目光放得更長(zhǎng)遠(yuǎn)一些,當(dāng)量子計(jì)算真正走向?qū)嵱?,或者類腦計(jì)算實(shí)現(xiàn)突破時(shí),今天我們?yōu)榱送黄岂T·諾依曼架構(gòu)所做的所有努力,可能都會(huì)成為技術(shù)史上一次次充滿勇氣而又略顯笨拙的嘗試。

結(jié)語(yǔ):從“全能大腦”到“硬件本能”

計(jì)算架構(gòu)的演進(jìn)從來(lái)不是單向的直線,而是螺旋上升的復(fù)調(diào)。從早期的專用打孔機(jī),到通用CPU,到專為圖形處理誕生的GPU,再到如今的AI ASIC,計(jì)算的歷史,就是在“通用靈活性”與“專用極致效率”之間不斷搖擺的過(guò)程。

Taalas的探索,或許在今天看來(lái)略顯激進(jìn),甚至面臨“出廠即落后”的窘境,但它向我們拋出了一個(gè)極具哲學(xué)意味的產(chǎn)業(yè)命題:

AI的終極演化形態(tài)究竟是什么?

它是否必須永遠(yuǎn)保持像水一樣可以隨意重塑的“通用軟件大腦”?

還是說(shuō),就像生物歷經(jīng)億萬(wàn)年進(jìn)化一樣,AI 也會(huì)將其最基礎(chǔ)、最成熟的智能(比如基礎(chǔ)的視覺(jué)識(shí)別、語(yǔ)言邏輯解析),內(nèi)化為無(wú)需思考、極低功耗運(yùn)行的“硅基硬件本能”?



回望科技史,任何偉大的范式轉(zhuǎn)換,往往都在非議與豪賭中誕生。

也許,未來(lái)的 AI 計(jì)算基座并不是非此即彼。云端依然是算力磅礴的通用 GPU 集群,而在萬(wàn)物互聯(lián)的終端,則是無(wú)數(shù)顆被固化了“本能”的低功耗 AI 芯片。

當(dāng)大模型不再是云端的高嶺之花,而是變成像電阻、電容一樣廉價(jià)且隨處可見(jiàn)的電子元器件時(shí),AI 真正的大爆發(fā),才算真的拉開(kāi)大幕。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
順德莫氏雞煲4月20日停業(yè)!網(wǎng)紅流量狂歡,鄰居抗議問(wèn)題根源在哪

順德莫氏雞煲4月20日停業(yè)!網(wǎng)紅流量狂歡,鄰居抗議問(wèn)題根源在哪

王姐懶人家常菜
2026-04-21 00:56:35
赫格塞斯突然一聲怒吼,記住五角大樓是誰(shuí)做主!當(dāng)場(chǎng)震住萬(wàn)斯親信

赫格塞斯突然一聲怒吼,記住五角大樓是誰(shuí)做主!當(dāng)場(chǎng)震住萬(wàn)斯親信

有范又有料
2026-04-21 11:49:16
馬筱梅重溫生產(chǎn)日,繼續(xù)拆婆婆張?zhí)m的臺(tái),網(wǎng)友:好賴話都聽(tīng)不明白

馬筱梅重溫生產(chǎn)日,繼續(xù)拆婆婆張?zhí)m的臺(tái),網(wǎng)友:好賴話都聽(tīng)不明白

悅君兮君不知
2026-04-20 10:30:17
37歲福原愛(ài)宣布三胎出生:母子健康平安,產(chǎn)后照曝光,前夫已祝福

37歲福原愛(ài)宣布三胎出生:母子健康平安,產(chǎn)后照曝光,前夫已祝福

開(kāi)開(kāi)森森
2026-04-19 07:41:03
2026折疊屏怎么選?實(shí)測(cè)四款旗艦,F(xiàn)ind N6憑均衡體驗(yàn)脫穎而出

2026折疊屏怎么選?實(shí)測(cè)四款旗艦,F(xiàn)ind N6憑均衡體驗(yàn)脫穎而出

科數(shù)朵頤
2026-04-20 11:15:31
CNN主播著急:中國(guó)若成頭號(hào)強(qiáng)國(guó),美國(guó)將無(wú)力回天

CNN主播著急:中國(guó)若成頭號(hào)強(qiáng)國(guó),美國(guó)將無(wú)力回天

觀察者網(wǎng)
2026-04-21 09:52:10
世錦賽今日賽程:中國(guó)4人出場(chǎng),國(guó)強(qiáng)硬剛火箭,范爭(zhēng)一再戰(zhàn)墨菲

世錦賽今日賽程:中國(guó)4人出場(chǎng),國(guó)強(qiáng)硬剛火箭,范爭(zhēng)一再戰(zhàn)墨菲

老高說(shuō)體育
2026-04-21 11:05:08
勞倫斯11大獎(jiǎng)項(xiàng)揭曉:網(wǎng)球包攬男女最佳!巴黎獲年度團(tuán)隊(duì) 中國(guó)0獎(jiǎng)

勞倫斯11大獎(jiǎng)項(xiàng)揭曉:網(wǎng)球包攬男女最佳!巴黎獲年度團(tuán)隊(duì) 中國(guó)0獎(jiǎng)

我愛(ài)英超
2026-04-21 06:25:56
比哈弗茨更該走人!阿森納昔日核心徹底下滑,淪為新版津琴科

比哈弗茨更該走人!阿森納昔日核心徹底下滑,淪為新版津琴科

瀾歸序
2026-04-21 06:09:10
鄭麗文成功了!國(guó)民黨3位元老出山,朱立倫的反撲計(jì)劃宣告失敗

鄭麗文成功了!國(guó)民黨3位元老出山,朱立倫的反撲計(jì)劃宣告失敗

健身狂人
2026-04-21 11:09:01
車長(zhǎng)5米3!華為乾崑奕境首款旗艦大六座SUV定名 X9

車長(zhǎng)5米3!華為乾崑奕境首款旗艦大六座SUV定名 X9

財(cái)經(jīng)汽車
2026-04-21 11:23:49
老蔣得知毛岸英犧牲,半夜支開(kāi)宋美齡,向兒子蔣經(jīng)國(guó)吐露心聲

老蔣得知毛岸英犧牲,半夜支開(kāi)宋美齡,向兒子蔣經(jīng)國(guó)吐露心聲

歷史點(diǎn)行
2026-04-09 23:52:43
燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個(gè)

燃?xì)夤旧祥T安檢,根本不是查漏氣!真正目的其實(shí)是這3個(gè)

匹夫來(lái)搞笑
2026-04-20 13:24:51
小S認(rèn)發(fā)起「大S最后日本旅行」 淚崩首吐內(nèi)心自責(zé):早知聽(tīng)媽的話

小S認(rèn)發(fā)起「大S最后日本旅行」 淚崩首吐內(nèi)心自責(zé):早知聽(tīng)媽的話

白面書(shū)誏
2026-04-20 17:05:28
男子爬上泰山“五岳獨(dú)尊”石刻拍照,景區(qū):將核查其身份進(jìn)行處理

男子爬上泰山“五岳獨(dú)尊”石刻拍照,景區(qū):將核查其身份進(jìn)行處理

揚(yáng)子晚報(bào)
2026-04-17 12:09:40
十大起義總指揮都是誰(shuí)

十大起義總指揮都是誰(shuí)

祁州校尉
2026-04-17 11:00:28
李小冉稱《心愿便利貼》讓她哭了兩個(gè)晚上:不知道我唱歌那么難聽(tīng)

李小冉稱《心愿便利貼》讓她哭了兩個(gè)晚上:不知道我唱歌那么難聽(tīng)

紅星新聞
2026-04-21 12:22:12
夫妻性和諧的最高境界:一個(gè)眼神就知道對(duì)方想要怎么爽

夫妻性和諧的最高境界:一個(gè)眼神就知道對(duì)方想要怎么爽

精彩分享快樂(lè)
2026-04-21 13:07:45
零跑D19上市72小時(shí)訂單數(shù)據(jù)曝光 均店新增大定達(dá)15臺(tái)

零跑D19上市72小時(shí)訂單數(shù)據(jù)曝光 均店新增大定達(dá)15臺(tái)

CNMO科技
2026-04-21 09:44:17
顧誠(chéng):關(guān)羽是怎樣捧起來(lái)的

顧誠(chéng):關(guān)羽是怎樣捧起來(lái)的

尚曦讀史
2026-04-11 10:10:02
2026-04-21 13:55:00
翼言商業(yè)觀察 incentive-icons
翼言商業(yè)觀察
新科技,新產(chǎn)業(yè),新消費(fèi)。
111文章數(shù) 3關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫(kù)克卸任,特努斯接任蘋(píng)果CEO

頭條要聞

匈牙利當(dāng)選總理毛焦?fàn)枺喝魞?nèi)塔尼亞胡入境 必將被逮捕

頭條要聞

匈牙利當(dāng)選總理毛焦?fàn)枺喝魞?nèi)塔尼亞胡入境 必將被逮捕

體育要聞

“被優(yōu)化”8年后,國(guó)乒方博決定換一條路重新上場(chǎng)

娛樂(lè)要聞

周潤(rùn)發(fā)時(shí)隔16年再賣樓,變現(xiàn)數(shù)億資產(chǎn)

財(cái)經(jīng)要聞

減速機(jī)訂單已排到明年!

汽車要聞

把天門山搬進(jìn)廠?開(kāi)仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

時(shí)尚
親子
家居
手機(jī)
軍事航空

“爆冷”又如何?陳法拉的人生本就是一場(chǎng)逆襲大戲

親子要聞

生完孩子 才是地獄級(jí)副本開(kāi)始

家居要聞

詩(shī)意光影 窺見(jiàn)自然之境

手機(jī)要聞

Omdia預(yù)測(cè):2026年智能手機(jī)AMOLED面板出貨下滑7%

軍事要聞

特朗普公開(kāi)對(duì)伊開(kāi)戰(zhàn)真正原因

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版