国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

挑戰(zhàn)英偉達(dá)算力霸權(quán)?多倫多一家創(chuàng)企將大模型“刻進(jìn)”芯片

0
分享至



翼言商業(yè)觀察

是破局突圍,還是刻舟求劍?

在硅谷當(dāng)下的宏大敘事中,算力即權(quán)力。

英偉達(dá)的 GPU 似乎成了通往AGI唯一且昂貴的門(mén)票。當(dāng)整個(gè)行業(yè)都在狂熱地堆疊“更大、更貴、更耗電”的 GPU 集群時(shí),一種極具顛覆性的底層技術(shù)叛逆卻在暗處悄然發(fā)生。


近日,一家成立不到三年、位于多倫多的初創(chuàng)公司 Taalas 拋出了一個(gè)讓半導(dǎo)體與 AI 業(yè)界側(cè)目的方案:他們將 Meta 的 Llama 大模型直接“硬連線”(Hardwired)進(jìn)了 ASIC(專用集成電路)芯片。 這并非一次常規(guī)的硬件制程升級(jí),而是一場(chǎng)物理層面的暴力重構(gòu)。

由Tenstorrent前聯(lián)合創(chuàng)始人Ljubisa Bajic帶隊(duì)的這群工程師,不再依賴昂貴的HBM顯存,拋棄了液冷:模型不再是以軟件代碼的形式運(yùn)行在通用硬件上,也不再需要頻繁地從高帶寬顯存(HBM)中吞吐成百上千 GB 的權(quán)重?cái)?shù)據(jù)。Llama 龐大的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和數(shù)十億參數(shù),被直接固化進(jìn)物理電路,成為了芯片本身——芯片即模型,模型即芯片。

在這塊采用臺(tái)積電6納米工藝、面積達(dá)815平方毫米的芯片上,單用戶運(yùn)行Llama 3.1 8B的推理吞吐達(dá)到了令人瞠目的17,000 tokens/秒。作為對(duì)比,這個(gè)速度是英偉達(dá)最頂尖GPU的數(shù)十倍,是人類閱讀或思考速度的成百上千倍。生成一部詳盡的二戰(zhàn)逐月編年史,僅需0.138秒。

這一反常識(shí)的技術(shù)路線,究竟是打破算力瓶頸的終極突破,還是無(wú)視模型迭代規(guī)律的“刻舟求劍”?

一、歷史的鐘擺

天下苦“內(nèi)存墻”久矣

Taalas 之所以做如此激進(jìn)的嘗試,是因?yàn)楫?dāng)前 AI 產(chǎn)業(yè)有一個(gè)隱疾:內(nèi)存墻(Memory Wall)。

自計(jì)算機(jī)誕生以來(lái),統(tǒng)治整個(gè)行業(yè)的基石是“馮·諾依曼架構(gòu)”,其設(shè)計(jì)中就存在計(jì)算與存儲(chǔ)分離的特點(diǎn):需要計(jì)算時(shí),就從后臺(tái)把數(shù)據(jù)搬運(yùn)到舞臺(tái)上,算完再搬回去。


在模型只有幾兆、幾十兆的時(shí)代,這個(gè)架構(gòu)運(yùn)轉(zhuǎn)良好。但是,當(dāng)大語(yǔ)言模型膨脹到幾百億、上千億參數(shù)時(shí),這一經(jīng)典架構(gòu)正在成為最大的絆腳石。GPU 運(yùn)行大模型進(jìn)行推理時(shí),它并沒(méi)有把大部分精力花在計(jì)算上,而是被迫變成了一個(gè)疲于奔命的“搬運(yùn)工”——海量的模型權(quán)重?cái)?shù)據(jù)需要在顯存和計(jì)算單元之間來(lái)回穿梭,高達(dá) 80% 的功耗和延遲都浪費(fèi)在了這種數(shù)據(jù)的物理搬運(yùn)上。這不僅造就了英偉達(dá)龐大的護(hù)城河,也直接捧紅了價(jià)格極其昂貴的 HBM 存儲(chǔ)芯片。AI行業(yè)苦“內(nèi)存墻”久矣,它讓 AI 推理的成本居高不下,讓數(shù)據(jù)中心變成了吞噬電力的巨獸。

Taalas 的 ASIC 路線,本質(zhì)上是對(duì)這筆“算力稅”的徹底逃避。當(dāng)模型權(quán)重不再是以數(shù)據(jù)的形式存在于內(nèi)存中,而是變成了固化的晶體管開(kāi)閉狀態(tài),數(shù)據(jù)搬運(yùn)的動(dòng)作就在物理層面上被抹除了。

二、絕對(duì)速度與“電子牛馬”

商業(yè)落地的場(chǎng)景價(jià)值

Taalas打破內(nèi)存墻帶來(lái)的最直接后果,是成本和能效比的恐怖斷層。


傳統(tǒng)的GPU數(shù)據(jù)中心是名副其實(shí)的“電老虎”,動(dòng)輒需要液冷伺候。而Taalas的HC1芯片,單顆功耗僅約250W。即使部署10顆芯片,總功耗不過(guò)2.5千瓦,僅靠常規(guī)的空氣冷卻就能穩(wěn)定運(yùn)行。根據(jù)Taalas官方及業(yè)界測(cè)算,其百萬(wàn)Token的推理成本僅為0.0075美元左右,是傳統(tǒng)GPU方案的二十分之一甚至更低。在“唯快不破”和“降本增效”成為行業(yè)鐵律的今天,這組數(shù)據(jù)的沖擊力毋庸多言。

從工程學(xué)的角度來(lái)看,這顯然是一次驚人的效率躍升;而在模型快速迭代的今天,一個(gè)不能更新、不能運(yùn)行其他模型的芯片,聽(tīng)起來(lái)顯然又像個(gè)笑話。但是,如果我們跳出“打造全知全能AGI”的宏大敘事,將目光投向海量的商業(yè)垂直場(chǎng)景,也許會(huì)發(fā)現(xiàn),這種“固化”非但不是缺陷,反而可能是某些場(chǎng)景下的最優(yōu)解。

在真實(shí)的商業(yè)世界里,并非所有場(chǎng)景都需要一個(gè)通曉量子力學(xué)、能寫(xiě)莎士比亞十四行詩(shī)的GPT5甚至更新的模型。大部分場(chǎng)景需要的,是一個(gè)極其穩(wěn)定、便宜、速度極快且不需要休息的“電子牛馬”。


想象一下工業(yè)流水線上的毫秒級(jí)殘次品視覺(jué)識(shí)別、智能汽車(chē)?yán)镄枰^對(duì)零延遲響應(yīng)的端側(cè)語(yǔ)音中樞、數(shù)以億計(jì)的家用陪伴機(jī)器人或兒童玩偶……在這些場(chǎng)景中,企業(yè)根本不在乎你能否兼容最新的大模型框架,他們?cè)诤醯氖牵耗懿荒苡脦酌婪值某杀?,把手頭這件特定的任務(wù)做到光速?

Taalas的HC1,正好可以解決這種“規(guī)?;瘑我蝗蝿?wù)”。當(dāng)17,000 tokens/秒的速度應(yīng)用在語(yǔ)音助手上,AI的回答將比人類的神經(jīng)反射還要快,“等待LLM思考”的轉(zhuǎn)圈動(dòng)畫(huà)將徹底成為歷史。一個(gè)原本需要幾百瓦功率、必須插在液冷服務(wù)器上的大模型,未來(lái)也許只需幾瓦的電量,就能被輕易塞進(jìn)一臺(tái)掃地機(jī)器人、一部智能手機(jī),甚至是一副輕薄的AI眼鏡中。真正的“萬(wàn)物皆 AI”,也只有在算力和功耗被極度壓縮后才可能實(shí)現(xiàn)。

三、刻舟求劍的隱憂

被“凍結(jié)”在芯片里的智慧

盡管如此,鑒于當(dāng)前 AI 算法一日千里的演進(jìn)速度,Taalas 的路線極具風(fēng)險(xiǎn)的另一面也是不容忽視的。將流動(dòng)的軟件代碼固化為冰冷的物理電路,意味著犧牲了靈活性。這里有兩個(gè)極其尖銳的現(xiàn)實(shí)錯(cuò)位。

首先是迭代周期的錯(cuò)位。如今,開(kāi)源大模型的進(jìn)化是以“月”甚至“周”為單位的。但一顆先進(jìn)制程的芯片,從架構(gòu)設(shè)計(jì)、流片到最終量產(chǎn),通常需要 18 到 24 個(gè)月。而當(dāng)它走下產(chǎn)線時(shí),它所“凍結(jié)”的 Llama 模型,在日新月異的算法世界里,是否已經(jīng)淪為一個(gè)落后的“古董”?

再者是容錯(cuò)率的錯(cuò)位。大模型如果出現(xiàn)嚴(yán)重的幻覺(jué)或安全漏洞,可以通過(guò)微調(diào)或推送 OTA 補(bǔ)丁來(lái)迅速修復(fù)。但是,一塊已經(jīng)刻好物理電路的芯片該怎么打補(bǔ)丁呢?一旦芯片內(nèi)固化的模型存在致命缺陷,整批昂貴的芯片大概率只能淪為硅垃圾。

對(duì)于這些致命的商業(yè)風(fēng)險(xiǎn),Taalas也給出了他們的防守策略。首先是微調(diào)的保留, HC1雖然鎖死了基礎(chǔ)權(quán)重,但依然保留了對(duì)低秩自適應(yīng)(LoRA)微調(diào)的支持。這意味著企業(yè)可以在物理大模型的外部,外掛小型的“知識(shí)補(bǔ)丁”來(lái)調(diào)整特定任務(wù)的表現(xiàn)。其次是極速的物理迭代,Taalas CEO 透露,改變模型并不需要重新設(shè)計(jì)整個(gè)底層硅片,而只需更改芯片最上層的兩層金屬層。這種制造工藝的創(chuàng)新,將新模型的硬件化周期壓縮到了驚人的兩個(gè)月,從而幫助模型實(shí)現(xiàn)小幅迭代。

縱然如此,這依然是一場(chǎng)與時(shí)間賽跑的豪賭。在這場(chǎng)博弈中,Taalas試圖用硬件的極致靜態(tài),去捕捉 AI 算法的極致動(dòng)態(tài),不可避免地帶有一些“刻舟求劍”的悲壯色彩。

四、蝴蝶效應(yīng)

誰(shuí)在戰(zhàn)栗,誰(shuí)在狂歡?

盡管局限性很明顯,但Taalas這種“模型即芯片”的路線的面世,依然撕開(kāi)了英偉達(dá)絕對(duì)壟斷帝國(guó)的一道裂痕。

英偉達(dá)的地位,很大程度上歸功于其CUDA軟件生態(tài)。全世界的開(kāi)發(fā)者都在用CUDA寫(xiě)程序,這使得硬件的壁壘變成了堅(jiān)不可摧的軟件生態(tài)壁壘。但是,如果AI的盡頭不再需要軟件呢?


Taalas的路線意味著,在推理這個(gè)占據(jù)未來(lái)AI算力90%以上份額的市場(chǎng)中,CUDA的護(hù)城河被徹底繞過(guò)了。模型訓(xùn)練依然離不開(kāi)英偉達(dá)的GPU,但在最終落地應(yīng)用的端側(cè)和專業(yè)推理數(shù)據(jù)中心,ASIC專有芯片正在掀起一場(chǎng)“去英偉達(dá)化”的起義。

另外,隨著生成式AI加速進(jìn)入商業(yè)落地,Taalas之外,Groq、Cerebras、Etched等公司也分別在極速響應(yīng)、海量吞吐、特定算法加速方面進(jìn)行著不同的探索,都有可能一點(diǎn)點(diǎn)蠶食推理市場(chǎng),撼動(dòng)曾經(jīng)固若金湯的英偉達(dá)帝國(guó)。

同時(shí),存儲(chǔ)巨頭的狂歡也極可能降溫。目前,HBM芯片是存儲(chǔ)行業(yè)的超級(jí)印鈔機(jī)。但如果模型權(quán)重被內(nèi)化于電路,對(duì)龐大顯存的依賴將大幅降低。無(wú)存算分離架構(gòu)一旦普及,存儲(chǔ)廠商在 AI 時(shí)代的暴利預(yù)期將被大幅擠壓。

正因如此,Taalas將大模型刻進(jìn)硅片,絕不是AI算力的終點(diǎn),在不遠(yuǎn)的未來(lái),我們也許會(huì)看到算力市場(chǎng)的明顯分化:

云端與訓(xùn)練場(chǎng)依然是英偉達(dá)GPU和通用加速器的天下,用于探索AGI的智力邊界,處理那些最復(fù)雜、最多變的未知任務(wù)。

端側(cè)與流水線則是Taalas這類“物理硬化”芯片的汪洋大海,它們?nèi)缟匙影惚阋耍绻馑侔忝艚?,滲透進(jìn)每一個(gè)路燈、每一臺(tái)家電、每一個(gè)工業(yè)機(jī)器人中。

甚至,當(dāng)我們把目光放得更長(zhǎng)遠(yuǎn)一些,當(dāng)量子計(jì)算真正走向?qū)嵱茫蛘哳惸X計(jì)算實(shí)現(xiàn)突破時(shí),今天我們?yōu)榱送黄岂T·諾依曼架構(gòu)所做的所有努力,可能都會(huì)成為技術(shù)史上一次次充滿勇氣而又略顯笨拙的嘗試。

結(jié)語(yǔ)

從“全能大腦”到“硬件本能”

計(jì)算架構(gòu)的演進(jìn)從來(lái)不是單向的直線,而是螺旋上升的復(fù)調(diào)。從早期的專用打孔機(jī),到通用CPU,到專為圖形處理誕生的GPU,再到如今的AI ASIC,計(jì)算的歷史,就是在“通用靈活性”與“專用極致效率”之間不斷搖擺的過(guò)程。

Taalas的探索,或許在今天看來(lái)略顯激進(jìn),甚至面臨“出廠即落后”的窘境,但它向我們拋出了一個(gè)極具哲學(xué)意味的產(chǎn)業(yè)命題:

AI的終極演化形態(tài)究竟是什么?

它是否必須永遠(yuǎn)保持像水一樣可以隨意重塑的“通用軟件大腦”?

還是說(shuō),就像生物歷經(jīng)億萬(wàn)年進(jìn)化一樣,AI 也會(huì)將其最基礎(chǔ)、最成熟的智能(比如基礎(chǔ)的視覺(jué)識(shí)別、語(yǔ)言邏輯解析),內(nèi)化為無(wú)需思考、極低功耗運(yùn)行的“硅基硬件本能”?


回望科技史,任何偉大的范式轉(zhuǎn)換,往往都在非議與豪賭中誕生。

也許,未來(lái)的 AI 計(jì)算基座并不是非此即彼。云端依然是算力磅礴的通用 GPU 集群,而在萬(wàn)物互聯(lián)的終端,則是無(wú)數(shù)顆被固化了“本能”的低功耗 AI 芯片。

當(dāng)大模型不再是云端的高嶺之花,而是變成像電阻、電容一樣廉價(jià)且隨處可見(jiàn)的電子元器件時(shí),AI 真正的大爆發(fā),才算真的拉開(kāi)大幕。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
普京訪華行程敲定,特朗普已下命令,中國(guó)向全球通告,無(wú)懼美國(guó)

普京訪華行程敲定,特朗普已下命令,中國(guó)向全球通告,無(wú)懼美國(guó)

桑啟紅原
2026-04-20 20:19:05
美專家:美國(guó)在伊朗正面臨四個(gè)大問(wèn)題

美專家:美國(guó)在伊朗正面臨四個(gè)大問(wèn)題

環(huán)球時(shí)報(bào)國(guó)際
2026-04-21 00:16:12
國(guó)際奧委會(huì)明確表態(tài),對(duì)2036年奧運(yùn)會(huì)的申辦情況很是失望

國(guó)際奧委會(huì)明確表態(tài),對(duì)2036年奧運(yùn)會(huì)的申辦情況很是失望

安安說(shuō)
2026-04-20 11:09:20
哈登16+2!騎士54-48猛龍,看數(shù)據(jù):他才是頭號(hào)功臣!

哈登16+2!騎士54-48猛龍,看數(shù)據(jù):他才是頭號(hào)功臣!

運(yùn)籌帷幄的籃球
2026-04-21 08:12:30
日本將地震震級(jí)調(diào)整至7.5級(jí)

日本將地震震級(jí)調(diào)整至7.5級(jí)

界面新聞
2026-04-20 16:30:33
罰15億!拼多多一員工故意關(guān)門(mén),對(duì)抗調(diào)查,導(dǎo)致執(zhí)法人員手指骨折

罰15億!拼多多一員工故意關(guān)門(mén),對(duì)抗調(diào)查,導(dǎo)致執(zhí)法人員手指骨折

魔都姐姐雜談
2026-04-19 08:03:27
中央層面整治形式主義為基層減負(fù)專項(xiàng)工作機(jī)制辦公室 中央紀(jì)委辦公廳公開(kāi)通報(bào)4起整治形式主義為基層減負(fù)典型問(wèn)題

中央層面整治形式主義為基層減負(fù)專項(xiàng)工作機(jī)制辦公室 中央紀(jì)委辦公廳公開(kāi)通報(bào)4起整治形式主義為基層減負(fù)典型問(wèn)題

新華社
2026-04-20 17:44:02
“巴掌遮陽(yáng)帽”在TikTok刷屏、義烏緊急跟進(jìn),利潤(rùn)翻了近10倍

“巴掌遮陽(yáng)帽”在TikTok刷屏、義烏緊急跟進(jìn),利潤(rùn)翻了近10倍

去山野間追風(fēng)
2026-04-21 03:16:20
撤下主力放棄比賽,替補(bǔ)卻反敗為勝!哈登都看傻了

撤下主力放棄比賽,替補(bǔ)卻反敗為勝!哈登都看傻了

林子說(shuō)事
2026-04-21 02:26:26
“找到一個(gè)媳婦算你?!?,農(nóng)村家長(zhǎng)曬7兒1女,被群嘲后看清現(xiàn)實(shí)

“找到一個(gè)媳婦算你牛”,農(nóng)村家長(zhǎng)曬7兒1女,被群嘲后看清現(xiàn)實(shí)

妍妍教育日記
2026-04-20 19:42:54
歐爾班下臺(tái),這個(gè)歐洲國(guó)家卻可能再次擁抱一位親俄領(lǐng)導(dǎo)人

歐爾班下臺(tái),這個(gè)歐洲國(guó)家卻可能再次擁抱一位親俄領(lǐng)導(dǎo)人

上觀新聞
2026-04-20 15:58:42
睡一覺(jué)5萬(wàn)沒(méi)了!全國(guó)多地爆發(fā)新型盜刷,睡前必查手機(jī)這4處

睡一覺(jué)5萬(wàn)沒(méi)了!全國(guó)多地爆發(fā)新型盜刷,睡前必查手機(jī)這4處

洞見(jiàn)小能手
2026-04-20 16:03:26
冠心病去世的越來(lái)越多,建議:1不喝、2不碰、3堅(jiān)持,別大意了

冠心病去世的越來(lái)越多,建議:1不喝、2不碰、3堅(jiān)持,別大意了

芹姐說(shuō)生活
2026-04-20 16:10:12
中國(guó)高校只剩7年窗口期 學(xué)生數(shù)量斷崖式塌方后一半高校都得死

中國(guó)高校只剩7年窗口期 學(xué)生數(shù)量斷崖式塌方后一半高校都得死

六子吃涼粉
2026-04-20 19:10:49
高市早苗向靖國(guó)神社獻(xiàn)祭品

高市早苗向靖國(guó)神社獻(xiàn)祭品

新華社
2026-04-21 05:59:03
拼多多暴力抗法震驚全網(wǎng),市值萬(wàn)億巨頭為何如此囂張

拼多多暴力抗法震驚全網(wǎng),市值萬(wàn)億巨頭為何如此囂張

燕梳樓頻道
2026-04-20 21:12:04
普通家庭千萬(wàn)不要買(mǎi)“小聯(lián)排別墅”,看著很高級(jí),住著卻難受!

普通家庭千萬(wàn)不要買(mǎi)“小聯(lián)排別墅”,看著很高級(jí),住著卻難受!

裝修秀
2026-04-20 10:50:03
震驚!網(wǎng)傳深圳中專打工女偽造百億富三代人設(shè),收割尊界S800車(chē)主

震驚!網(wǎng)傳深圳中專打工女偽造百億富三代人設(shè),收割尊界S800車(chē)主

火山詩(shī)話
2026-04-20 13:37:00
欲哭無(wú)淚!47歲男子赴深圳求職一個(gè)月無(wú)果,住低價(jià)旅館,一日一餐

欲哭無(wú)淚!47歲男子赴深圳求職一個(gè)月無(wú)果,住低價(jià)旅館,一日一餐

火山詩(shī)話
2026-04-21 06:36:18
丈夫騎車(chē)躲狗摔倒致妻死亡,家屬起訴違停車(chē)主124萬(wàn),法院判了

丈夫騎車(chē)躲狗摔倒致妻死亡,家屬起訴違停車(chē)主124萬(wàn),法院判了

大魚(yú)簡(jiǎn)科
2026-04-20 19:38:39
2026-04-21 08:23:00
翼言商業(yè)觀察 incentive-icons
翼言商業(yè)觀察
新科技,新產(chǎn)業(yè),新消費(fèi)。
111文章數(shù) 3關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫(kù)克卸任,特努斯接任蘋(píng)果CEO

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂(lè)要聞

《八千里路云和月》田家泰暗殺

財(cái)經(jīng)要聞

利潤(rùn)暴跌7成,字節(jié)到底在做什么

汽車(chē)要聞

把天門(mén)山搬進(jìn)廠?開(kāi)仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

教育
時(shí)尚
手機(jī)
藝術(shù)
本地

教育要聞

加權(quán)費(fèi)馬點(diǎn)模型,一個(gè)視頻學(xué)明白!

春天衣服不用準(zhǔn)備太多!這幾大單品提前備好,百搭實(shí)用又不過(guò)時(shí)

手機(jī)要聞

蘋(píng)果被曝下調(diào) iPhone 18 規(guī)格以壓縮成本

藝術(shù)要聞

春天最適合小住三五天的地方

本地新聞

12噸巧克力有難,全網(wǎng)化身超級(jí)偵探添亂

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版