国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPU要涼?前英偉達(dá)AMD大神將AI刻在芯片上!17000 tokens/秒屠榜

0
分享至


新智元報(bào)道

編輯:定慧

【新智元導(dǎo)讀】在這個(gè)所有科技巨頭都在為英偉達(dá)的高端GPU搶破頭的時(shí)代,一家成立不到三年的多倫多小廠Taalas,突然朝著整個(gè)行業(yè)扔出了一顆反常識(shí)的「深水炸彈」:他們拋棄了液冷,拋棄了昂貴的HBM顯存,甚至拋棄了「通用計(jì)算」,選擇了一種最粗暴、最狂野的物理美學(xué):直接把大模型焊死在芯片里!

今天是大年初六,年還沒(méi)過(guò)完。但有一個(gè)新聞卻淹沒(méi)在各種消息中。

這可能是今年最重要的AI新聞,但現(xiàn)在依然還沒(méi)什么人聊!

這兩天,一家成立不到三年的多倫多芯片公司Taalas扔下了一顆核彈:

他們繞開了所有熱門概念,直接把AI大模型,物理焊死在芯片里!


這家公司開發(fā)的HC1芯片,運(yùn)行Llama 3.1 8B的速度達(dá)到了極度恐怖的17,000tokens/秒。


作為對(duì)比,目前業(yè)界最快Cerebras跑同等模型,速度也不過(guò)兩千。

Taalas HC1硬生生將速度拔高了將近10倍!

而和英偉達(dá)最先進(jìn)B200,提高了近50倍!


他們還上線了一個(gè)體驗(yàn)網(wǎng)站:chatjimmy.ai


這個(gè)AI的速度有多離譜呢?可以看看下面的速度。


這個(gè)AI不是在回復(fù),而是直接未卜先知把答案砸在你的臉上。


這還不算完,除了「光速」輸出Token以外。

Taalas如何解決散熱和傳輸速度問(wèn)題?

他們交出的答卷是:拋棄液冷!拋棄HBM顯存!

因?yàn)闆](méi)有復(fù)雜的存儲(chǔ)層級(jí),HC1的成本只有傳統(tǒng)方案的1/20,功耗更是直接縮減到1/10,十張卡加起來(lái)僅僅需要2.5千瓦的空氣冷卻。


官方博客:https://taalas.com/the-path-to-ubiquitous-ai/

在這塊主打「復(fù)古暴力」的芯片里,它出廠時(shí)的命運(yùn)就被永遠(yuǎn)鎖死——它的晶體管只為L(zhǎng)lama 3.1 8B的權(quán)重而生,這輩子只能跑這一個(gè)模型。


一時(shí)間,X上徹底炸鍋了!

「等待LLM思考」的時(shí)代宣告終結(jié)。


有測(cè)試者滿臉震撼:

「你敲下回車的瞬間,答案就像預(yù)謀已久一樣撲在屏幕上,那根本不是秒回,那是啪地一下砸你臉上!」


有網(wǎng)友發(fā)出了絕望的哀嘆:「人類該怎么跟得上這種速度?」


另一位網(wǎng)友的回答則更加冷酷:「尊敬的先生,我們不可能跟得上?!?/p>


但反方意見(jiàn)同樣明確。

首先就是,雖然速度達(dá)到「光速」,但是小模型帶來(lái)的幻覺(jué)問(wèn)題無(wú)法避免。

甚至無(wú)法正確計(jì)算簡(jiǎn)單的加減乘除。


而且按照現(xiàn)在的模型的迭代速度。

在一個(gè)物理實(shí)體上固化一個(gè)即將被淘汰的模型,真的有用么?


也有樂(lè)觀者認(rèn)為,這可能確實(shí)是未來(lái)的一種方向,因?yàn)檫@種Token的輸出速度,并不是給人類準(zhǔn)備的。

而是讓智能體之間相互對(duì)話使用的。


所以,Taalas這條所謂的物理實(shí)體AI之路是否真的能走通?


暴力美學(xué)vs極致封?。?/strong>AI的兩條路線之爭(zhēng)

要看懂這場(chǎng)「豪賭」的意義,我們必須回顧一下芯片的發(fā)展史。

過(guò)去三十年,無(wú)論是CPU還是GPU,甚至是后來(lái)的各種AI加速器,整個(gè)硅谷都在瘋狂追求同一件事:「造一個(gè)通用的計(jì)算平臺(tái)」

我們?cè)谠煲粋€(gè)巨大的舞臺(tái),然后讓不同的軟件在上面跳舞。

這就形成了一個(gè)絕對(duì)的物理硬邊界:「內(nèi)存墻」。


內(nèi)存墻通常是指處理器速度和內(nèi)存帶寬之間不斷擴(kuò)大的差距

當(dāng)模型膨脹到幾百億、上千億參數(shù),你為了算一次乘法,每次都要把海量數(shù)據(jù)從顯存搬到計(jì)算單元。

這個(gè)「搬磚」過(guò)程消耗的能量和時(shí)間,早就遠(yuǎn)遠(yuǎn)超過(guò)了計(jì)算本身。

Taalas團(tuán)隊(duì)的思路簡(jiǎn)直是「反向升級(jí)」:

既然這個(gè)舞臺(tái)每天都只演《羅密歐與朱麗葉》,我們?yōu)槭裁匆M(fèi)勁巴拉地每天搬布景?直接把布景用水泥砌死在臺(tái)上不就行了!

在這塊HC1芯片里,模型的每一個(gè)權(quán)重,都對(duì)應(yīng)著芯片上特定的晶體管。


矩陣乘法根本不需要軟件去調(diào)度,而是通過(guò)物理電路的電流直接完成!

你可以把傳統(tǒng)的GPU理解為「交響樂(lè)團(tuán)現(xiàn)場(chǎng)演奏」,每次運(yùn)行都要調(diào)配樂(lè)手、看曲譜、聽(tīng)指揮;

那么Taalas的做法就是直接刻了一張「黑膠唱片」。

你把Llama模型錄死在磁帶上,插上電就能播,而且是以一種摧枯拉朽的倍速在狂飆。

但,一切命運(yùn)的饋贈(zèng),都在暗中早就標(biāo)好了價(jià)格!


這也意味著,只要這塊芯片一出廠,它的命運(yùn)就已經(jīng)被徹底鎖死

它無(wú)法微調(diào),無(wú)法更換模型,更無(wú)法升級(jí)。

如果明年Meta發(fā)布了Llama 4,或者你發(fā)現(xiàn)這個(gè)8B模型在特定業(yè)務(wù)里太卡智商,這塊滿載尖端科技的硅片,瞬間就會(huì)淪為精美的電子垃圾。

在這個(gè)所有巨頭都在拼命炫耀自家新模型多聰明的時(shí)代,主動(dòng)把自己鎖死在一個(gè)固定的歷史版本上,這到底是逆天改命,還是飲鴆止渴?

路線大分裂與人腦的奇妙隱喻

事實(shí)上,這種極盡專用的思路,背后牽扯出的是一場(chǎng)硅谷頂級(jí)大佬的路線大決裂。

Taalas的CEO Ljubisa Bajic曾在AMD、英偉達(dá)擔(dān)任骨干架構(gòu)師,也是明星AI芯片公司Tenstorrent的創(chuàng)始人。


2022年,「芯片之神」Jim Keller(「硅仙人」)加入Tenstorrent,Jim Keller 不僅為該公司提供了第一筆資金,后來(lái)更直接加入公司擔(dān)任CTO,并于2023年與Ljubisa Bajic互換角色出任CEO。


Ljubisa在2023年4月宣布從Tenstorrent的日常管理崗位「退休」并轉(zhuǎn)任顧問(wèn),其實(shí)是為了追求一個(gè)更激進(jìn)、更極端的計(jì)算夢(mèng)想。

他隨后創(chuàng)辦了新公司Taalas。

Jim Keller的畢生信仰,是做一個(gè)通用的、可編程的、軟件友好的完美平臺(tái)。

擴(kuò)展閱讀:英偉達(dá)親手終結(jié)CUDA「護(hù)城河」?傳奇芯片架構(gòu)師引發(fā)爭(zhēng)議


而Ljubisa則決絕地走向了另一個(gè)極端——

絕對(duì)的極繁固化,換取絕對(duì)的極簡(jiǎn)自由。

對(duì)于這種把AI模型做成ASIC(專用集成電路)的做法,網(wǎng)上的評(píng)價(jià)兩極分化。

有人嘲諷「流片貴得嚇人,模型一更新舊卡就炸死路一條」,但也有極其敏銳的觀察者,將它與人類大腦的運(yùn)行機(jī)制,產(chǎn)生了深度的共振。

X上一條高贊評(píng)論直指靈魂:

「哈佛和谷歌耗盡資源,花了十年時(shí)間,才勉強(qiáng)繪制出1立方毫米、比米粒還小的人腦圖譜。這背后的數(shù)學(xué)復(fù)雜度和能效比,足以讓地球上所有的AI實(shí)驗(yàn)室集體汗顏?!?/strong>


人類大腦那種不可思議的精密和低功耗,本質(zhì)上不就是一種長(zhǎng)在肉體上的「硬件固化」嗎?


且人腦的運(yùn)算雖然精妙,但光論「生成代碼」和「吐詞」的速度,可遠(yuǎn)沒(méi)有這類新硬件這般快如閃電。


另一位網(wǎng)友的一席話更讓人破防:

「其實(shí)大部分人類,一輩子也就說(shuō)一種語(yǔ)言、做著一份固定的職業(yè)。

這和大腦里刻死了一個(gè)模型有什么區(qū)別?」

一語(yǔ)驚醒夢(mèng)中人。

我們并非在所有的場(chǎng)景里,都需要一個(gè)通曉天文地理、能寫詩(shī)能解微分方程的「全知全能神」。

在海量的垂直場(chǎng)景里——比如一個(gè)需要毫秒級(jí)響應(yīng)的語(yǔ)音助手,流水線上的自動(dòng)化數(shù)據(jù)標(biāo)注,甚至是你家里每天只懂避障的掃地機(jī)。

它們根本不在乎你是GPT-6還是Claude 5,它們需要的僅僅是像一顆釘子一樣,用光速和最低廉的成本,把手頭那件事干到極致。

這時(shí)候,一個(gè)極其便宜、永遠(yuǎn)不需要換代的「電子牛馬」芯片,就足夠了。

也許這就是AI走向物理世界的終極兩極分化:

一部分化作云端龐大而昂貴的通用神靈;

而另一部分,則被死死刻進(jìn)硅晶體里,化作數(shù)以百億計(jì)的廉價(jià)、極速的工匠,滲透進(jìn)人類生活的每一個(gè)毛孔。

Taalas這步險(xiǎn)棋,可能成為技術(shù)史上一次昂貴而有趣的注腳,但也極有可能,正在砸開一扇用「零延遲」統(tǒng)治未來(lái)的大門。

無(wú)論怎樣,17,000 tokens/秒的兇獸已經(jīng)出籠。

在絕對(duì)的速度和暴力成本面前,傳統(tǒng)的AI硬件法則,已經(jīng)出現(xiàn)了一道刺眼的裂痕。

你認(rèn)為人類的科技樹,應(yīng)該點(diǎn)在哪里?

參考資料:

https://x.com/wildmindai/status/2024810128487096357

https://x.com/ai_for_success/status/2025239027490971681

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
社保約25年,個(gè)人賬戶約14萬(wàn),1月深圳退休,能領(lǐng)多少養(yǎng)老金?

社保約25年,個(gè)人賬戶約14萬(wàn),1月深圳退休,能領(lǐng)多少養(yǎng)老金?

白淺娛樂(lè)聊
2026-02-26 18:22:40
新加坡大滿貫賽:首個(gè)女單8強(qiáng)出爐!張本美和3:0晉級(jí),沖擊冠軍

新加坡大滿貫賽:首個(gè)女單8強(qiáng)出爐!張本美和3:0晉級(jí),沖擊冠軍

國(guó)乒二三事
2026-02-26 14:24:36
畫風(fēng)突變!廣東今年首場(chǎng)強(qiáng)對(duì)流天氣來(lái)了

畫風(fēng)突變!廣東今年首場(chǎng)強(qiáng)對(duì)流天氣來(lái)了

廣東發(fā)布
2026-02-26 17:29:50
完爆SSD、機(jī)械硬盤!科學(xué)家造出近乎堅(jiān)不可摧的晶體:能將數(shù)據(jù)保存萬(wàn)年

完爆SSD、機(jī)械硬盤!科學(xué)家造出近乎堅(jiān)不可摧的晶體:能將數(shù)據(jù)保存萬(wàn)年

快科技
2026-02-26 15:25:22
“火箭軍女神”李莉,幾句話找出美隱形戰(zhàn)機(jī),被美國(guó)人視為眼中釘

“火箭軍女神”李莉,幾句話找出美隱形戰(zhàn)機(jī),被美國(guó)人視為眼中釘

談史論天地
2026-02-26 11:12:53
23歲女港警在警署內(nèi)身亡,懷疑系開槍自殺

23歲女港警在警署內(nèi)身亡,懷疑系開槍自殺

南方都市報(bào)
2026-02-25 11:22:39
明朝“最懶”的對(duì)聯(lián):上聯(lián)和下聯(lián)一字不差,卻成千古絕對(duì)流傳至今

明朝“最懶”的對(duì)聯(lián):上聯(lián)和下聯(lián)一字不差,卻成千古絕對(duì)流傳至今

銘記歷史呀
2026-02-03 16:11:20
離譜!江蘇29歲女子相親嫌男方,吐槽:31歲開10萬(wàn)車也好意思來(lái)?

離譜!江蘇29歲女子相親嫌男方,吐槽:31歲開10萬(wàn)車也好意思來(lái)?

川渝視覺(jué)
2026-02-26 12:41:03
1952年新疆匪首提8個(gè)投降條件,王震拒絕,毛主席拍板:全部同意

1952年新疆匪首提8個(gè)投降條件,王震拒絕,毛主席拍板:全部同意

嘆為觀止易
2026-02-20 13:27:00
原來(lái)他倆是母子,母親是頂級(jí)歌后,兒子是導(dǎo)演,倆人至今都是單身

原來(lái)他倆是母子,母親是頂級(jí)歌后,兒子是導(dǎo)演,倆人至今都是單身

削桐作琴
2026-02-25 19:09:55
菜場(chǎng)1元無(wú)人問(wèn)津,門店42元瘋狂追捧,這款“貧民救命糧”的現(xiàn)狀讓人迷惑

菜場(chǎng)1元無(wú)人問(wèn)津,門店42元瘋狂追捧,這款“貧民救命糧”的現(xiàn)狀讓人迷惑

風(fēng)味人間
2026-02-26 14:05:51
你經(jīng)歷過(guò)哪些殺人誅心的事?網(wǎng)友:所以沒(méi)有婆婆拆散不了的家

你經(jīng)歷過(guò)哪些殺人誅心的事?網(wǎng)友:所以沒(méi)有婆婆拆散不了的家

帶你感受人間冷暖
2026-02-11 10:54:58
定了!安徽今年給老百姓辦這些事,你的日子要大變樣

定了!安徽今年給老百姓辦這些事,你的日子要大變樣

瓜哥的動(dòng)物日記
2026-02-26 14:30:31
中俄東北虎數(shù)量差距斷崖:俄羅斯700只,中國(guó)的數(shù)量令人意外!

中俄東北虎數(shù)量差距斷崖:俄羅斯700只,中國(guó)的數(shù)量令人意外!

又是美好的日子
2026-02-21 04:01:54
搭出租車卻收到司機(jī)捐款?李四川還原始末:我還是有把錢退還

搭出租車卻收到司機(jī)捐款?李四川還原始末:我還是有把錢退還

海峽導(dǎo)報(bào)社
2026-02-25 18:22:03
威爾士公開賽16強(qiáng)出爐附賽程,張安達(dá)vs希金斯,8強(qiáng)中國(guó)有望占4席

威爾士公開賽16強(qiáng)出爐附賽程,張安達(dá)vs希金斯,8強(qiáng)中國(guó)有望占4席

小火箭愛(ài)體育
2026-02-26 09:05:55
美團(tuán)申請(qǐng)注冊(cè)拼好房商標(biāo)

美團(tuán)申請(qǐng)注冊(cè)拼好房商標(biāo)

界面新聞
2026-02-26 10:16:16
不服就干!土耳其打響反擊第一槍,通告全球,斷的就是特朗普退路

不服就干!土耳其打響反擊第一槍,通告全球,斷的就是特朗普退路

鐵錘簡(jiǎn)科
2026-02-26 17:24:04
牟宗義被查

牟宗義被查

觀察者網(wǎng)
2026-02-26 09:34:05
最近別來(lái)深圳了!本地人已經(jīng)不敢出門了

最近別來(lái)深圳了!本地人已經(jīng)不敢出門了

據(jù)說(shuō)說(shuō)娛樂(lè)
2026-02-26 11:16:58
2026-02-26 19:36:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
14596文章數(shù) 66644關(guān)注度
往期回顧 全部

科技要聞

單季營(yíng)收681億凈利429億!英偉達(dá)再次炸裂

頭條要聞

15歲女孩離家失聯(lián)已不幸遇難:平時(shí)成績(jī)優(yōu)秀 性格開朗

頭條要聞

15歲女孩離家失聯(lián)已不幸遇難:平時(shí)成績(jī)優(yōu)秀 性格開朗

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂(lè)要聞

尼格買提撒貝寧滑雪被偶遇 17年老友情

財(cái)經(jīng)要聞

人民幣離岸價(jià)升破6.83 什么原因?

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

游戲
藝術(shù)
本地
教育
軍事航空

為了效率和優(yōu)化!《最終幻想7RE》第三部堅(jiān)持使用UE4

藝術(shù)要聞

趙孟頫珍藏的一部《金剛經(jīng)》,曾是南宋皇家至寶,這才叫“最美中國(guó)字”!

本地新聞

津南好·四時(shí)總相宜

教育要聞

為何孩子恐學(xué)抑郁?北大六院專家給出核心答案

軍事要聞

美政府給新伊核協(xié)議設(shè)限內(nèi)容遭披露

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版