国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

不聯(lián)網(wǎng)的AI,殺瘋了...

0
分享至

最近科技圈和資本市場同時被一個叫做chatjimmy.ai的新物種刷屏了,初次徹底震驚了我。

在沒有英偉達(dá)高性能AI芯片的加持,這家硅谷初創(chuàng)公司Taalas就讓旗下大模型跑出了每秒1.5萬到1.7萬個Token。

這是什么概念?傳統(tǒng)的大模型每秒是跑一到兩千的Token,速度是它的1/10不到,

人話說就是,你把一道極其復(fù)雜的數(shù)學(xué)題發(fā)過去,傳統(tǒng)的AI模型還擱那一個勁思考呢,而它下一秒就羅列了好幾種解法給你看:


這個升級幅度,就好比是從算盤升級到計算器, 又是一個跨越式的進(jìn)步。

那這個技術(shù)邏輯是怎么實現(xiàn)的呢?

最大的不同就是它把大模型的幾十億參數(shù)直接刻入硅片里面,

過去的芯片算力很強,但大模型和芯片之間數(shù)據(jù)需要傳輸,所以要借助HBM(顯存)來搬運,甚至可以說90%的電量和時間都浪費在了路上,

好比一個天才面對一個復(fù)雜問題,一秒鐘就給出了答案,但寄郵件卻耗費了大量的時間。

而現(xiàn)在大模型就內(nèi)嵌在芯片自身,它直接拋棄了昂貴的HBM顯存,數(shù)據(jù)不需要搬運了,因為“計算即存儲,存儲即計算”,于是一下就節(jié)省出大量的資源。

這就和淘寶出來后,直接對接工廠發(fā)貨,省去了實體店、中間商、庫存一樣。

那問題來了,如果要把大模型繪制在芯片上,模型豈不是被定死,那一旦老的模型失效要迭代,芯片豈不是就廢了?

這也是過去大家都不敢這么搞的原因,因為模型迭代太快了,而且專門繪制一個大模型芯片的成本也很高,動輒上億美金。

但如今隨著Transformer語言的普及,大語言模型越來越成熟,那么這種商業(yè)路徑成了可能。

而這次Taalas就是做了一個全自動的硅片編譯器,可以實現(xiàn)自動給芯片電路編碼,從而大幅提高效率降低成本。

效率方面,Taalas宣稱把“大模型”轉(zhuǎn)化為“定制芯片”的周期,可以從過去的一年降低到兩個月。

成本方面,由于它拋棄了昂貴的HBM芯片,加上GPU用的普遍是H100芯片,如果換到大模型專用芯片上,只需要使用價格僅為1/20的6nm芯片就可以搞定運算。

這種情況即便是出了新的更強大模型,它也可以直接報廢掉,換一個新的芯片就完事。

另外,估計有人也會好奇,這種綁定芯片的大模型,會不會因為沒法更新迭代,導(dǎo)致知識永遠(yuǎn)停留在出廠那一天?

實際上大模型刻入芯片,只是模型本身的迭代不能進(jìn)行了,就好比一個IQ180的人不能繼續(xù)進(jìn)化到IQ200,但它的邏輯推理能力,知識檢索能力依舊頂級。

而且刻入芯片之后,訪問大模型雖然不需要聯(lián)網(wǎng)了,但它本身依然是具有聯(lián)網(wǎng)能力的,依然可以找到最新的信息去學(xué)習(xí),分析并且解決。

這就導(dǎo)致面對緊急突發(fā)狀況的時候,它的響應(yīng)速度遠(yuǎn)超過去的大模型,有更好的使用場景。

1、智能駕駛領(lǐng)域,當(dāng)汽車在馬路上突發(fā)緊急事件,有些復(fù)雜的問題根本無法解決~

比如前面臨時修路了,原本的實線被磨掉了,交警拿著指揮棒示意你逆行繞過障礙物,傳統(tǒng)的自動駕駛芯片擅長的是快速識別圖像,但對這種需要快速邏輯推理的場景是無能無力的。

這種情況它根本等不起把數(shù)據(jù)打包傳給阿里云、亞馬遜等云端大模型來反饋結(jié)果,它需要的是和人類一樣,低于1毫秒的“本能邏輯推理反射”。

2、高頻量化領(lǐng)域,可以在宏觀對沖金融里開“外掛”

在處理宏觀新聞、財報、非農(nóng)數(shù)據(jù)時,美聯(lián)儲鮑威爾的講話文稿剛一發(fā)布,芯片就能以17000Token/秒的速度,在零點幾毫秒內(nèi)瞬間“吞下”幾萬字的報告,立刻得出“鷹派/鴿派”的定性,并轉(zhuǎn)化為做多/做空大宗商品或股指期貨的信號。

3、軍工領(lǐng)域,這種無需聯(lián)網(wǎng)、固化在物理硬件里的高智商芯片,是武器系統(tǒng)唯一的最佳選擇。

哪怕是處在斷網(wǎng)的“信息孤島”,它還是能憑著出廠時被賦予的龐大參數(shù),獨立進(jìn)行極速的戰(zhàn)術(shù)分析和保密決策。

...................

當(dāng)然,我們也要關(guān)注這個背后長遠(yuǎn)看一些潛在的利空,

最近一年,以三星、美光,SK海力士為首的三大HBM存儲巨頭股價狂飆,底層邏輯都靠一個支撐:“AI的盡頭是算力,算力的盡頭是HBM”。

如果chatjimmy.ai這種“無HBM化”的芯片普及,甚至形成燎原之勢,對這三大巨頭絕對不僅僅是“有影響”,而是巨大的估值邏輯破壞。

另一方面,以前云計算借助AI推理全面收取過路費的模式,也可能會被打上一個問號。

畢竟如果人人的手機、汽車都有這種AI大模型芯片,絕大多數(shù)日常問題在本地0.1秒就免費解決了。

真正需要傳到云端、花錢去求ChatGPT或Gemini這種復(fù)雜模型來解答的流量,可能連20%都不到。

不過對于資金布局在這些方向的人來說,明白危機的同時,也別太過于焦慮了。

因為短期來說它能寫入的模型水平還是有限的,也就是目前僅限幾十億參數(shù)的初中生智商水平,距離真正頂級,動輒上百萬億參數(shù)模型還為之尚遠(yuǎn)。

也就是它五到十年內(nèi)的使用場景更多還只是在一些特定的領(lǐng)域,尤其是對于一些對“斷網(wǎng)、低延遲、絕對隱私”有極端要求的垂直領(lǐng)域——比如我前面提到的智能駕駛、軍工系統(tǒng)、或者是金融量化高頻交易。

但拉長來看,技術(shù)進(jìn)步的速度確實是難以估量的,誰又知道哪天這些頂級模型寫入芯片之后,每個人的設(shè)備終端都擁有了頂級離線AI,世界又會演變成什么夸張的模樣。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中國新型武器誕生,西方各國怕了?

中國新型武器誕生,西方各國怕了?

安安說
2026-03-13 12:32:32
美國和伊朗聯(lián)手演戲,騙了全世界,最大輸家出現(xiàn),并非以色列

美國和伊朗聯(lián)手演戲,騙了全世界,最大輸家出現(xiàn),并非以色列

瀲滟晴方DAY
2026-01-28 18:36:19
生育大局已定:不出意外的話,2026年起中國人口將迎來3大變化

生育大局已定:不出意外的話,2026年起中國人口將迎來3大變化

福建平子
2026-03-13 11:35:56
315打假:多次被曝光企業(yè)在廣東電視臺成了“315放心消費品牌”

315打假:多次被曝光企業(yè)在廣東電視臺成了“315放心消費品牌”

記錄劉杰
2026-03-15 23:35:44
心梗去世的人越來越多?專家提醒:沒事寧可做家務(wù),也別做這8事

心梗去世的人越來越多?專家提醒:沒事寧可做家務(wù),也別做這8事

敘說醫(yī)療健康
2026-03-12 22:00:05
中國要做好最充足的打算:一旦俄羅斯打贏了,我們或許得做三件事

中國要做好最充足的打算:一旦俄羅斯打贏了,我們或許得做三件事

混沌錄
2026-03-15 16:17:05
緊急提醒!雨雨雨+最高溫16℃+8級陣風(fēng)!即將抵達(dá)天津!時間就在……

緊急提醒!雨雨雨+最高溫16℃+8級陣風(fēng)!即將抵達(dá)天津!時間就在……

天津生活通
2026-03-16 19:32:39
官方出手,封殺名單再添新名,難怪兩會中靳東,張凱麗都要這么說

官方出手,封殺名單再添新名,難怪兩會中靳東,張凱麗都要這么說

青橘罐頭
2026-03-14 14:16:53
領(lǐng)跑賽季破百榜!趙心童轟兩桿破百,5-0躋身世界公開賽64強

領(lǐng)跑賽季破百榜!趙心童轟兩桿破百,5-0躋身世界公開賽64強

全景體育V
2026-03-16 21:18:42
75歲姜昆近況:頻繁飛美國與女兒團(tuán)聚,46歲未婚的姜珊讓他操碎心

75歲姜昆近況:頻繁飛美國與女兒團(tuán)聚,46歲未婚的姜珊讓他操碎心

以茶帶書
2026-03-16 17:06:28
中國00后屠龍韓第一人申真谞  李軒豪西南王奪冠

中國00后屠龍韓第一人申真谞 李軒豪西南王奪冠

L76號
2026-03-16 10:46:33
女首富甘比現(xiàn)身上海,天庭飽滿福相拉滿,百億身家顏值福氣雙在線

女首富甘比現(xiàn)身上海,天庭飽滿福相拉滿,百億身家顏值福氣雙在線

阿廢冷眼觀察所
2026-03-16 13:26:04
日本可能與中國開戰(zhàn)?日專家:與中國發(fā)生沖突,最長只能堅持一周

日本可能與中國開戰(zhàn)?日專家:與中國發(fā)生沖突,最長只能堅持一周

泠泠說史
2026-03-16 15:29:34
大S生前布局起效了!張?zhí)m被孫子逼哭,楊阿姨硬剛馬筱梅,亂套了

大S生前布局起效了!張?zhí)m被孫子逼哭,楊阿姨硬剛馬筱梅,亂套了

探源歷史
2026-03-17 00:37:50
西班牙博主來中國旅行,瘋狂吐槽各種不滿,引發(fā)網(wǎng)友熱議

西班牙博主來中國旅行,瘋狂吐槽各種不滿,引發(fā)網(wǎng)友熱議

魔都姐姐雜談
2026-03-14 10:02:23
醫(yī)生發(fā)現(xiàn)愛吃花生人,糖尿病、冠心病、全因死亡率,比同齡人低?

醫(yī)生發(fā)現(xiàn)愛吃花生人,糖尿病、冠心病、全因死亡率,比同齡人低?

荊醫(yī)生科普
2026-03-07 14:52:10
突發(fā),石油拉升!剛剛,伊朗發(fā)動襲擊!

突發(fā),石油拉升!剛剛,伊朗發(fā)動襲擊!

中國基金報
2026-03-16 16:17:31
M2破340萬億:錢不是印的,是借出來的

M2破340萬億:錢不是印的,是借出來的

流蘇晚晴
2026-02-23 12:15:17
放寬對俄制裁后,不到24小時,美歐集體鬧僵,最先扛不住的人是他

放寬對俄制裁后,不到24小時,美歐集體鬧僵,最先扛不住的人是他

井普椿的獨白
2026-03-16 17:38:07
知名央企迎來最終審判!全爛透了,9個董監(jiān)高無一清白,強制清退

知名央企迎來最終審判!全爛透了,9個董監(jiān)高無一清白,強制清退

慕名而來只為你
2026-01-20 05:59:04
2026-03-17 04:47:00
思哲與創(chuàng)富 incentive-icons
思哲與創(chuàng)富
全網(wǎng)同名,N億基金主理人,簽約財經(jīng)作者,擅長行業(yè)熱點、資產(chǎn)配置、基金投資;著《指數(shù)基金定投精進(jìn)指南》
572文章數(shù) 1229關(guān)注度
往期回顧 全部

科技要聞

“龍蝦”當(dāng)?shù)?,五位養(yǎng)蝦人探討人類出路

頭條要聞

馬拉松冠軍選手沖線時被攔停并強行帶離賽道 本人發(fā)文

頭條要聞

馬拉松冠軍選手沖線時被攔停并強行帶離賽道 本人發(fā)文

體育要聞

那個送老奶奶去醫(yī)院的球員 成了隊史第一人

娛樂要聞

姚晨曹郁發(fā)離婚聲明 多年前已結(jié)束婚姻

財經(jīng)要聞

梁文鋒推遲V4,是為根治龍蝦的健忘癥?

汽車要聞

大眾全球首款9系旗艦SUV 上汽大眾ID.ERA 9X首秀

態(tài)度原創(chuàng)

數(shù)碼
旅游
家居
游戲
健康

數(shù)碼要聞

方向錯了!手機廠商放棄快充內(nèi)卷,重回單電芯懷抱

旅游要聞

對俄免簽半年 黑龍江俄籍游客增長超六成

家居要聞

簡約之美 塵埃落定

PS5版《星空》26小時后開預(yù)購!kun哥再次強調(diào)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

無障礙瀏覽 進(jìn)入關(guān)懷版