国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

PrismML發(fā)布1-bit LLM模型家族,走出隱身模式

0
分享至

隨著內(nèi)存限制和能源成本正考驗著AI擴展的極限,壓縮正成為業(yè)界最活躍的研究領域之一。谷歌最新發(fā)布的TurboQuant針對的是鍵值緩存——推理過程中最耗內(nèi)存的組件之一(延展閱讀:)。而現(xiàn)在,一家新創(chuàng)公司正致力于壓縮模型本身。


PrismML由加州理工學院研究人員創(chuàng)立,已走出隱身模式,獲得1625萬美元種子輪融資,并開源發(fā)布了其所謂的"1-bit"大語言模型家族。公司稱其方法可以顯著減少模型大小和能耗,同時保持與標準16-bit模型相當?shù)男阅堋?/p>

Bonsai模型家族的旗艦模型是Bonsai 8B,一個在谷歌v4 TPU上訓練的80億參數(shù)模型。據(jù)PrismML介紹,該模型在MMLU Redux、MuSR、GSM8K、HumanEval+、IFEval和BFClv3等基準測試套件中表現(xiàn)不俗,但內(nèi)存占用僅約1GB,而同等規(guī)模的典型16-bit模型約需16GB。PrismML還發(fā)布了1-bit Bonsai 4B和1.7B模型,內(nèi)存占用分別為0.5GB和0.24GB。

PrismML表示,其模型實現(xiàn)了端到端的完全二值化,所有權重在嵌入層、注意力層和MLP塊中都被約束為單個比特,"沒有任何高精度逃生通道"。雖然量化技術已被廣泛使用,但將整個網(wǎng)絡推至1-bit歷來會降低模型質(zhì)量,尤其是在推理任務上。公司將其成果歸功于在加州理工學院開發(fā)的新數(shù)學框架,但尚未詳細說明訓練方法或穩(wěn)定技術。


PrismML CEO、加州理工學院計算機科學家和數(shù)學家Babak Hassabi將這種方法描述為AI的新范式,能夠適應多樣化的硬件環(huán)境。"我們花了數(shù)年時間開發(fā)壓縮神經(jīng)網(wǎng)絡而不損失推理能力所需的數(shù)學理論,"Hassibi在一份聲明中說,"我們將1-bit視為起點,而非終點。"

公司聲稱其1-bit模型在現(xiàn)有硬件上可實現(xiàn)高達8倍的加速,能耗降低75-80%。PrismML還預測,未來針對1-bit操作優(yōu)化的硬件可通過用更簡單的算術運算替代復雜的乘法,進一步提高效率。

參與種子輪的Khosla Ventures公司的Vinod Khosla將這項工作描述為"數(shù)學突破",有潛力重塑AI系統(tǒng)的部署方式。"AI的未來不由誰能建造最大的數(shù)據(jù)中心來定義,而將由誰能以單位能源和成本提供最多智能來定義。PrismML代表了這種突破,"他在聲明中說。

這一觀點反映了AI不會局限在數(shù)據(jù)中心,而是將部署在邊緣設備和本地環(huán)境的理念。PrismML表示其模型設計用于在消費級和邊緣設備上運行,可能在智能手機、可穿戴設備和機器人中實現(xiàn)更強大的AI應用,而無需依賴云端基礎設施。

PrismML關于全1-bit模型能匹敵高精度系統(tǒng)能力的聲明,尚需在公司自有基準結果之外得到驗證。極端量化技術歷來難以在復雜推理任務中保持準確性。獨立的第三方基準測試和實際部署將是判定PrismML方法代表真正突破還是有限優(yōu)化的關鍵。

在一篇博客文章中,PrismML描述了所謂的"智能密度",這一指標試圖衡量模型在單位大小下提供多少能力。公司表示,其1-bit模型重新定義了模型大小與性能之間的權衡,以極小的占用保持了競爭力。不過,該指標取決于公司的基準選擇和定義本身,尚未得到獨立驗證。


目前,此次發(fā)布是效率驅動AI設計的又一個例子,業(yè)界正在尋找模型規(guī)模和基礎設施成本不斷攀升的替代方案。雖然谷歌TurboQuant等近期研究專注于壓縮推理的特定組件,但PrismML雄心勃勃的模型壓縮可能大大擴展AI模型可以實際運行的范圍及其部署方式。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
國乒男團輸球登熱搜第一!關鍵戰(zhàn)決定種子簽位 王楚欽復出PK莫雷加德

國乒男團輸球登熱搜第一!關鍵戰(zhàn)決定種子簽位 王楚欽復出PK莫雷加德

桃葉渡春
2026-05-03 11:25:37
李小冉與徐佳寧丁克真相,網(wǎng)友:不是選擇丁克而是難以生育好嗎?

李小冉與徐佳寧丁克真相,網(wǎng)友:不是選擇丁克而是難以生育好嗎?

小娛樂悠悠
2026-05-02 10:45:13
場均23分7板8助,又打破NBA紀錄!41歲詹姆斯,季后賽什么水平?

場均23分7板8助,又打破NBA紀錄!41歲詹姆斯,季后賽什么水平?

老梁體育漫談
2026-05-03 00:03:29
大腦“餓”了竟會變笨?清華大學:每天50微克這種常見維生素,癡呆風險降21%-26%

大腦“餓”了竟會變笨?清華大學:每天50微克這種常見維生素,癡呆風險降21%-26%

梅斯醫(yī)學
2026-05-03 07:54:16
炸鍋!ESPN曝熱火驚天交易,梭哈倫納德,萊利這次賭太大了

炸鍋!ESPN曝熱火驚天交易,梭哈倫納德,萊利這次賭太大了

體育大朋說
2026-05-02 15:00:03
因盜播英超且無力歸還違法所得,一盜播團隊面臨額外10年監(jiān)禁

因盜播英超且無力歸還違法所得,一盜播團隊面臨額外10年監(jiān)禁

懂球帝
2026-05-02 18:20:09
2026北京車展:113.98萬起!4.0T V8!爆500馬力!全新奧迪SQ8上市!

2026北京車展:113.98萬起!4.0T V8!爆500馬力!全新奧迪SQ8上市!

聊聊車生活
2026-05-03 10:09:48
22歲張本智和麻了!0-3遭世界第10橫掃 多次高調(diào)宣稱奪金慘遭打臉

22歲張本智和麻了!0-3遭世界第10橫掃 多次高調(diào)宣稱奪金慘遭打臉

風過鄉(xiāng)
2026-05-03 06:35:16
75歲張愛玲死在行軍床上,滿屋是用過的衛(wèi)生紙,遺囑:不許看遺體

75歲張愛玲死在行軍床上,滿屋是用過的衛(wèi)生紙,遺囑:不許看遺體

抽象派大師
2026-03-09 15:35:32
失蹤135年!上次出現(xiàn)還是清光緒十一年,2020年浙江山區(qū)發(fā)現(xiàn)5棵

失蹤135年!上次出現(xiàn)還是清光緒十一年,2020年浙江山區(qū)發(fā)現(xiàn)5棵

阿訊說天下
2026-05-02 18:03:20
四月一過熟悉的阿森納回來了!3-0富勒姆6分領跑,壓力回歸曼城

四月一過熟悉的阿森納回來了!3-0富勒姆6分領跑,壓力回歸曼城

里芃芃體育
2026-05-03 12:00:22
高盛一季度減持105股!最大減倉81.19%,這些股遭清倉式拋售

高盛一季度減持105股!最大減倉81.19%,這些股遭清倉式拋售

慧眼看世界哈哈
2026-05-03 12:12:17
養(yǎng)蝦大爆炸!蘋果停產(chǎn)廉價版Mac Mini,現(xiàn)價799美元

養(yǎng)蝦大爆炸!蘋果停產(chǎn)廉價版Mac Mini,現(xiàn)價799美元

鞭牛士
2026-05-03 13:25:48
曾經(jīng)爆火的高端牛奶,連中產(chǎn)都放下了?

曾經(jīng)爆火的高端牛奶,連中產(chǎn)都放下了?

新浪財經(jīng)
2026-05-03 09:30:42
豆包又更新了!一鍵生成王炸PPT,10分鐘搞定半天工作量!

豆包又更新了!一鍵生成王炸PPT,10分鐘搞定半天工作量!

秋葉PPT
2026-05-03 08:22:37
隊史首次3-1被翻盤!3名首發(fā)合計得0分,馬祖拉不會用人害死綠軍

隊史首次3-1被翻盤!3名首發(fā)合計得0分,馬祖拉不會用人害死綠軍

聽我說球
2026-05-03 10:48:33
軍權、財權、外交權一把抓,穆尼爾強勢登頂,巴基斯坦徹底變天了

軍權、財權、外交權一把抓,穆尼爾強勢登頂,巴基斯坦徹底變天了

溫讀史
2026-05-01 04:50:30
馮提莫停播原因公開,患甲狀腺癌晚期,醫(yī)生斷言:這輩子別想唱歌

馮提莫停播原因公開,患甲狀腺癌晚期,醫(yī)生斷言:這輩子別想唱歌

草莓解說體育
2026-05-03 05:32:06
法國人講述如何一眼區(qū)分“中國人”“日本人”“韓國人”的?

法國人講述如何一眼區(qū)分“中國人”“日本人”“韓國人”的?

日本物語
2026-03-15 20:34:37
“蘇超”最新積分榜公布:鹽城隊3場皆勝9分領跑,南京隊1勝1負位居第9,鎮(zhèn)江隊2戰(zhàn)全負位居榜尾

“蘇超”最新積分榜公布:鹽城隊3場皆勝9分領跑,南京隊1勝1負位居第9,鎮(zhèn)江隊2戰(zhàn)全負位居榜尾

揚子晚報
2026-05-02 22:12:44
2026-05-03 14:00:49
Ai時代前沿
Ai時代前沿
人工智能新聞動態(tài)及應用案例。
1726文章數(shù) 512關注度
往期回顧 全部

科技要聞

庫克罕見"拒答"!蘋果正被AI供應鏈卡脖子

頭條要聞

牛彈琴:比網(wǎng)紅還網(wǎng)紅 快80歲的特朗普一晚上發(fā)8張圖

頭條要聞

牛彈琴:比網(wǎng)紅還網(wǎng)紅 快80歲的特朗普一晚上發(fā)8張圖

體育要聞

裁判準備下班,結果吳宜澤進了決賽

娛樂要聞

蔡卓妍婚后首現(xiàn)身 戴結婚戒指笑容不斷

財經(jīng)要聞

后巴菲特時代,首場股東會透露了啥

汽車要聞

同比大漲190% 方程豹4月銷量29138臺

態(tài)度原創(chuàng)

旅游
本地
健康
藝術
手機

旅游要聞

昆明藍花楹盛景登上人民日報頭版

本地新聞

用青花瓷的方式,打開西溪濕地

干細胞治燒燙傷面臨這些“瓶頸”

藝術要聞

Dale terbush:當代美國風景畫家

手機要聞

小米13全系電池升級服務上線:容量更大 149元再戰(zhàn)兩年

無障礙瀏覽 進入關懷版