国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

用量子技術(shù)給大模型瘦身!讓模型規(guī)??s小一半仍保持強(qiáng)大性能

0
分享至

大型語(yǔ)言模型(LLM)的“大”既是智慧的象征,也是落地的枷鎖。模型規(guī)模越來(lái)越大,計(jì)算資源、內(nèi)存占用、能耗和部署成本急劇上升,這讓許多企業(yè)和開(kāi)發(fā)者難以實(shí)際應(yīng)用其前沿能力。

2 月 24 日,一家西班牙初創(chuàng)公司 Multiverse Computing 在 Hugging Face 平臺(tái)免費(fèi)開(kāi)放其最新壓縮模型 HyperNova 60B 2602 的完整訪問(wèn)權(quán)限。

這是這家公司過(guò)去發(fā)布多款開(kāi)源壓縮模型的延續(xù),今年 1 月份,他們開(kāi)放了基于 OpenAI 開(kāi)源模型 gpt-oss-120B 的 50% 壓縮版本,HyperNova 60B。這次又在工具調(diào)用和代理式工作流上實(shí)現(xiàn)顯著迭代。他們?cè)噲D用量子計(jì)算技術(shù)打破這一僵局,以“身量減半、性能不減”的姿態(tài),向全球開(kāi)發(fā)者展示了模型輕量化的新路徑:無(wú)需巨額基礎(chǔ)設(shè)施,即可調(diào)用接近前沿水平的 AI。

量子技術(shù)啟發(fā)模型壓縮:身量減半、性能不減

Multiverse Computing 成立于 2019 年,創(chuàng)始理念源于創(chuàng)始人恩里克·利薩索(Enrique Lizaso)與量子物理學(xué)家羅曼·奧魯斯(Román Orús)的一次 WhatsApp 聊天,他們討論了將量子技術(shù)應(yīng)用于金融復(fù)雜問(wèn)題的可能性,并迅速邀請(qǐng)營(yíng)銷(xiāo)專(zhuān)家阿方索·魯比奧(Alfonso Rubio)和計(jì)算物理學(xué)家塞繆爾·穆格爾(Samuel Mugel)加入,還獲得了西班牙巴斯克地區(qū)政府的支持孵化。

公司最初深耕于金融領(lǐng)域的量子計(jì)算軟件開(kāi)發(fā),這種通過(guò)量子方法解決復(fù)雜優(yōu)化問(wèn)題的思路,之后也被逐步擴(kuò)展到 AI 模型的“瘦身”領(lǐng)域。

現(xiàn)在,Multiverse Computing 已將自身定義為“量子啟發(fā) AI 模型壓縮領(lǐng)域的領(lǐng)導(dǎo)者”。其專(zhuān)有技術(shù) CompactifAI 正是這一路線的結(jié)晶。


(來(lái)源:Multiverse)

在傳統(tǒng)壓縮方法中,剪枝、蒸餾和低秩近似專(zhuān)注于減少網(wǎng)絡(luò)中的有效神經(jīng)元數(shù)量,量化的重點(diǎn)則放在了降低單個(gè)權(quán)重的數(shù)值精度,以在保持神經(jīng)元數(shù)量不變的情況下減小模型尺寸。

CompactifAI 另辟蹊徑,將量子計(jì)算中的張量網(wǎng)絡(luò)(Tensor Networks)數(shù)學(xué)思路應(yīng)用于神經(jīng)網(wǎng)絡(luò)分析與重組,關(guān)注模型的關(guān)聯(lián)空間,僅保留信息最豐富的核心組件,從而實(shí)現(xiàn)更可控、更精細(xì)和更可解釋的模型壓縮。

Multiverse 的研究團(tuán)隊(duì)在 2024 年發(fā)表論文《CompactifAI:基于量子啟發(fā)式張量網(wǎng)絡(luò)的大型語(yǔ)言模型極致壓縮》(CompactifAI: Extreme Compression of Large Language Models using Quantum-Inspired Tensor Networks,arXiv:2401.14109),首次詳細(xì)闡述了 CompactifAI 的工作原理和具體技術(shù)路徑:

對(duì)模型的自注意力(Self-Attention, SA)層和多層感知機(jī)(MLP)層進(jìn)行“張量化”(tensorizing),使用特定張量網(wǎng)絡(luò)(Tensor Network)結(jié)構(gòu);通過(guò)控制鍵維度(bond dimension)精確截?cái)嗄P椭械南嚓P(guān)性(correlations),從而大幅減少參數(shù)數(shù)量和內(nèi)存占用;壓縮后,通過(guò)多 GPU 分布式再訓(xùn)練(稱(chēng)為“healing”過(guò)程)恢復(fù)精度,確保模型在更小規(guī)模下仍保留高級(jí)推理能力。

測(cè)試顯示,CompactifAI 最高可將模型體積減少 95%,精度損失僅控制在 2%~3% 以?xún)?nèi)。相比之下,行業(yè)標(biāo)準(zhǔn)的壓縮技術(shù)在進(jìn)行 50%~60% 的壓縮時(shí),精度卻出現(xiàn)了 20%~30% 的大幅下降。

這一方法不僅顯著降低訓(xùn)練和推理時(shí)間(訓(xùn)練時(shí)間可縮短 50%、推理時(shí)間縮短 25%),還極大減少了 GPU-CPU 數(shù)據(jù)傳輸開(kāi)銷(xiāo),使其特別適合分布式訓(xùn)練場(chǎng)景。CompactifAI 可獨(dú)立使用,也可與其他壓縮技術(shù)結(jié)合,進(jìn)一步放大效果。

HyperNova 60B 2602 是基于 OpenAI 開(kāi)源模型 gpt-oss-120B 的 50% 壓縮版本。原始模型大小約 61GB,新模型僅為 32GB,參數(shù)規(guī)模降至約 60B,同時(shí)大幅降低了內(nèi)存占用和推理延遲。

相比 1 月份的初版 HyperNova 60B,本次更新聚焦于工具調(diào)用(tool calling)和代理式編碼(agentic coding),這些正是推理成本較高的核心場(chǎng)景。

公司表示,更新版在真實(shí)開(kāi)發(fā)者反饋基礎(chǔ)上進(jìn)行了針對(duì)性?xún)?yōu)化,相對(duì)于前版,其具體基準(zhǔn)均有顯著提升:代理工具使用能力(Tau2-Bench)提升 5 倍、代理編碼與終端使用性能(Terminal Bench Hard)提升 2 倍,函數(shù)調(diào)用(BFCL v4)能力也是原來(lái)的 1.5 倍。


(來(lái)源:Multiverse)

整體而言,HyperNova 60B 2602 在工具調(diào)用能力上已經(jīng)接近原始 120B 開(kāi)源模型的水平,大小卻只有原來(lái)的一半。這一成果驗(yàn)證了壓縮技術(shù)在生產(chǎn)級(jí) AI 部署中的可行性:開(kāi)發(fā)者可在資源受限環(huán)境下實(shí)現(xiàn)前沿級(jí)代理工作流,同時(shí)無(wú)需承擔(dān)巨額基礎(chǔ)設(shè)施開(kāi)銷(xiāo)。

Hugging Face 模型頁(yè)面進(jìn)一步提供了完整基準(zhǔn)、技術(shù)文檔和集成指南,支持 8-bit 精度和 mxfp4 量化,適用于 vLLM 等高效推理框架。

歐洲主權(quán) AI 的曙光

目前,Multiverse Computing 已在美國(guó)、加拿大及歐洲多地設(shè)立辦公室,服務(wù)包括西班牙能源巨頭伊維爾德羅拉電力公司(Iberdrola)、德國(guó)工業(yè)巨頭博世(Bosch)以及加拿大銀行等在內(nèi)的 100 余家全球企業(yè)客戶。

Multiverse 強(qiáng)調(diào),HyperNova 系列專(zhuān)為真實(shí)世界部署設(shè)計(jì),覆蓋企業(yè)系統(tǒng)、研究機(jī)構(gòu)、公共部門(mén),以及邊緣設(shè)備和終端級(jí)應(yīng)用。通過(guò)開(kāi)源策略,組織可在承諾大規(guī)模實(shí)施前輕松評(píng)估性能、安全性和運(yùn)營(yíng)適配性,只需最小化集成工作即可獲得更高控制權(quán)和獨(dú)立性。

2025 年,公司完成約 1.89 億歐元(約合人民幣)的 B 輪融資,西班牙技術(shù)轉(zhuǎn)型局(SETT)等機(jī)構(gòu)參與投資。據(jù)相關(guān)消息,公司正在今年 2 月推進(jìn)新一輪約 5 億歐元(約合人民幣)的融資談判,估值可能超過(guò) 15 億歐元??紤]到 Multiverse 曾宣稱(chēng)可“在 AI 全棧提供主權(quán)解決方案”,這一增長(zhǎng)勢(shì)頭或與歐洲對(duì)“非美科技替代方案”的迫切需求密切相關(guān)。

近期,公司還與西班牙東北部阿拉貢地區(qū)政府達(dá)成合作,進(jìn)一步強(qiáng)化其在歐洲主權(quán) AI 生態(tài)中的位置。

未來(lái),這一壓縮技術(shù)將大幅降低模型使用的準(zhǔn)入門(mén)檻,開(kāi)發(fā)者不再受海量 LLM 基礎(chǔ)設(shè)施的制約,可自由測(cè)試、迭代和部署高級(jí) AI;此外,還有望引發(fā)一場(chǎng)成本與能耗革命:用更低的算力、內(nèi)存和功耗保留“智能”,實(shí)現(xiàn)更綠色、更經(jīng)濟(jì)的 AI。

最后,在 AI 競(jìng)爭(zhēng)中已經(jīng)不占優(yōu)勢(shì)地位的歐洲地區(qū),壓縮技術(shù)有望支持私有云、on-premise 或邊緣部署,幫助歐洲及全球企業(yè)減少對(duì)外部巨頭的依賴(lài),保障數(shù)據(jù)安全與技術(shù)自主。

正如公司 CEO Enrique Lizaso Olmos 所言,“HyperNova 60B 2602 的推出展示了壓縮作為迭代改進(jìn)過(guò)程而非一次性?xún)?yōu)化的本質(zhì)。每代壓縮模型都推動(dòng)高效 AI 的邊界。”公司計(jì)劃在 2026 年持續(xù)發(fā)布更多不同尺寸的開(kāi)源壓縮模型,進(jìn)一步拓展從企業(yè)級(jí)到設(shè)備級(jí)的應(yīng)用場(chǎng)景。

開(kāi)發(fā)者現(xiàn)可訪問(wèn)以下鏈接免費(fèi)試用:

HyperNova 60B 2602 模型頁(yè):https://huggingface.co/MultiverseComputingCAI/Hypernova-60B-2602

公司 Hugging Face 空間(含全部發(fā)布、基準(zhǔn)與指南):https://huggingface.co/MultiverseComputingCAI

參考資料:

https://techcrunch.com/2026/02/24/spanish-soonicorn-multiverse-computing-releases-free-compressed-ai-model/

https://multiversecomputing.com/resources/multiverse-computing-opens-full-access-to-hypernova-60b-2602-on-hugging-face

https://arxiv.org/abs/2401.14109

運(yùn)營(yíng)/排版:何晨龍

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
中領(lǐng)館提醒: 18-65歲在俄長(zhǎng)期居留男性 須同意在俄軍事單位等至少服役1年

中領(lǐng)館提醒: 18-65歲在俄長(zhǎng)期居留男性 須同意在俄軍事單位等至少服役1年

閃電新聞
2026-02-26 12:46:48
輸球又輸人!隨著日本男籃慘遭中國(guó)逆轉(zhuǎn),不得不承認(rèn)的四大事實(shí)!

輸球又輸人!隨著日本男籃慘遭中國(guó)逆轉(zhuǎn),不得不承認(rèn)的四大事實(shí)!

田先生籃球
2026-02-26 21:51:17
洛克希德·馬丁的生產(chǎn)線突然停了,中國(guó)凍結(jié)了他們?cè)谌A的全部資產(chǎn)

洛克希德·馬丁的生產(chǎn)線突然停了,中國(guó)凍結(jié)了他們?cè)谌A的全部資產(chǎn)

百態(tài)人間
2026-02-25 15:33:21
正式簽約!40歲重返NBA!聯(lián)盟第二老比肩詹姆斯

正式簽約!40歲重返NBA!聯(lián)盟第二老比肩詹姆斯

籃球教學(xué)論壇
2026-02-27 10:42:34
徒弟武功高強(qiáng),釋永信被帶走時(shí)為何不敢反抗?老警察透露原因

徒弟武功高強(qiáng),釋永信被帶走時(shí)為何不敢反抗?老警察透露原因

小莜讀史
2026-02-26 21:36:58
兩會(huì)前夕,9名解放軍將領(lǐng)全國(guó)人大代表資格被罷免(附完整名單)

兩會(huì)前夕,9名解放軍將領(lǐng)全國(guó)人大代表資格被罷免(附完整名單)

翻譯大傻
2026-02-26 22:35:34
奔馳、寶馬、奧迪開(kāi)年集體降價(jià),銷(xiāo)售員:是否考慮新能源?

奔馳、寶馬、奧迪開(kāi)年集體降價(jià),銷(xiāo)售員:是否考慮新能源?

華夏時(shí)報(bào)
2026-02-26 16:28:14
男子高速上語(yǔ)音呼叫“關(guān)閉閱讀燈”,語(yǔ)音助手卻誤將大燈熄滅致車(chē)輛撞上護(hù)欄,領(lǐng)克致歉:已更新,行駛狀態(tài)下只能手動(dòng)關(guān)閉大燈

男子高速上語(yǔ)音呼叫“關(guān)閉閱讀燈”,語(yǔ)音助手卻誤將大燈熄滅致車(chē)輛撞上護(hù)欄,領(lǐng)克致歉:已更新,行駛狀態(tài)下只能手動(dòng)關(guān)閉大燈

大象新聞
2026-02-27 09:57:17
語(yǔ)音控制“關(guān)掉閱讀燈”卻關(guān)掉大燈,命令開(kāi)燈系統(tǒng)回復(fù)“暫時(shí)還不會(huì)”,車(chē)主凌晨高速上撞護(hù)欄!領(lǐng)克致歉:已推優(yōu)化方案

語(yǔ)音控制“關(guān)掉閱讀燈”卻關(guān)掉大燈,命令開(kāi)燈系統(tǒng)回復(fù)“暫時(shí)還不會(huì)”,車(chē)主凌晨高速上撞護(hù)欄!領(lǐng)克致歉:已推優(yōu)化方案

每日經(jīng)濟(jì)新聞
2026-02-26 23:53:07
英國(guó)女婿瘋狂愛(ài)上貴州砂糖橘,春節(jié)期間幾乎一日三餐當(dāng)飯吃,一個(gè)月后把自己吃成“小黃人”

英國(guó)女婿瘋狂愛(ài)上貴州砂糖橘,春節(jié)期間幾乎一日三餐當(dāng)飯吃,一個(gè)月后把自己吃成“小黃人”

觀威海
2026-02-26 10:26:04
誰(shuí)搶走了訂單?外企扎堆越南后才明白,“世界工廠”只是一場(chǎng)美夢(mèng)

誰(shuí)搶走了訂單?外企扎堆越南后才明白,“世界工廠”只是一場(chǎng)美夢(mèng)

百科密碼
2026-02-25 15:17:32
砍掉核心部件,效率竟然暴漲30%?燃?xì)廨啓C(jī)迎來(lái)百年最大革命!

砍掉核心部件,效率竟然暴漲30%?燃?xì)廨啓C(jī)迎來(lái)百年最大革命!

科學(xué)火箭叔
2026-02-26 20:14:28
不裝了?FIBA官方竟稱(chēng)中國(guó)隊(duì)偷走一場(chǎng)勝利 媒體人怒斥:無(wú)法無(wú)天

不裝了?FIBA官方竟稱(chēng)中國(guó)隊(duì)偷走一場(chǎng)勝利 媒體人怒斥:無(wú)法無(wú)天

念洲
2026-02-27 07:49:08
工信部新規(guī):嚴(yán)禁屏幕換擋,網(wǎng)友拍手叫好

工信部新規(guī):嚴(yán)禁屏幕換擋,網(wǎng)友拍手叫好

創(chuàng)作者_(dá)1470992743975
2026-02-26 17:34:46
抵達(dá)中國(guó)不到24小時(shí),默茨拿下大單,還沒(méi)啟程的特朗普,只能眼紅

抵達(dá)中國(guó)不到24小時(shí),默茨拿下大單,還沒(méi)啟程的特朗普,只能眼紅

欽點(diǎn)歷史
2026-02-27 09:21:08
高市早苗有麻煩了

高市早苗有麻煩了

第一財(cái)經(jīng)資訊
2026-02-26 21:47:44
請(qǐng)假2小時(shí)被開(kāi)除后續(xù):店主真容曝光社死,黑歷史被扒,已找律師

請(qǐng)假2小時(shí)被開(kāi)除后續(xù):店主真容曝光社死,黑歷史被扒,已找律師

離離言幾許
2026-02-26 16:16:45
大批美國(guó)游客涌入中國(guó),回國(guó)后坦言:客觀對(duì)比,中國(guó)比美國(guó)強(qiáng)多了

大批美國(guó)游客涌入中國(guó),回國(guó)后坦言:客觀對(duì)比,中國(guó)比美國(guó)強(qiáng)多了

通文知史
2026-02-26 22:00:04
遼寧、甘肅等地接連發(fā)生路口多人死傷道路交通事故,公安部交管局提醒

遼寧、甘肅等地接連發(fā)生路口多人死傷道路交通事故,公安部交管局提醒

界面新聞
2026-02-27 09:23:31
FIBA官方社媒稱(chēng)“中國(guó)男籃偷走勝利”!評(píng)論區(qū)翻車(chē)

FIBA官方社媒稱(chēng)“中國(guó)男籃偷走勝利”!評(píng)論區(qū)翻車(chē)

體壇周報(bào)
2026-02-27 09:11:45
2026-02-27 10:52:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技評(píng)論獨(dú)家合作
16328文章數(shù) 514660關(guān)注度
往期回顧 全部

科技要聞

英偉達(dá)業(yè)績(jī)亮眼仍跌5% 兩大因素成核心隱憂

頭條要聞

媒體:驕傲十年后 德國(guó)不得不正視中國(guó)

頭條要聞

媒體:驕傲十年后 德國(guó)不得不正視中國(guó)

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂(lè)要聞

繼網(wǎng)暴谷愛(ài)凌后 美國(guó)欲沒(méi)收其全部收入

財(cái)經(jīng)要聞

魅族手機(jī),終成棄子?

汽車(chē)要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

健康
本地
旅游
時(shí)尚
公開(kāi)課

轉(zhuǎn)頭就暈的耳石癥,能開(kāi)車(chē)上班嗎?

本地新聞

津南好·四時(shí)總相宜

旅游要聞

昆明西華園海棠盛放 市民踏青賞花

今年春天最美搭配:西裝+半裙,怎么穿都好看!

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版