国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

北大提出首個(gè)復(fù)數(shù)大模型,2比特量化,可手機(jī)部署!

0
分享至

摘要:為破解大模型部署與推理成本高昂的困境,北京大學(xué)楊仝老師團(tuán)隊(duì)首次提出名為iFairy的超低比特量化方案。該方案創(chuàng)新性地利用復(fù)數(shù){±1, ±i}對(duì)模型權(quán)重進(jìn)行2-bit量化,在實(shí)現(xiàn)1/8極致壓縮與“無乘法”推理加速的同時(shí),語言建模能力和下游任務(wù)表現(xiàn)甚至反超了其全精度的LLaMA基座模型。

當(dāng)下,大語言模型(LLM)的研究熱潮席卷全球,技術(shù)迭代日新月異。然而,在這片繁榮之下,一個(gè)嚴(yán)峻的現(xiàn)實(shí)不容忽視:LLM在真實(shí)世界中產(chǎn)生的商業(yè)價(jià)值,很大程度上仍無法覆蓋其高昂的訓(xùn)練與推理成本。

究其根源,大模型走向產(chǎn)業(yè)落地的道路上,橫亙著兩大“攔路虎”:空間瓶頸和時(shí)間瓶頸。

為了追求更高的模型性能,業(yè)界普遍的策略是不斷堆疊參數(shù)量,這使得模型部署成本高昂。

同時(shí),龐大的參數(shù)量帶來了計(jì)算量的激增,盡管學(xué)界和業(yè)界已涌現(xiàn)出如gpt-oss的MXFP4訓(xùn)練等優(yōu)秀的量化方案,但其核心計(jì)算邏輯依然沒有消除對(duì)硬件資源消耗巨大的“乘法”運(yùn)算的依賴,推理延遲沒有實(shí)現(xiàn)根本性的降低。

能否同時(shí)攻克這兩大瓶頸,實(shí)現(xiàn)模型的輕量化和推理加速,已成為推動(dòng)大模型發(fā)展從“技術(shù)奇觀”邁向“生產(chǎn)力工具”新階段的關(guān)鍵。

為解決這一難題,北京大學(xué)楊仝老師團(tuán)隊(duì)在一篇名為“iFairy: the First 2-bit Complex LLM with All Parameters in {±1,±i}”的論文中,提出了一個(gè)腦洞大開的方案:跳出實(shí)數(shù)軸的束縛,進(jìn)入復(fù)數(shù)平面!

這看似簡(jiǎn)單的維度提升,卻蘊(yùn)含著破解瓶頸的深刻智慧。

一、空間魔法:極致壓縮,體積僅為1/8

在“空間”上,iFairy實(shí)現(xiàn)了極致的壓縮。

傳統(tǒng)的全精度(FP16)權(quán)重需要16比特,而iFairy方案僅用2比特,就完成了對(duì)一個(gè)權(quán)重信息的編碼。

這意味著,相較于流行的FP16模型,其模型體積可以直接壓縮至原來的1/8。這種“史詩(shī)級(jí)”的壓縮率,為大模型在手機(jī)、汽車等邊緣設(shè)備上的部署掃清了最大的存儲(chǔ)障礙。

二、時(shí)間魔法:“無乘法”計(jì)算的革命

在“時(shí)間”上,iFairy實(shí)現(xiàn)了“無乘法”計(jì)算的革命。這個(gè)魔法是如何實(shí)現(xiàn)的呢?

1. PhaseQuant算法的神來之筆

這一切,都源于團(tuán)隊(duì)提出的全新量化算法PhaseQuant。它不再將權(quán)重映射到實(shí)數(shù)軸上的點(diǎn),而是基于參數(shù)的相位將其映射到復(fù)平面上的四個(gè)單位根{±1, ±i}。



這一操作堪稱神來之筆,一舉多得:

信息密度拉滿:用{±1, ±i} 四個(gè)值,徹底利用了2-bit的全部信息容量,信息熵從傳統(tǒng)三元量化(如BitNet b1.58)的log?(3)≈1.58-bit,提升到滿格的log?(4)=2-bit。

優(yōu)雅的對(duì)稱性:這四個(gè)點(diǎn)在復(fù)平面上關(guān)于原點(diǎn)中心對(duì)稱,保持了模型訓(xùn)練所需的良好性質(zhì)。

隱含的稀疏性:每個(gè)量化后的復(fù)數(shù)權(quán)重,其實(shí)部或虛部必有一個(gè)為零,這在高維度上保留了稀疏性的優(yōu)勢(shì)。

2. 驚艷的“無乘法”運(yùn)算

最令人拍案叫絕的是,引入復(fù)數(shù),計(jì)算仍然高效!一個(gè)標(biāo)準(zhǔn)的復(fù)數(shù)乘法 (a+ib)(c+id) 需要4次實(shí)數(shù)乘法和2次加法,計(jì)算量不小。

但在iFairy模型中,當(dāng)一個(gè)復(fù)數(shù)激活值與量化后的權(quán)重 {±1, ±i} 相乘時(shí),運(yùn)算發(fā)生了奇妙的“退化”:所有乘法都消失了。



看!整個(gè)模型中最核心、最龐大的矩陣乘法(GEMM),被徹底重構(gòu)了!原本昂貴的浮點(diǎn)乘法運(yùn)算,被完全替換為硬件成本幾乎為零的加法、減法和數(shù)據(jù)交換(shuffle)操作。這從根本上消除了計(jì)算瓶頸,為實(shí)現(xiàn)數(shù)量級(jí)的推理加速提供了可能。

三、架構(gòu)革新:一個(gè)全面“復(fù)數(shù)化”的Transformer

為了讓這個(gè)魔法完美落地,研究團(tuán)隊(duì)還將整個(gè)Transformer架構(gòu)都進(jìn)行了“復(fù)數(shù)化”改造。



復(fù)數(shù)注意力機(jī)制:傳統(tǒng)注意力計(jì)算Q和K的點(diǎn)積,這里則巧妙地使用了Hermitian內(nèi)積的實(shí)部作為相似度分?jǐn)?shù),既利用了所有復(fù)數(shù)信息,又自然地得到了實(shí)數(shù)分?jǐn)?shù)用于Softmax。



復(fù)數(shù)旋轉(zhuǎn)位置編碼(RoPE):在復(fù)數(shù)域,位置編碼的旋轉(zhuǎn)操作變得異常簡(jiǎn)潔和統(tǒng)一,一個(gè)簡(jiǎn)單的復(fù)數(shù)乘法即可實(shí)現(xiàn)。



四、驚艷成果:PPL降低10%,性能反超全精度!

理論如此優(yōu)雅,實(shí)踐效果如何呢?結(jié)果同樣令人矚目。

iFairy 不僅沒有出現(xiàn)超低比特量化常見的性能懸崖,反而實(shí)現(xiàn)了驚人的性能反超。

在LLM的語言建模能力方面,模型的困惑度(PPL)越低,代表模型對(duì)文本的理解和預(yù)測(cè)能力越強(qiáng)。在對(duì)PPL的測(cè)試中,基于相同數(shù)據(jù)集訓(xùn)練(注:為保證對(duì)比的嚴(yán)謹(jǐn)性,所有對(duì)比模型的訓(xùn)練數(shù)據(jù)均保持一致,具體信息可參見論文)的2-bit的iFairy 模型取得了比全精度(FP16)模型更低的困惑度(PPL),降幅高達(dá) 10%。



而在下游任務(wù)評(píng)測(cè)方面,iFairy 模型更是在多個(gè)任務(wù)的評(píng)分反超了全精度的Llama基座模型。



這意味著,一個(gè)體積只有原來1/8、計(jì)算幾乎“零”乘法的模型,其能力反而更強(qiáng)了。這徹底顛覆了我們的傳統(tǒng)認(rèn)知。

對(duì)量化后權(quán)重的分析還發(fā)現(xiàn),模型在訓(xùn)練后,這四個(gè)復(fù)數(shù)值 {±1, ±i} 的分布非常均勻,證明模型確實(shí)學(xué)會(huì)了充分利用這套全新的“編碼系統(tǒng)”。



總而言之,這項(xiàng)工作開創(chuàng)性地將復(fù)數(shù)神經(jīng)網(wǎng)絡(luò)的思想與超低比特量化相結(jié)合,通過利用“相位”這一被忽略的信息維度,在不增加任何存儲(chǔ)成本的前提下,顯著提升了模型的表達(dá)能力和最終性能,真正實(shí)現(xiàn)了“魚與熊掌兼得”。

它為設(shè)計(jì)下一代超高效、高性能的大語言模型,打開了一扇全新的大門?;蛟S,我們離在普通手機(jī)上流暢運(yùn)行GPT-5級(jí)別的模型,又近了一步。 相關(guān)論文、訓(xùn)練代碼、模型權(quán)重與實(shí)驗(yàn)?zāi)_本已全部開源,配套提供從訓(xùn)練、評(píng)測(cè)到可復(fù)現(xiàn)實(shí)驗(yàn)的完整流程,人人皆可復(fù)現(xiàn)訓(xùn)練。

來源:中國(guó)網(wǎng)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
50歲佘詩(shī)曼私生活曝光:未婚,身價(jià)過億,獨(dú)居客廳僅10㎡小破宅,只想當(dāng)個(gè)富婆

50歲佘詩(shī)曼私生活曝光:未婚,身價(jià)過億,獨(dú)居客廳僅10㎡小破宅,只想當(dāng)個(gè)富婆

黎兜兜
2025-12-25 21:56:18
日本消息,高市早苗明天“拜鬼”,我們必將重拳出擊

日本消息,高市早苗明天“拜鬼”,我們必將重拳出擊

世家寶
2025-12-25 23:29:50
一路走好!不到48小時(shí)傳來3位名人離世的消息,一個(gè)比一個(gè)意外

一路走好!不到48小時(shí)傳來3位名人離世的消息,一個(gè)比一個(gè)意外

鋭娛之樂
2025-12-27 19:13:29
我國(guó)正式進(jìn)入拉尼娜氣候狀態(tài),影響即將顯現(xiàn)

我國(guó)正式進(jìn)入拉尼娜氣候狀態(tài),影響即將顯現(xiàn)

大魚濤濤
2025-12-26 17:44:05
1400億滬電股份,狂砍四個(gè)全球第一!

1400億滬電股份,狂砍四個(gè)全球第一!

飛鯨投研
2025-12-27 19:03:41
扣我油輪?6天后,終于等來中國(guó)出手反殺美國(guó)了!

扣我油輪?6天后,終于等來中國(guó)出手反殺美國(guó)了!

書中自有顏如玉
2025-12-27 11:06:55
日媒:一艘名為“Fuck Japan”的船出現(xiàn)在釣魚島附近

日媒:一艘名為“Fuck Japan”的船出現(xiàn)在釣魚島附近

隨波蕩漾的漂流瓶
2025-12-27 18:11:49
徐湖平兒子公司突然經(jīng)營(yíng)異常,工商登記信息又牽扯出個(gè)新角色

徐湖平兒子公司突然經(jīng)營(yíng)異常,工商登記信息又牽扯出個(gè)新角色

李健政觀察
2025-12-27 23:24:24
張铚秀對(duì)越反擊三立大功,為何85年失去職務(wù)?徐帥一句話道出原因

張铚秀對(duì)越反擊三立大功,為何85年失去職務(wù)?徐帥一句話道出原因

舊書卷里的長(zhǎng)安
2025-12-24 22:07:06
廣東1分險(xiǎn)勝北京!楊溢狂砍28+6+5,鋒線新星轟23+7,杜鋒很滿意

廣東1分險(xiǎn)勝北京!楊溢狂砍28+6+5,鋒線新星轟23+7,杜鋒很滿意

多特體育說
2025-12-27 21:14:22
筱梅灣灣辦節(jié)日家宴!箖箖和玥兒露正臉!玥兒坐在那神態(tài)太像大S

筱梅灣灣辦節(jié)日家宴!箖箖和玥兒露正臉!玥兒坐在那神態(tài)太像大S

老沮系戲精北鼻
2025-12-26 19:57:58
人民日?qǐng)?bào)專訪,揭開32歲周深的真實(shí)處境,那英確實(shí)一個(gè)字都沒說錯(cuò)

人民日?qǐng)?bào)專訪,揭開32歲周深的真實(shí)處境,那英確實(shí)一個(gè)字都沒說錯(cuò)

八斗小先生
2025-11-01 08:46:54
趙露思被鞠婧祎被秒的渣都不剩網(wǎng)友:苦練化妝技術(shù)奈何遇上建模怪

趙露思被鞠婧祎被秒的渣都不剩網(wǎng)友:苦練化妝技術(shù)奈何遇上建模怪

吳東升成
2025-12-26 05:39:04
布克30+9+5+末節(jié)12分,湖人退貨中鋒肆虐內(nèi)線,太陽力克鵜鶘

布克30+9+5+末節(jié)12分,湖人退貨中鋒肆虐內(nèi)線,太陽力克鵜鶘

釘釘陌上花開
2025-12-27 11:43:14
祁發(fā)寶上將亮相,六排勛章胸前掛,淡然一笑盡顯英雄本色

祁發(fā)寶上將亮相,六排勛章胸前掛,淡然一笑盡顯英雄本色

老特有話說
2025-12-23 21:35:49
扎哈羅娃:俄羅斯公民勿前往德國(guó)

扎哈羅娃:俄羅斯公民勿前往德國(guó)

參考消息
2025-12-26 19:33:05
逍遙丸可治20多種病,別只用來疏肝健脾了,一定要收藏

逍遙丸可治20多種病,別只用來疏肝健脾了,一定要收藏

阿兵科普
2025-12-27 17:04:42
開價(jià)1個(gè)億!瓜帥賽后猛夸安德森 曼聯(lián)獵物又遭曼城截胡?

開價(jià)1個(gè)億!瓜帥賽后猛夸安德森 曼聯(lián)獵物又遭曼城截胡?

球事百科吖
2025-12-28 02:16:06
中方反制不到24小時(shí),美悍然宣布中已違法,挑明九屆政府都護(hù)臺(tái)

中方反制不到24小時(shí),美悍然宣布中已違法,挑明九屆政府都護(hù)臺(tái)

阿傖說事
2025-12-27 14:10:31
25歲卡車司機(jī),帶著48歲女人跑長(zhǎng)途,最期待的就是經(jīng)過百里無人區(qū)

25歲卡車司機(jī),帶著48歲女人跑長(zhǎng)途,最期待的就是經(jīng)過百里無人區(qū)

二十一號(hào)故事鋪
2024-06-27 14:53:16
2025-12-28 06:04:49
三好大數(shù)據(jù)網(wǎng)
三好大數(shù)據(jù)網(wǎng)
互聯(lián)網(wǎng)科技科最新資訊
486文章數(shù) 26關(guān)注度
往期回顧 全部

科技要聞

小米也漲價(jià)了!業(yè)界稱終端再不漲明年必虧

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

頭條要聞

美媒:特朗普顯然觸及了中國(guó)的紅線 中方怒了

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂要聞

張昊唯逃稅涉黃風(fēng)波落幕:法院認(rèn)定朋友造謠

財(cái)經(jīng)要聞

注意,開始拉物價(jià)了!

汽車要聞

好音響比大屏更重要?車企開始“聽”用戶的

態(tài)度原創(chuàng)

本地
健康
親子
游戲
公開課

本地新聞

云游安徽|踏訪池州,讀懂山水間的萬年史書

這些新療法,讓化療不再那么痛苦

親子要聞

親密障礙改善的不僅是能力,更是溝通模式!

我真幸運(yùn):《泰拉瑞亞》1.4.5更新定檔1月份!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版