国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

LoPA:上海交大與華為聯(lián)手破解AI推理新困境

0
分享至


說起人工智能的文字生成,我們可以把它想象成一個(gè)非常特殊的打字機(jī)。傳統(tǒng)的AI語言模型就像一個(gè)按部就班的打字員,必須一個(gè)字母一個(gè)字母地慢慢敲打,前面的字母沒打完,后面的就得等著。但最近,上海交通大學(xué)和華為公司的研究團(tuán)隊(duì)開發(fā)出了一種全新的"打字方式",讓AI能夠同時(shí)敲打多個(gè)鍵盤,大大加快了文字生成的速度。

這項(xiàng)由上海交通大學(xué)嚴(yán)志杰教授領(lǐng)導(dǎo),華為公司多名研究人員參與的研究發(fā)表于2025年12月,論文編號(hào)為arXiv:2512.16229v2。研究團(tuán)隊(duì)開發(fā)的技術(shù)叫做"LoPA"(Lookahead Parallel Decoding),簡單來說就是"向前看的并行解碼"技術(shù)。他們的方法成功讓AI語言模型的推理速度提升了近10倍,在某些測試中達(dá)到了每秒生成1073個(gè)詞匯的驚人速度。

要理解這項(xiàng)突破的重要性,我們需要先了解AI語言模型是如何工作的。就像廚師按照菜譜一步步做菜一樣,傳統(tǒng)的AI模型必須按順序生成每一個(gè)詞匯。當(dāng)它要寫"今天天氣很好"這句話時(shí),必須先確定"今天",然后才能考慮"天氣",接著是"很",最后是"好"。這種串行的工作方式雖然準(zhǔn)確,但速度相對(duì)較慢,特別是在處理長篇內(nèi)容時(shí)。

近年來出現(xiàn)了一種新型的AI模型,叫做擴(kuò)散大語言模型(dLLM)。這類模型的工作原理更像是藝術(shù)家創(chuàng)作一幅畫——先有一個(gè)模糊的輪廓,然后逐步細(xì)化各個(gè)部分,最終得到完整的作品。在文字生成中,這意味著模型可以同時(shí)考慮句子中的多個(gè)位置,理論上能夠并行生成多個(gè)詞匯。

然而,擴(kuò)散模型在實(shí)際應(yīng)用中遇到了一個(gè)關(guān)鍵問題:雖然理論上可以并行工作,但由于置信度機(jī)制的限制,實(shí)際上每次前向傳播只能確定1到3個(gè)詞匯。這就像一個(gè)廚師雖然有多個(gè)爐灶,但因?yàn)閷?duì)菜譜不夠熟悉,每次只敢使用一個(gè)爐灶做菜,大大浪費(fèi)了廚房的潛力。

研究團(tuán)隊(duì)通過深入分析發(fā)現(xiàn),問題的根源在于"詞匯填充順序"(Token Filling Order)的選擇。在擴(kuò)散模型中,決定先填充哪個(gè)位置、后填充哪個(gè)位置,會(huì)顯著影響模型的置信度分布。就像拼圖游戲一樣,如果你選擇了錯(cuò)誤的拼圖策略——比如先拼邊緣還是先拼中心——會(huì)直接影響后續(xù)步驟的難度和效率。

基于這個(gè)洞察,研究團(tuán)隊(duì)開發(fā)了LoPA技術(shù)。這個(gè)技術(shù)的核心思想非常巧妙:既然我們無法提前知道哪種填充順序最好,那就同時(shí)嘗試多種可能的順序,然后選擇最有潛力的那一個(gè)。

具體來說,LoPA的工作過程可以比作一個(gè)經(jīng)驗(yàn)豐富的象棋大師在下棋時(shí)的思考過程。當(dāng)面臨一個(gè)復(fù)雜局面時(shí),大師不會(huì)只考慮一種走法,而是會(huì)在腦海中同時(shí)模擬多種可能的走法,預(yù)測每種走法可能導(dǎo)致的后續(xù)局面,然后選擇最有希望獲勝的那一步。

LoPA技術(shù)分為三個(gè)階段。首先是"分支準(zhǔn)備階段",系統(tǒng)會(huì)基于當(dāng)前的文本狀態(tài),創(chuàng)建一個(gè)主要分支和多個(gè)探索分支。主要分支采用傳統(tǒng)的置信度驅(qū)動(dòng)策略,而探索分支則會(huì)嘗試不同的詞匯填充順序。這就像一個(gè)導(dǎo)航系統(tǒng)同時(shí)規(guī)劃多條可能的路線。

接下來是"并行驗(yàn)證階段",系統(tǒng)會(huì)同時(shí)評(píng)估所有分支的可行性。這個(gè)過程非常高效,因?yàn)樗蟹种Э梢栽谝淮吻跋騻鞑ブ型瑫r(shí)處理,就像一臺(tái)超級(jí)計(jì)算機(jī)同時(shí)運(yùn)行多個(gè)模擬程序。

最后是"最優(yōu)選擇階段",系統(tǒng)會(huì)根據(jù)每個(gè)分支的"未來并行化潛力"來選擇最佳路徑。這個(gè)評(píng)估標(biāo)準(zhǔn)非常聰明:它不僅考慮當(dāng)前步驟的質(zhì)量,更重要的是預(yù)測選擇這個(gè)分支后,在下一步能夠并行處理多少個(gè)詞匯。

研究團(tuán)隊(duì)將LoPA技術(shù)應(yīng)用到了D2F模型上,這是目前最先進(jìn)的擴(kuò)散大語言模型之一。實(shí)驗(yàn)結(jié)果令人印象深刻:在數(shù)學(xué)問題求解任務(wù)(GSM8K)上,LoPA將模型的并行度提升到10.1,也就是說每次前向傳播能夠確定超過10個(gè)詞匯,比傳統(tǒng)方法提升了3倍以上。在代碼生成任務(wù)(HumanEval+)上,并行度達(dá)到了8.3,同樣實(shí)現(xiàn)了顯著提升。

更重要的是,這種速度提升并沒有犧牲生成質(zhì)量。在保持與原始模型相當(dāng)甚至更好的準(zhǔn)確率的同時(shí),LoPA實(shí)現(xiàn)了大幅度的加速。這就像找到了一種既快又好的新烹飪方法,既節(jié)省時(shí)間又保證了菜品質(zhì)量。

為了將算法上的改進(jìn)轉(zhuǎn)化為實(shí)際的系統(tǒng)性能提升,研究團(tuán)隊(duì)還開發(fā)了專門的分布式推理系統(tǒng),叫做"LoPA-Dist"。這個(gè)系統(tǒng)引入了"分支并行"(Branch Parallelism)的概念,將不同的探索分支分配給不同的計(jì)算設(shè)備,實(shí)現(xiàn)真正的并行計(jì)算。

LoPA-Dist系統(tǒng)有兩個(gè)版本:針對(duì)英偉達(dá)CUDA平臺(tái)優(yōu)化的LoPA-Dist-NV和針對(duì)華為昇騰910C芯片優(yōu)化的LoPA-Dist-Ascend。兩個(gè)版本都實(shí)現(xiàn)了接近線性的擴(kuò)展性,也就是說使用的計(jì)算設(shè)備越多,性能提升越明顯。

在華為昇騰平臺(tái)上,LoPA-Dist-Ascend達(dá)到了單樣本每秒1073.9個(gè)詞匯的驚人吞吐量。要知道,人類的正常閱讀速度大約是每分鐘200-300個(gè)詞,這意味著這個(gè)AI系統(tǒng)的文本生成速度比人類閱讀速度快了十幾倍。

系統(tǒng)設(shè)計(jì)中最巧妙的部分是KV緩存管理協(xié)議。在傳統(tǒng)的語言模型中,為了避免重復(fù)計(jì)算,系統(tǒng)會(huì)緩存之前計(jì)算的中間結(jié)果。但在LoPA的多分支架構(gòu)中,不同分支會(huì)產(chǎn)生不同的緩存狀態(tài),如何保持一致性成了技術(shù)難點(diǎn)。研究團(tuán)隊(duì)設(shè)計(jì)了兩階段更新機(jī)制:先讓各個(gè)設(shè)備預(yù)寫入自己的緩存,然后在確定最優(yōu)分支后,將獲勝分支的緩存廣播到所有設(shè)備,確保全局一致性。

研究團(tuán)隊(duì)在多個(gè)標(biāo)準(zhǔn)測試集上驗(yàn)證了LoPA的效果。在數(shù)學(xué)推理任務(wù)上,LoPA不僅大幅提升了速度,還略微改善了準(zhǔn)確率。在代碼生成任務(wù)上,速度提升同樣顯著,而準(zhǔn)確率基本保持不變。這證明了LoPA是一個(gè)真正意義上的"免費(fèi)午餐"——既快又好。

特別值得注意的是,LoPA技術(shù)具有很強(qiáng)的通用性。研究團(tuán)隊(duì)證明,這個(gè)技術(shù)不僅適用于D2F模型,也可以輕松集成到其他基于置信度驅(qū)動(dòng)的擴(kuò)散語言模型中,是一個(gè)真正的"即插即用"解決方案。

從技術(shù)角度來看,LoPA的創(chuàng)新在于它改變了我們對(duì)并行化的思考方式。傳統(tǒng)的方法試圖在固定的生成策略下擠壓更多的并行性,而LoPA則從根本上質(zhì)疑了生成策略的選擇,通過動(dòng)態(tài)優(yōu)化策略來釋放更多的并行化潛力。

對(duì)于普通用戶來說,這項(xiàng)技術(shù)的應(yīng)用前景非常廣闊。更快的語言模型意味著更流暢的AI對(duì)話體驗(yàn),更高效的文檔生成,以及更實(shí)時(shí)的翻譯服務(wù)。當(dāng)AI助手能夠幾乎瞬間理解并回應(yīng)用戶的復(fù)雜請求時(shí),人機(jī)交互的體驗(yàn)將發(fā)生質(zhì)的飛躍。

對(duì)于企業(yè)和開發(fā)者來說,LoPA技術(shù)意味著可以用更少的計(jì)算資源提供更好的AI服務(wù)。這不僅降低了運(yùn)營成本,也讓高質(zhì)量的AI服務(wù)更加普及和可及。

研究團(tuán)隊(duì)的工作還展現(xiàn)了學(xué)術(shù)界與產(chǎn)業(yè)界合作的典型成功案例。上海交通大學(xué)提供了理論創(chuàng)新和算法設(shè)計(jì),華為公司貢獻(xiàn)了工程實(shí)現(xiàn)和系統(tǒng)優(yōu)化經(jīng)驗(yàn),雙方的結(jié)合產(chǎn)生了既有理論深度又有實(shí)用價(jià)值的研究成果。

展望未來,LoPA技術(shù)開啟了擴(kuò)散語言模型優(yōu)化的新方向。研究團(tuán)隊(duì)在論文中指出,除了分支置信度之外,還可以探索其他的分支選擇標(biāo)準(zhǔn),比如考慮輸出多樣性、穩(wěn)定性等因素。此外,LoPA的思想也可能啟發(fā)其他類型AI模型的優(yōu)化工作。

這項(xiàng)研究的另一個(gè)重要意義在于它證明了在AI大模型時(shí)代,算法創(chuàng)新仍然具有巨大的價(jià)值。雖然現(xiàn)在的趨勢是通過增加模型規(guī)模和計(jì)算資源來提升性能,但LoPA展示了聰明的算法設(shè)計(jì)同樣能夠帶來顯著的性能突破,而且往往更加經(jīng)濟(jì)和環(huán)保。

說到底,LoPA技術(shù)就像給AI語言模型裝上了一個(gè)"智能大腦",讓它能夠同時(shí)思考多種可能性,選擇最優(yōu)的生成策略。這不僅大大提升了AI的工作效率,也為我們展示了人工智能優(yōu)化的新可能性。隨著這類技術(shù)的不斷發(fā)展和完善,我們有理由期待一個(gè)更加智能、高效的AI時(shí)代的到來。

Q&A

Q1:LoPA技術(shù)具體是什么?

A:LoPA是"向前看的并行解碼"技術(shù),由上海交通大學(xué)和華為聯(lián)合開發(fā)。它讓AI語言模型能夠同時(shí)嘗試多種不同的詞匯生成順序,然后選擇最有效率的那一種,從而大幅提升文本生成速度,最高可達(dá)每秒1073個(gè)詞匯。

Q2:LoPA技術(shù)會(huì)影響AI生成內(nèi)容的質(zhì)量嗎?

A:不會(huì)。實(shí)驗(yàn)結(jié)果顯示,LoPA在大幅提升生成速度的同時(shí),還能保持甚至略微改善生成質(zhì)量。在數(shù)學(xué)推理和代碼生成等任務(wù)上,準(zhǔn)確率都與原始模型相當(dāng)或更好,實(shí)現(xiàn)了速度和質(zhì)量的雙重提升。

Q3:普通用戶什么時(shí)候能體驗(yàn)到LoPA技術(shù)?

A:LoPA是一個(gè)即插即用的技術(shù),可以輕松集成到現(xiàn)有的AI語言模型中。隨著技術(shù)的進(jìn)一步成熟和推廣,預(yù)計(jì)很快就能在各種AI助手、翻譯工具和文檔生成服務(wù)中體驗(yàn)到更快更流暢的AI響應(yīng)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
蘇州“放煙花大軍”跨年點(diǎn)燃湖邊干草,消防員及時(shí)滅火并在旁守候,市民點(diǎn)贊

蘇州“放煙花大軍”跨年點(diǎn)燃湖邊干草,消防員及時(shí)滅火并在旁守候,市民點(diǎn)贊

極目新聞
2026-01-01 19:24:34
為什么,很多子女到了五六十歲后,慢慢對(duì)家里老人變得不孝了?

為什么,很多子女到了五六十歲后,慢慢對(duì)家里老人變得不孝了?

詩詞中國
2026-01-01 18:58:07
中國最珍貴的資源,不是石油,不是稀土,而是北方最常見的黃土層

中國最珍貴的資源,不是石油,不是稀土,而是北方最常見的黃土層

花花娛界
2026-01-01 15:42:29
西部最新排名:掘金創(chuàng)NBA奇跡,湖人收大禮,快船劍指前十

西部最新排名:掘金創(chuàng)NBA奇跡,湖人收大禮,快船劍指前十

籃球大視野
2026-01-01 16:08:54
凌晨3點(diǎn)屏東以南發(fā)生激烈對(duì)峙,052D不顧阻擾,強(qiáng)行壓向臺(tái)護(hù)衛(wèi)艦

凌晨3點(diǎn)屏東以南發(fā)生激烈對(duì)峙,052D不顧阻擾,強(qiáng)行壓向臺(tái)護(hù)衛(wèi)艦

墨蘭史書
2025-12-31 04:55:03
“中國宜家”崩了,創(chuàng)始人套現(xiàn)200億離場,美的太子接盤血虧?

“中國宜家”崩了,創(chuàng)始人套現(xiàn)200億離場,美的太子接盤血虧?

蜉蝣說
2025-12-23 20:00:55
姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

姜昆風(fēng)波持續(xù)發(fā)酵,洛杉磯鄰居紛紛出面,更多偶遇照又被扒出啦

振華觀史
2025-12-31 09:33:49
隱忍24年,陳婷終于撕下完美偽裝,她給所有“已婚女人”上了一課

隱忍24年,陳婷終于撕下完美偽裝,她給所有“已婚女人”上了一課

瓜汁橘長Dr
2025-12-30 17:03:39
戈貝爾:我們到底在不在乎贏球?還是說反正掙著大錢就隨意打打

戈貝爾:我們到底在不在乎贏球?還是說反正掙著大錢就隨意打打

北青網(wǎng)-北京青年報(bào)
2026-01-01 21:30:23
父親再婚后沒聯(lián)系,我39歲申請車貸,銀行經(jīng)理:您名下有一賬戶

父親再婚后沒聯(lián)系,我39歲申請車貸,銀行經(jīng)理:您名下有一賬戶

紅豆講堂
2025-12-23 12:50:05
難受!廣東慘敗,戰(zhàn)術(shù)被限制球星們不會(huì)打球,賽后還有四個(gè)壞消息

難受!廣東慘敗,戰(zhàn)術(shù)被限制球星們不會(huì)打球,賽后還有四個(gè)壞消息

陳赩愛體育
2026-01-01 21:47:21
高市早苗終于開口反思,盼望得到中國原諒,語氣中透露著羞愧

高市早苗終于開口反思,盼望得到中國原諒,語氣中透露著羞愧

面包夾知識(shí)
2025-12-19 13:07:36
2026 新一輪 “ 國補(bǔ) ” 開搶!網(wǎng)友炸了:準(zhǔn)備集體漲價(jià)?

2026 新一輪 “ 國補(bǔ) ” 開搶!網(wǎng)友炸了:準(zhǔn)備集體漲價(jià)?

科技狐
2025-12-31 23:29:50
52歲朱迅主持跨年晚會(huì),被吐槽像芭比娃娃,網(wǎng)友:給整懵圈了

52歲朱迅主持跨年晚會(huì),被吐槽像芭比娃娃,網(wǎng)友:給整懵圈了

丫頭舫
2026-01-01 21:39:17
上?!笆讏鲅苯K于來了,氣溫降至冰點(diǎn),“熱鬧”模式開啟,最高峰就在今天

上?!笆讏鲅苯K于來了,氣溫降至冰點(diǎn),“熱鬧”模式開啟,最高峰就在今天

新民晚報(bào)
2026-01-01 15:21:49
郭可盈在豪宅過節(jié),與女兒在圣誕樹前合照,屋內(nèi)燈火通明市值半億

郭可盈在豪宅過節(jié),與女兒在圣誕樹前合照,屋內(nèi)燈火通明市值半億

民間平哥
2026-01-01 20:01:39
奇瑞再次否認(rèn)與追覓合作:雙方并未進(jìn)行合作簽約

奇瑞再次否認(rèn)與追覓合作:雙方并未進(jìn)行合作簽約

IT之家
2026-01-01 20:23:11
羽超!15-1橫掃世界第二!臨時(shí)組合19分鐘打崩蔣振邦/魏雅欣

羽超!15-1橫掃世界第二!臨時(shí)組合19分鐘打崩蔣振邦/魏雅欣

小蘭看體育
2026-01-01 20:11:21
黎筍之子黎堅(jiān)誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

黎筍之子黎堅(jiān)誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

磊子講史
2025-12-24 11:04:05
股民坐穩(wěn)扶好!下周A股2026年行情開啟,或?qū)⒅噩F(xiàn)19年歷史行情了?

股民坐穩(wěn)扶好!下周A股2026年行情開啟,或?qū)⒅噩F(xiàn)19年歷史行情了?

股市皆大事
2026-01-01 12:10:26
2026-01-01 23:04:49
至頂AI實(shí)驗(yàn)室 incentive-icons
至頂AI實(shí)驗(yàn)室
一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
896文章數(shù) 151關(guān)注度
往期回顧 全部

科技要聞

特斯拉Model 3車主首度全程自駕橫穿美國

頭條要聞

滬漂外國網(wǎng)紅包丟了報(bào)警 警察到現(xiàn)場后發(fā)現(xiàn)"神秘字條"

頭條要聞

滬漂外國網(wǎng)紅包丟了報(bào)警 警察到現(xiàn)場后發(fā)現(xiàn)"神秘字條"

體育要聞

2026,這些英超紀(jì)錄可能會(huì)被打破

娛樂要聞

跑調(diào)風(fēng)波越演越烈!沈佳潤被網(wǎng)友喊話

財(cái)經(jīng)要聞

巴菲特「身退,權(quán)還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

藝術(shù)
數(shù)碼
本地
手機(jī)
軍事航空

藝術(shù)要聞

私房照揭秘:你不知道的陰柔之美!

數(shù)碼要聞

RTX 5090改裝上到1350W差點(diǎn)燒毀!華擎溫度傳感器成功救命

本地新聞

即將過去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

手機(jī)要聞

REDMI Note 15 系列新春版開售,本月新機(jī)蓄勢待發(fā)

軍事要聞

福建艦全體官兵列陣 送上硬核祝福

無障礙瀏覽 進(jìn)入關(guān)懷版