国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小語言模型 VS 大語言模型

0
分享至

(本文編譯自Semiconductor Engineering)

邊緣人工智能的普及需要語言模型和芯片架構(gòu)做出根本性變革,才能使人工智能數(shù)據(jù)中心之外的推理和學習成為可行選擇。

小語言模型(SLM)的最初目標是專門用于推理任務,其參數(shù)量約為100億或更少,而最大的大語言模型(LLM)的參數(shù)量則超過萬億。然而,如今小語言模型也越來越多地具備一定的學習能力。由于這類模型是為特定任務量身定制的,它們生成結(jié)果所需的時間遠少于向人工智能數(shù)據(jù)中心發(fā)送查詢、指令或傳感器數(shù)據(jù)并接收響應所需的時間。

SLM并非新生事物。EDA公司多年來一直在探索優(yōu)化計算軟件,科學家們也已將小型模型應用于解決數(shù)學和科學問題。但2022年11月ChatGPT的推出,徹底改變了世界對人工智能的認知,而涌入該行業(yè)的巨額投資也使得商用語言模型能夠在本地運行得更快,同時大幅降低能耗。

在邊緣部署人工智能需要對語言模型進行更精細的優(yōu)化。但業(yè)界期望,這些模型最終能為邊緣設備實現(xiàn)原本屬于物聯(lián)網(wǎng)的功能。盡管邊緣人工智能市場總規(guī)模(TAM)增長的預測仍帶有推測性,但各方普遍認為其正呈快速增長趨勢。《財富商業(yè)洞察》估計,到2032年,該市場規(guī)模將達到2670億美元,而2024年僅為270億美元。反過來,這有望為各種芯片、芯粒以及用于優(yōu)化這些設計的工具,創(chuàng)造全新的市場機遇。

德勤近期的一項調(diào)查發(fā)現(xiàn),2024年投資邊緣計算的公司,對邊緣人工智能的投資回報比以往更為樂觀。德勤指出,嵌入某些設備的人工智能技術(shù)可能帶來顛覆性變革,因為它無需網(wǎng)絡連接。這將對從工業(yè)和汽車到消費電子設備(例如安防攝像頭)等一系列應用領(lǐng)域產(chǎn)生影響。

在汽車領(lǐng)域,SLM將提升車輛功能,并提升車路協(xié)同通信質(zhì)量。在芯片制造領(lǐng)域,它們將提供實時分析服務。在客戶服務領(lǐng)域,它們將減少自動應答服務菜單帶來的用戶困擾。此外,它們還將推動新型芯片架構(gòu)的發(fā)展,從采用定制處理器和更分布式控制器的多芯片組件,到預加載SLM的芯粒。

當前的挑戰(zhàn)在于,如何將這些SLM縮小到可用規(guī)模,并開發(fā)能夠在低功耗預算內(nèi)加速算法運行的硬件架構(gòu),且要保證其在所用領(lǐng)域具備足夠的精度。大型人工智能公司已報告稱,通過量化技術(shù),通過量化技術(shù)已實現(xiàn)數(shù)量級的模型壓縮,將高精度32位浮點數(shù)(FP32)降至4位浮點(FP4)。這種方法之所以有效,是因為并非每個查詢、指令或分析都需要篩選海量數(shù)據(jù)集。如果可以將少量高度相關(guān)的數(shù)據(jù)存儲在本地,或者至少存儲在靠近終端設備的位置,那么簡單的4位精度響應可能已足夠。此外,通過使用針對特定數(shù)據(jù)類型定制的更快處理單元和更具針對性的存儲架構(gòu),SLM或許能夠在不顯著降低速度或消耗電池電量的情況下使用16位浮點(FP16)。

ChipAgents首席執(zhí)行官William Wang表示:“很多人都在關(guān)注這些小語言模型。客戶既希望模型能為特定任務提供高性能,又要確保做出合理的權(quán)衡?;蛟S你可以選擇性能稍低但響應速度更快的模型。”

這是實現(xiàn)人工智能另一種思路?!按笳Z言模型本質(zhì)上是一種蠻力式的方法,它收集所有可用數(shù)據(jù),通過各類向量化處理,將其壓縮到無數(shù)不同的連接中,”Cadence公司人工智能知識產(chǎn)權(quán)產(chǎn)品營銷總監(jiān)Jayson Lawley表示,“但如果能不斷縮小模型規(guī)模并進行壓縮,就能更高效地將 AI 功能推向邊緣側(cè)?!?/p>

英飛凌物聯(lián)網(wǎng)、消費電子和工業(yè)微控制器高級副總裁Steve Tateosian表示:“我們可以突破喚醒詞的語言模型局限,將自然語言處理融入到問題中,再通過語言模型生成響應。我們稱之為邊緣語言模型(ELM),而它的發(fā)展方向是從生成式人工智能到通用人工智能,這樣模型就可以用于不同的用途。你可以運行多個ELM,訓練一個語言模型來詢問上下文,另一個模型訓練用于視覺識別等。然后,在所有這些模型之上,可能還會有一個智能體,利用這些模型的輸入來告知用戶一些感興趣的信息。”


圖1:數(shù)據(jù)中心LLM與ELM的能耗對比。

(圖源:英飛凌)

聚焦特定工作負載

短期內(nèi),通用性更強的SLM更具合理性,因為它們可以利用各種處理單元。語言模型幾乎處于不斷迭代的狀態(tài),而硬件的設計、驗證和制造需要18到24個月的時間。到那時,專為特定SLM設計的芯片可能已經(jīng)過時了。

ChipAgents公司的Wang表示:“你想從大模型中提煉基礎(chǔ)知識,并將其注入到小模型中。同時還要能修剪權(quán)重,如用8位代替16位。所有數(shù)據(jù)都會被壓縮。目前已有成熟算法可實現(xiàn)權(quán)重壓縮,同時保證一定精度水平。但語言模型和人工智能的發(fā)展速度太快,硬件協(xié)同設計難度極大。”

其他方法包括在芯片中添加一些可編程性,或使用更通用的芯片進行一些定制配置,使其能與一個或多個聚焦特定場景的SLM實現(xiàn)最佳權(quán)衡。

Baya Systems首席商務官Nandan Nayampally表示:“越靠近終端設備,可變現(xiàn)的服務就越多。我們看到,許多客戶都對更具體、更定制化的模型提出了需求。LLM實際上是通用知識庫,而許多基于LLM開發(fā)的SLM更多地與推理而非訓練相關(guān)。訓練需求不會消失,而且從中短期來看還會增長,因為會有更多模型作為SLM的基礎(chǔ)模型。但推理環(huán)節(jié)正在從云端下移到網(wǎng)絡邊緣,甚至可能下移至終端設備,這種轉(zhuǎn)變非常有趣?!?/p>

英飛凌互聯(lián)安全系統(tǒng)事業(yè)部總裁Thomas Rosteck表示:“過去,物聯(lián)網(wǎng)更像是連接云端的接口,而現(xiàn)在它才真正成為‘萬物互聯(lián)’的形態(tài)。設備之間可以互相通信。邊緣人工智能通過提供更強大的智能和新的功能集,為物聯(lián)網(wǎng)設備增添了新的能力。那么,未來會有什么變革嗎?答案是肯定的,因為邊緣設備的功能正變得越來越強大。邊緣和云端之間的分工也必須進行調(diào)整,因為云端服務器集群消耗大量能源,我們至少要讓數(shù)據(jù)傳輸和任務分配變得更合理?!?/p>

這并不意味著云端不再有用。模型仍需要訓練,大規(guī)模的上下文搜索和分析對于邊緣設備來說仍然過于復雜。但是,將更多處理任務轉(zhuǎn)移到邊緣確實可以降低每次人工智能交互的成本,包括數(shù)據(jù)傳輸、云端處理,以及將數(shù)據(jù)以邊緣設備可用格式返回所需的能耗都會減少。

Arteris公司董事長兼首席執(zhí)行官Charlie Janac表示:“提高效率的方法之一是減少所有這些數(shù)據(jù)傳輸?shù)哪芎?。另一種方法是改進LLM處理數(shù)據(jù)的方式。因此,這里存在很多創(chuàng)新空間,而且這些創(chuàng)新是必要的,目前來看,所有為人工智能訓練和推理而建的數(shù)據(jù)中心,它們的總能耗是世界迄今為止能源產(chǎn)量的三倍。這催生了小型核反應堆的巨大市場,但解決問題的關(guān)鍵之一是提升整體效率,我們不能僅僅關(guān)注處理能力,而必須關(guān)注能源效率和能源利用率?!?/p>

這種效率提升不僅源于優(yōu)化運行LLM的系統(tǒng)性能,還源于利用SLM在邊緣側(cè)處理更多數(shù)據(jù),同時減少需要發(fā)送至云端的數(shù)據(jù)量?!瓣P(guān)鍵在于最大限度地減少數(shù)據(jù)來回傳輸,”Synaptics無線事業(yè)部高級副總裁兼總經(jīng)理Venkat Kodavati表示,“但當必須進行傳輸時,也希望以高效的方式進行,并節(jié)省電量。我們已經(jīng)看到很多小語言模型,它們擁有數(shù)億個參數(shù),我們可以在邊緣設備上支持數(shù)據(jù)傳輸。但未來模型將能在邊緣設備上更高效地運行。不僅可以在邊緣側(cè)完成大量推理任務,還能進行部分訓練;可以在邊緣側(cè)開展定制化訓練,再將模型更新至云端。所有這些都將在不久后成為現(xiàn)實。”


圖2:智能邊緣的應用案例。

(圖源:Synaptics)

能本地則本地,需全局則全局

至少在短期內(nèi),結(jié)合云端與邊緣側(cè)的混合模型將成為大多數(shù)場景的常態(tài)。本地處理速度更快,但設備仍需要與大型數(shù)據(jù)中心進行通信,以進行維護、軟件更新以及查詢無法本地存儲的大型數(shù)據(jù)集(例如半導體制造中的數(shù)據(jù)集)。事實上,SLM會增加多次測試插入過程中需要處理的數(shù)據(jù)量。

“我們還會繼續(xù)使用大語言模型一段時間,”愛德萬測試應用研究與技術(shù)副總裁Ira Leventhal表示,“小語言模型將專注于一些真正適用的特定應用場景。但從測試的角度來看,如果采用小語言模型,優(yōu)勢在于它們目標明確。但這樣一來,測試用例的數(shù)量就會減少,從而降低測試過程中的變數(shù),這將簡化測試流程。但如果使用大量的小語言模型,就必須同時對所有這些模型進行測試,而且必須并行測試。”

這需要跟蹤涉及多個小語言模型的所有交互和依賴關(guān)系。小語言模型需要謹慎地集成到復雜的流程中,如半導體測試或檢驗,否則可能引發(fā)問題。

PDF Solutions首席執(zhí)行官John Kibarian表示:“我們正利用大語言模型的技術(shù)能力,但客戶希望它能與我們的系統(tǒng)高度適配,進而與他們自身的數(shù)據(jù)精準匹配并實現(xiàn)本地化部署。他們需要的是完全定制化的解決方案,能夠更好地了解他們的環(huán)境,并根據(jù)現(xiàn)有功能不斷更新。他們還希望人工智能能夠增強現(xiàn)有知識,以便將知識捕獲并傳承給下一代工程師。這將引領(lǐng)我們的行業(yè)邁向前所未有的高度,同時也不會遺忘過去積累的經(jīng)驗。他們正在尋找這種小型化、本地訓練的能力,通過學習他們過去所有的生產(chǎn)、分析、測試程序以及數(shù)據(jù)處理方式,有效地將經(jīng)驗知識在一定程度上整合起來,從而更快地在整個組織內(nèi)推廣這種能力?!?/p>

更多功能,新的挑戰(zhàn)

SLM是一個寬泛的統(tǒng)稱,最終將細分為多個子集。例如,目前已有多模態(tài)模型、視頻SLM,隨著邊緣設備功能的增加,未來還會出現(xiàn)其他類型的SLM。但目前尚不清楚的是,這些SLM將如何交互,如何以有效的方式構(gòu)建這些交互,以及在無法構(gòu)建交互時如何最大限度地減少交互。此外,如果允許這些設備自主學習,則需要某種形式的監(jiān)管來確保其可靠性。

結(jié)語

在不久的將來,精度與性能之間的權(quán)衡仍將是邊緣側(cè)及面向邊緣側(cè)開發(fā)的SLM的核心議題。但提供邊緣AI服務的公司可以利用其在云端LLM方面積累的經(jīng)驗,加速SLM的部署。數(shù)據(jù)傳輸距離越短,需要發(fā)送到云端的數(shù)據(jù)量越少,響應速度就越快。而SLM的功能定義越精準,其整體優(yōu)化速度也會越快。

SLM正快速興起,并在各個方向突破邊界。有些SLM將支持多模態(tài),而有些則專注于特定模態(tài),如視覺或自然語言音頻。無論如何,它們都將定義并重新定義人類與機器,以及機器之間的交互方式。所有這些都將發(fā)生在數(shù)據(jù)源頭附近,而這一切都將在更靠近數(shù)據(jù)源、更貼近人們工作與日常生活所用工具和設備的場景中發(fā)生。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
足壇最難破的五大紀錄!大羅貝利上榜,梅西墊底,第一堪稱神跡!

足壇最難破的五大紀錄!大羅貝利上榜,梅西墊底,第一堪稱神跡!

天下足球資訊
2025-12-23 13:55:57
關(guān)系藏不住了!樊振東放著世界冠軍陳夢不選,原來他喜歡這樣的

關(guān)系藏不住了!樊振東放著世界冠軍陳夢不選,原來他喜歡這樣的

法老不說教
2025-12-24 18:19:27
沒想到!白蘿卜配山楂,才2天時間,解決了大煩惱,真是高手!

沒想到!白蘿卜配山楂,才2天時間,解決了大煩惱,真是高手!

江江食研社
2025-12-20 07:30:07
神秘“華人”爆料,某島上錢色交易不值一提,深層次的秘密才可怕

神秘“華人”爆料,某島上錢色交易不值一提,深層次的秘密才可怕

林林故事揭秘
2024-12-25 12:24:41
巴菲特3480億抄底日元?全球金融將迎巨震!

巴菲特3480億抄底日元?全球金融將迎巨震!

余豐慧
2025-12-23 20:59:25
拆遷全面叫停?滿24年房齡的老小區(qū),一律按新規(guī)處理!業(yè)主迎利好

拆遷全面叫停?滿24年房齡的老小區(qū),一律按新規(guī)處理!業(yè)主迎利好

boss外傳
2025-12-23 20:30:05
全國統(tǒng)一體制內(nèi)口頭禪,一出口就知道,網(wǎng)友:味太正了!

全國統(tǒng)一體制內(nèi)口頭禪,一出口就知道,網(wǎng)友:味太正了!

另子維愛讀史
2025-12-18 16:59:41
獨居女孩凌晨點夜宵,配送員發(fā)來短信:有個男人拿著刀站在你家門口

獨居女孩凌晨點夜宵,配送員發(fā)來短信:有個男人拿著刀站在你家門口

罪案洞察者
2025-12-18 13:57:07
還能破紀錄嗎?雷霆目前26勝4負,73勝勇士同期29勝1負

還能破紀錄嗎?雷霆目前26勝4負,73勝勇士同期29勝1負

懂球帝
2025-12-24 12:26:29
鄭麗文韓國瑜聯(lián)手清黨渣,侯友宜盧秀燕跪地求饒,國民黨終于姓鄭

鄭麗文韓國瑜聯(lián)手清黨渣,侯友宜盧秀燕跪地求饒,國民黨終于姓鄭

徐徐道史
2025-12-24 11:09:24
梅婷幫穎兒布置別墅,戴橡膠手套熱得穿T恤,付辛博帥照搶鏡

梅婷幫穎兒布置別墅,戴橡膠手套熱得穿T恤,付辛博帥照搶鏡

八怪娛
2025-12-24 20:05:46
求助中國?哈薩克斯坦與日本簽了稀土協(xié)議后,發(fā)現(xiàn)運輸是個老難題

求助中國?哈薩克斯坦與日本簽了稀土協(xié)議后,發(fā)現(xiàn)運輸是個老難題

科學發(fā)掘
2025-12-24 00:04:18
曾仕強教授:2026年是一道大坎,很多人恐怕?lián)尾贿^去

曾仕強教授:2026年是一道大坎,很多人恐怕?lián)尾贿^去

心靈短笛
2025-12-03 10:08:19
日本居然決定向烏克蘭提供60億美元援助,支持其對俄戰(zhàn)爭努力。

日本居然決定向烏克蘭提供60億美元援助,支持其對俄戰(zhàn)爭努力。

南權(quán)先生
2025-12-24 16:54:30
威廉凱特發(fā)布王室全家福,夏公主偎依父親肩膀,喬治王子戴手鏈

威廉凱特發(fā)布王室全家福,夏公主偎依父親肩膀,喬治王子戴手鏈

我是盲流
2025-12-19 12:45:08
政權(quán)倒臺一年后,阿薩德家族被曝在俄羅斯過著“奢華生活”

政權(quán)倒臺一年后,阿薩德家族被曝在俄羅斯過著“奢華生活”

澎湃新聞
2025-12-23 16:42:30
多米尼克-瓊斯:1月份會與某支球隊簽約,我仍是CBA外援TOP3

多米尼克-瓊斯:1月份會與某支球隊簽約,我仍是CBA外援TOP3

懂球帝
2025-12-24 10:30:18
“九三”受閱女民兵李若嘉:用96米丈量榮耀,以128步定義人生|拓維·2025

“九三”受閱女民兵李若嘉:用96米丈量榮耀,以128步定義人生|拓維·2025

封面新聞
2025-12-24 07:49:04
王金平事件再發(fā)酵!柯志恩發(fā)長文諷刺鄭麗文,藍營高雄徹底沒戲

王金平事件再發(fā)酵!柯志恩發(fā)長文諷刺鄭麗文,藍營高雄徹底沒戲

聞識
2025-12-24 05:07:06
萬科被下調(diào)評級至“選擇性違約”

萬科被下調(diào)評級至“選擇性違約”

地產(chǎn)微資訊
2025-12-24 11:28:11
2025-12-24 21:23:00
TechSugar incentive-icons
TechSugar
做你身邊值得信賴的科技新媒體
4950文章數(shù) 12726關(guān)注度
往期回顧 全部

科技要聞

智譜和MiniMax拿出了“血淋淋”的賬本

頭條要聞

月薪3850元男子為漲薪給領(lǐng)導發(fā)紅包被開 案子打到高院

頭條要聞

月薪3850元男子為漲薪給領(lǐng)導發(fā)紅包被開 案子打到高院

體育要聞

26歲廣西球王,在質(zhì)疑聲中成為本土得分王

娛樂要聞

懷孕增重30斤!闞清子驚傳誕一女夭折?

財經(jīng)要聞

北京進一步放松限購 滬深是否會跟進?

汽車要聞

“運動版庫里南”一月份亮相???或命名極氪9S

態(tài)度原創(chuàng)

家居
旅游
教育
時尚
本地

家居要聞

法式大平層 智能家居添彩

旅游要聞

“冷資源”變成“熱經(jīng)濟” 新疆鄉(xiāng)村大力發(fā)展冬日旅游產(chǎn)業(yè)

教育要聞

“光盤到了國外成了可恥”,家長被新西蘭老師約談,原因令人不解

赫本黑色高領(lǐng)衫的4種搭配,太值得借鑒!

本地新聞

云游安徽|一川江水潤安慶,一塔一戲一城史

無障礙瀏覽 進入關(guān)懷版