国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小模型,也是嵌入式的未來

0
分享至

這兩天,英偉達一個最新研究結(jié)論讓業(yè)界備受關(guān)注——小型語言模型(SLM)才是智能體的未來。緊接著,英偉達又拋出了自己的全新小型語言模型:Nemotron-Nano-9B-V2,該模型在部分基準測試中達到了同類產(chǎn)品中的最高性能。

事實上,小型語言模型(SLM)的風(fēng),也刮到了MCU和MPU領(lǐng)域。

小模型,就是“壓小”的大模型

小型語言模型(SLM)也許我們早有所接觸。SLM 的參數(shù)范圍從幾百萬到幾十億不等,而 LLM 則具有數(shù)千億甚至數(shù)萬億參數(shù)。

SLM是由LLM壓縮而來,壓縮模型需要在縮小模型的同時,盡可能保留模型的準確性。常見方法如下:

  • 知識蒸餾:利用從大型“教師”模型轉(zhuǎn)移的知識來訓(xùn)練一個較小的“學(xué)生”模型;

  • 剪枝:移除神經(jīng)網(wǎng)絡(luò)架構(gòu)中冗余或不那么重要的參數(shù);

  • 量化:降低計算中使用的數(shù)值精度(例如,將浮點數(shù)轉(zhuǎn)換為整數(shù))。

小型語言模型比大型模型更緊湊、更高效。因此,SLM需要較少的內(nèi)存和計算能力,非常適合資源受限的邊緣或者嵌入式設(shè)備。

許多小而強大的語言模型已經(jīng)出現(xiàn),證明大小并非一切。常見的10億到40億的SLM包括Llama3.2-1B(Meta開發(fā)的10億參數(shù)變體)、Qwen2.5-1.5B(阿里巴巴的15億參數(shù)模型)、DeepSeeek-R1-1.5B(DeepSeek的15億參數(shù)模型)、SmolLM2-1.7B(HuggingFaceTB,的17億參數(shù)模型)、Phi-3.5-Mini-3.8B(微軟的38億參數(shù)模型)、Gemma3-4B(Google DeepMind的40億參數(shù)模型)。

跑SLM,靠得不光是算力

對MPU來說,跑SLM,似乎不是什么難題。但對開發(fā)人員來說,如何知道MCU支持是否支持運行生成式AI?

這個問題沒有單一、直接的答案——不過有一個硬性要求,即MCU的神經(jīng)處理單元(NPU)必須能夠加速Transformer運行。

除此之外,跑生成式AI,對于MCU的帶寬系統(tǒng)總線以及以及大容量、高速、緊密耦合的內(nèi)存配置有要求。

其實,現(xiàn)在很多人都去只用GOPS(十億次運算每秒)或TOPS(萬億次運算每秒)來比較微控制器的原始吞吐量,目前性能最佳的MCU能提供高達250GOPS的算力,而用于生成式AI的MCU將至少提供兩倍于此的性能。但原始吞吐量并非衡量實際系統(tǒng)性能的理想指標。

因為成功的生成式AI應(yīng)用程序需要支持Transformer運算,會在系統(tǒng)內(nèi)部、內(nèi)存、神經(jīng)處理單元、中央處理器以及圖像信號處理器等外圍功能之間傳輸大量數(shù)據(jù)。因此,一個具有高原始吞吐量的系統(tǒng)理論上或許能快速處理大量數(shù)據(jù),但如果系統(tǒng)無法將數(shù)據(jù)快速傳輸給神經(jīng)處理單元,實際性能就會十分緩慢,令人失望。

當(dāng)然,對MPU來說,大帶寬、內(nèi)存、總線之間的緊密耦合也至關(guān)重要。

Aizip與Renesas合作的SLM項目

早在去年8月,Aizip就與Renesas攜手合作,在MPU上展示了用于邊緣系統(tǒng)應(yīng)用的超高效SLM和緊湊型AI Agents,這些小巧而高效的模型已經(jīng)集成到基于 Arm Cortex-A55的Renesas RZ/G2L和RZ/G3S主板中。

Aizip創(chuàng)建了一系列超高效的小型語言模型(SLM)和人工智能代理(AI Agents),名為 Gizmo,規(guī)模從3億到20億個參數(shù)不等。這些型號支持多種平臺,包括適用于廣泛應(yīng)用的 MPU和應(yīng)用處理器。

SLM使設(shè)備邊緣應(yīng)用程序上的AI代理能夠提供與大型語言模型(LLM)相同的功能,但在邊緣占用空間上。設(shè)備上模型具有增強的隱私保護、彈性作和節(jié)省成本等優(yōu)勢。雖然一些公司已經(jīng)成功地減小了手機語言模型的大小,但確保在低成本邊緣設(shè)備上為自動化應(yīng)用提供準確的工具調(diào)用仍然是這些 SLM 面臨的重大挑戰(zhàn)。

據(jù)介紹,在運行頻率為1.2 GHz的單個A55內(nèi)核的RZ/G2L上,這些SLM可以實現(xiàn)不到3秒的響應(yīng)時間。

MCU,也在加大對SLM投入

Alif Semiconductor最近發(fā)布了最新系列的MCU和融合處理器——Ensemble E4、E6和E8,便主要針對支持SLM在內(nèi)的生成式AI模型的運行。與此同時,Alif是首家使用 Arm Ethos-U85 NPU(神經(jīng)處理單元)的芯片供應(yīng)商,該芯片支持基于Transformer的機器學(xué)習(xí)網(wǎng)絡(luò)。

根據(jù)基準測試結(jié)果顯示,該系列在不到2毫秒的時間內(nèi)進行高能效物體檢測、圖像分類時間不到8毫秒、在E4設(shè)備上執(zhí)行的SLM在生成文本以根據(jù)用戶提供的提示構(gòu)建故事時僅消耗36mW的功率。

Ensemble E4(MCU)采用雙Arm Cortex-M55內(nèi)核,Ensemble E6和E8融合處理器分別基于Arm Cortex-A32內(nèi)核和雙Cortex-M55內(nèi)核,值得注意的是E4/E6/E8均搭載雙Ethos-U55+Ethos-U85,算力非常強大。

Alif認為,相比其他制造商,他們布局更早,因為第一代Ensemble MCU系列早在2021年就發(fā)布了,從那時起我們就一直在批量出貨E1、E3、E5 和 E7設(shè)備。而在其他MCU廠商還停留在第一代AI MCU時,Alif就發(fā)布了第二代產(chǎn)品,同時是業(yè)界首款支持基于Transformer的網(wǎng)絡(luò)的MCU,是LLM和其他生成式AI模型的基礎(chǔ)。

SLM會是嵌入式的未來

SLM在大幅壓縮模型體積的同時,盡可能保留了模型的準確性。這種高效、緊湊的特性,使其完美契合了資源受限的邊緣和嵌入式設(shè)備,為這些設(shè)備帶來了前所未有的智能能力。

事實上,邊緣AI的未來圖景正在徐徐展開,SLM也會是MCU和MPU廠商會布局的關(guān)鍵領(lǐng)域之一。

比如,意法半導(dǎo)體的STM32N6、英飛凌PSoC Edge最新一代MCU、TI的AM62A和TMS320F28P55x、恩智浦的i.MX RT700和i.MX 95、ADI的MAX7800X都開始重視NPU。

嵌入式AI最初主要是在Linux系統(tǒng)上運行的相對昂貴的基于微處理器的產(chǎn)品的一項功能。但很快,市場意識到邊緣和端點設(shè)備中也有AI的空間——其中許多設(shè)備都是基于MCU。所以,在2025年下半年,先進的MCU廠商都將提供AI功能的產(chǎn)品納入其產(chǎn)品組合中。這些廠商的NPU分為Arm Ethos IP一派和自研一派。目前來看,最新的Ethos-U85開始支持Transformer,并且在半年前展示了搭載SLM的效果,其他廠商也在不斷跟進。在未來,相信SLM也會徹底改變MCU和MPU的格局。

參考文獻

[1]IBM:https://www.ibm.com/cn-zh/think/topics/small-language-models

[2]Hugging-Face:https://hugging-face.cn/blog/jjokah/small-language-model

[3]Alif:https://alifsemi.com/comparing-mcus-for-generative-ai-its-not-just-about-the-gops/

[4]Alif:https://alifsemi.com/who-wins-in-the-race-to-make-ai-mcus/

[5]Arm:https://newsroom.arm.com/blog/small-language-model-generative-ai-edge

歡迎將我們設(shè)為“星標”,這樣才能第一時間收到推送消息。

關(guān)注EEWorld旗下訂閱號:“機器人開發(fā)圈”

回復(fù)“DS”領(lǐng)取《DeepSeek:從入門到精通》完整版

掃碼添加小助手回復(fù)“機器人”

進群和電子工程師們面對面交流經(jīng)驗

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
朝鮮為什么不承認上甘嶺戰(zhàn)役,全世界都知道的事實!

朝鮮為什么不承認上甘嶺戰(zhàn)役,全世界都知道的事實!

阿諬體育評論
2026-03-20 22:10:13
家里這7樣舊東西別丟!今年漲了80%,比黃金還吃香

家里這7樣舊東西別丟!今年漲了80%,比黃金還吃香

小鹿姐姐情感說
2026-03-29 10:26:08
恭喜廣東隊!男籃內(nèi)線國手有望加盟,保送杜鋒躺進總決賽!

恭喜廣東隊!男籃內(nèi)線國手有望加盟,保送杜鋒躺進總決賽!

緋雨兒
2026-03-29 13:58:28
華為新機曝光:搭載麒麟9030 Pro+超大直屏!

華為新機曝光:搭載麒麟9030 Pro+超大直屏!

科技堡壘
2026-03-28 11:41:02
人老了,想多活幾年,先管住自己這10點:1、不摔倒,2、不勞累…

人老了,想多活幾年,先管住自己這10點:1、不摔倒,2、不勞累…

荷蘭豆愛健康
2026-03-28 09:28:48
小米利潤有多高?算完這筆賬,我沉默了,默默點贊雷軍!

小米利潤有多高?算完這筆賬,我沉默了,默默點贊雷軍!

科技專家
2026-03-29 14:51:08
3月30日執(zhí)行!不需買墓地了,國家將要開始正式放開殯葬新選擇

3月30日執(zhí)行!不需買墓地了,國家將要開始正式放開殯葬新選擇

云舟史策
2026-03-29 07:21:53
地球上真的缺油嗎?實際上是多得用不完

地球上真的缺油嗎?實際上是多得用不完

比利
2026-03-18 21:40:05
我愛上41歲女人,她開口:玩玩可以但不結(jié)婚,得知真相我癱坐在地

我愛上41歲女人,她開口:玩玩可以但不結(jié)婚,得知真相我癱坐在地

小月故事
2026-03-19 17:08:37
絕殺難掩隱憂:日本1-0蘇格蘭,浮華背后的實力真相與發(fā)展困局!

絕殺難掩隱憂:日本1-0蘇格蘭,浮華背后的實力真相與發(fā)展困局!

落夜足球
2026-03-29 11:15:46
大勝!杰倫格林31+6,創(chuàng)太陽第一紀錄,等狄龍復(fù)出,西部格局改變

大勝!杰倫格林31+6,創(chuàng)太陽第一紀錄,等狄龍復(fù)出,西部格局改變

巴叔GO聊體育
2026-03-29 14:50:24
明星章若楠也買不起房?片酬500萬仍租房,省錢幫助三妹妹一弟弟

明星章若楠也買不起房?片酬500萬仍租房,省錢幫助三妹妹一弟弟

搗蛋窩
2026-03-28 18:20:39
英國首相回擊美國的伊朗戰(zhàn)爭施壓:絕不屈服

英國首相回擊美國的伊朗戰(zhàn)爭施壓:絕不屈服

大象新聞
2026-03-28 19:01:04
太離譜了!鄰居長期空置,老人把鞋柜擺到對方門口,結(jié)果被投訴…

太離譜了!鄰居長期空置,老人把鞋柜擺到對方門口,結(jié)果被投訴…

火山詩話
2026-03-29 09:36:32
海南昌江通報“史某輝申請國家賠償被依法中止辦理”:迅速成立聯(lián)合調(diào)查組

海南昌江通報“史某輝申請國家賠償被依法中止辦理”:迅速成立聯(lián)合調(diào)查組

界面新聞
2026-03-29 07:32:17
26年大主線:光纖光纜,調(diào)整就是上車機會!

26年大主線:光纖光纜,調(diào)整就是上車機會!

粵語音樂噴泉
2026-03-29 13:15:05
細思極恐!張雪峰8個月前悄悄和母校告別,幼兒園到中學(xué)都走一遍

細思極恐!張雪峰8個月前悄悄和母校告別,幼兒園到中學(xué)都走一遍

火山詩話
2026-03-28 06:05:06
當(dāng)著鄭麗文、韓國瑜的面,洪秀柱高喊:一中就是中國,臺灣加大陸

當(dāng)著鄭麗文、韓國瑜的面,洪秀柱高喊:一中就是中國,臺灣加大陸

悄悄史話
2026-03-29 00:14:06
長在懸崖超900年!浙江父子徒手挖了兩天,挖到3.5米長巨型夜交藤

長在懸崖超900年!浙江父子徒手挖了兩天,挖到3.5米長巨型夜交藤

雪靈谷
2026-03-03 18:18:48
人會變嗎?丨顏強專欄

人會變嗎?丨顏強專欄

顏強
2026-03-28 15:09:03
2026-03-29 16:24:49
EEWorld電子工程世界 incentive-icons
EEWorld電子工程世界
即時參與討論電子工程世界最火話題,搶先知曉電子工程業(yè)界資訊。
262文章數(shù) 22關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認xAI"建錯了",11位創(chuàng)始人均離職

頭條要聞

美軍地面戰(zhàn)"數(shù)周速決"方案披露 欲復(fù)刻"42天滅伊"神話

頭條要聞

美軍地面戰(zhàn)"數(shù)周速決"方案披露 欲復(fù)刻"42天滅伊"神話

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻給父親

娛樂要聞

張凌赫事件持續(xù)升級!官方點名怒批

財經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車要聞

嵐圖泰山X8配置曝光 四激光雷達/華為新一代座艙

態(tài)度原創(chuàng)

家居
房產(chǎn)
手機
旅游
公開課

家居要聞

曲線華爾茲 現(xiàn)代簡約

房產(chǎn)要聞

首日430組來訪,單日120組認籌!海口首個真四代,徹底爆了!

手機要聞

華為鴻蒙手機養(yǎng)龍蝦 何剛測試小藝Claw:支持制定運動計劃 好用!

旅游要聞

億縷陽光|豫見河南

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版