国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小語言模型:構建輕量化人工智能生態(tài)的拼圖塊

0
分享至


核心觀點:
  • 小語言模型的巨額融資成為常態(tài),頭部公司的單輪融資額動輒達到數(shù)億美金或歐元量級。例如,MistralAI在短短半年內從種子輪(1.05億歐元)迅速躍升至B輪(3.85億歐元),中國的01.AI在A輪融資后估值即超過10億美元,迅速躋身獨角獸行列。
  • 與大型云端模型不同,小語言模型憑借其低延遲、高隱私、離線運行能力,在與用戶日常生活緊密相關的智能終端領域率先取得突破性進展。
  • 近年來,國家層面通過《關于深入實施“人工智能+”行動的意見》、《國家人工智能產業(yè)綜合標準化體系建設指南(2024版)》等頂層設計,明確了智能終端的規(guī)?;占澳繕?,相關政策指出到2027年,新一代智能終端、智能體等應用普及率要超過70%,直接為小語言模型創(chuàng)造了廣闊的市場需求。
  • 全球小語言模型市場已初步形成"國際科技巨頭生態(tài)壟斷、中國AI獨角獸技術突破、專注型初創(chuàng)快速落地、硬件終端巨頭跨界整合"的多元化競爭格局。
  • 中國作為全球最大的智能終端制造和消費市場,在小語言模型領域具有天然優(yōu)勢。預計中國市場占據(jù)全球市場約25-30%的份額,2024年市場規(guī)模約為96~115億元人民幣,到2031年或達到336~403億元人民幣。


(1)定義及優(yōu)勢

小型語言模型(Small Language Models,SLM)指的是相對于大型語言模型而言,規(guī)模較小、參數(shù)數(shù)量較少的模型,通常情況下,其參數(shù)量在數(shù)百萬到數(shù)幾十億之間。而大型語言模型的參數(shù)量則高達千億甚至萬億個,例如OpenAI的chatGPT3.0模型(1750億)。

小語言模型通常在處理特定任務或領域時,能夠以較低的計算成本實現(xiàn)相對不錯的性能。此外,小語言模型在資源有限、需要快速部署或對實時性要求較高的應用場景中亦非常實用。

(2)主要特點及對比

鑒于參數(shù)量相對較少,小語言模型在訓練和部署方面,具有成本低、快速響應、特定領域優(yōu)化、易于集成、可解釋性等優(yōu)勢。

圖表1小語言模型特點


信息來源:融中咨詢

總體來說,大模型與小模型在參數(shù)數(shù)量、訓練數(shù)據(jù)量、計算資源需求及應用場景方面有區(qū)別。大模型(參數(shù)十億級以上)依賴海量數(shù)據(jù)和高算力,適用于高精度復雜任務(如NLP);而小模型參數(shù)少,對數(shù)據(jù)和算力的需求低,成本更低。

圖表2大語言模型與小語言模型的對比


信息來源:融中咨詢

以Phi-3全系列、Gemma-7b、Mistral-7b等小語言模型的性能數(shù)據(jù)與Mixtral-8x7b、GPT-3.5-Turbo、Claude-3-Sonnet等大模型進行對比,語言理解、推理、數(shù)學、代碼生成等方面,并沒有出現(xiàn)明顯的差異。具體如下圖所示。

圖表3Phi-3-Mini的性能對比


信息來源:融中咨詢

(3)近期模型

2024-2025年新發(fā)布的小語言模型匯總了來自全球頂尖科技公司(如Google、Microsoft、Meta、Apple、NVIDIA、阿里巴巴、騰訊等)和學術機構(如北大),其競爭焦點已從單純追求“參數(shù)規(guī)?!鞭D向追求“性能與效率的極致平衡”。開發(fā)者們正致力于打造在特定場景下(如邊緣計算、手機端、安全領域)能力卓越,且能耗更低、速度更快的“小而強”模型。

圖表42024-2025年新發(fā)布的小語言模型統(tǒng)計


信息來源:融中咨詢


小語言模型(SLM)行業(yè)自2023年起進入了快速發(fā)展期,呈現(xiàn)出從通用模型向專業(yè)化、多樣化方向演進的特點。

早期發(fā)展(2023年之前):行業(yè)起步階段以開源和通用型模型為主,例如Megatron-GPT2、GPT-Neo等。這些模型為后續(xù)發(fā)展奠定了技術基礎。

爆發(fā)增長(2023年及之后):這一年模型發(fā)布數(shù)量顯著增加,并出現(xiàn)了關鍵趨勢。微軟發(fā)布的Phi系列(從Phi-1.5到Phi-2)展示了通過高質量數(shù)據(jù)訓練小模型的巨大潛力。同時,領域專用模型開始涌現(xiàn),如AstroLLaMA(天文學),標志著SLMs開始向垂直領域深入。開發(fā)團隊也愈發(fā)多元,涵蓋了學術界、工業(yè)界和開源社區(qū)。

深化與專業(yè)化(2024年及以后):行業(yè)發(fā)展進一步聚焦于垂直領域和性能優(yōu)化。微軟持續(xù)迭代其Phi系列(Phi-3,Phi-3.5),其他機構也推出了如ChemLLM(化學)和Hippocrates(醫(yī)療)等大量專業(yè)模型。同時,技術路徑更加多樣,出現(xiàn)了如Rho-1等專注于代碼訓練的模型。這一趨勢預計將持續(xù)到2025年及未來,SLMs正朝著更精細的領域定制、更高的效率以及更廣泛的開發(fā)者參與方向演進。

圖表5小語言模型的發(fā)展歷史


信息來源:融中咨詢


(1)產業(yè)鏈結構:端、邊、芯協(xié)同生態(tài)

小語言模型產業(yè)鏈涵蓋硬件基礎設施、算法模型研發(fā)及行業(yè)終端應用的多層次生態(tài)體系。其最顯著的特點是與"端、邊、芯"(終端設備、邊緣計算、芯片)的高度協(xié)同。與傳統(tǒng)云端大模型依賴數(shù)據(jù)中心算力不同,SLM的價值實現(xiàn)必須深度嵌入終端設備的硬件能力和應用場景。

圖表6小語言模型產業(yè)鏈結構圖


信息來源:融中咨詢

  • 上游:數(shù)據(jù)與硬件支持

小語言模型產業(yè)的蓬勃發(fā)展,離不開其上游堅實的基礎支撐層,該層級為模型的研發(fā)、訓練與部署提供了不可或缺的核心資源。

1)在硬件與算力層面,訓練環(huán)節(jié)主要由NVIDIA的GPU(如H100/H200)主導,AMD、Intel等廠商也在積極競爭。而在推理環(huán)節(jié),尤其是邊緣計算芯片,如高通手機芯片、蘋果的M系列NPU以及Intel的CoreUltraNPU,成為了小模型生態(tài)落地的關鍵戰(zhàn)場,它們?yōu)槟P驮诮K端設備上的高效運行提供了硬件基礎,同時眾多初創(chuàng)公司也致力于開發(fā)專用的低功耗AI加速器。

2)AWS、Azure、GoogleCloud等全球云計算平臺則提供了強大的訓練算力與便捷的模型托管服務,顯著降低了研發(fā)門檻。其次,高質量的數(shù)據(jù)與服務是模型智能的源泉,專業(yè)的數(shù)據(jù)供應商提供預訓練數(shù)據(jù)集與合成數(shù)據(jù),而數(shù)據(jù)清洗與標注公司則為小模型在特定領域的專業(yè)化提供了關鍵的精標數(shù)據(jù)支持。

3)成熟的框架與工具構成了技術棧的基石。以PyTorch、TensorFlow、JAX為核心的開源框架,與HuggingFace的Transformers、Tokenizers等生態(tài)工具共同構成了模型開發(fā)的標準流程,而ONNX等開放格式則極大地推動了模型的跨平臺部署與應用。

  • 中游:技術研發(fā)與模型開發(fā)

中游是模型與生態(tài)層,作為產業(yè)鏈的核心,這里匯聚了多元的參與者,共同推動小語言模型的研發(fā)、優(yōu)化與分發(fā)。

1)在模型開發(fā)者層面,科技巨頭如Microsoft、Google、Meta和Apple憑借其前沿的Phi、Gemma、Llama及OpenELM等系列模型引領技術方向,并普遍采用開源策略以構建開發(fā)者生態(tài),同時為其云業(yè)務引流。

2)01.AI、Moondream等頂尖AI實驗室與初創(chuàng)公司則展現(xiàn)出更高的靈活性與專注度,在特定領域或技術點上實現(xiàn)關鍵突破;而充滿活力的開源社區(qū)基于巨頭發(fā)布的基座模型,進行精細微調、壓縮與優(yōu)化。

  • 下游:應用場景的落地

在行業(yè)應用解決方案上,小模型憑借其能夠本地化部署的優(yōu)勢,在各個領域發(fā)揮優(yōu)勢。

1)在金融領域,SLM實現(xiàn)智能客服、財報分析和風險審核,嚴格保障數(shù)據(jù)安全;

2)在醫(yī)療領域,SLM輔助臨床決策、結構化病歷,有力保護患者隱私;

3)在教育領域,SLM充當個性化學習助手;

4)在法律領域完成高效的合同審查與案例查詢;

5)在手機與PC上,以端側智能助手的形式實現(xiàn)照片增強、文案創(chuàng)作和實時翻譯;

6)在汽車座艙內,作為車載語音助手提供快速響應、離線可用的交互體驗;

7)在IoT設備中,則成為機器人、智能家居的中控大腦,實現(xiàn)低延遲、低功耗的智能控制。

(2)市場規(guī)模:從爆發(fā)期邁向成熟期

全球小語言模型市場正處于快速增長通道。2024年市場規(guī)模為53.8億美元,到2031年將增長至188億美元,年復合增長率(CAGR)為20.9%。這一增速顯著高于傳統(tǒng)企業(yè)軟件市場,反映了端側AI作為新興技術的強勁需求。

中國市場占據(jù)全球小語言市場25-30%的份額。中國作為全球最大的智能終端制造和消費市場,在小語言模型領域具有天然優(yōu)勢。預計中國市場占據(jù)全球市場約25-30%的份額,2024年市場規(guī)模約為96-115億元人民幣,到2031年將達到336-403億元人民幣。

圖表7全球及中國小語言模型行業(yè)規(guī)模情況


數(shù)據(jù)來源:融中咨詢


SLM正逐漸成為推動行業(yè)智能化變革的關鍵力量。在金融領域,它用于自動化處理財報摘要生成與智能投研信息提取,提升風控與運營效率;娛樂行業(yè)利用它創(chuàng)作營銷文案、驅動游戲NPC基礎對話并賦能互動敘事;汽車系統(tǒng)通過集成SLM,打造能理解復雜指令的車載語音助手,提升交互體驗與駕駛安全;教育工具借其提供個性化的學習輔導和交互式語言練習;電商零售則依靠SLM聊天機器人高效處理售前售后咨詢,顯著提升客戶服務體驗與滿意度;在醫(yī)療領域,SLM被用于初步的健康問答分診,并輔助完成病歷結構化等行政工作,幫助優(yōu)化緊張的醫(yī)療資源分配。

圖表8小語言模型下游細分結構


數(shù)據(jù)來源:融中咨詢

(1)核心應用場景:智能終端引領落地潮

小語言模型的應用落地正處在從"探索孵化期"向"規(guī)模應用期"過渡的關鍵階段。與大型云端模型不同,SLM憑借其低延遲、高隱私、離線運行能力,在與用戶日常生活緊密相關的智能終端領域率先取得突破性進展。其應用的核心邏輯在于將智能計算從云端前置到設備本地,為用戶提供更即時、更個性化、更安全的AI體驗,推動AI應用從"能用"向"好用"邁進。

圖表9主要行業(yè)小語言模型應用成熟度評估(2024-2025年)



數(shù)據(jù)來源:融中咨詢

(2)標桿案例深度剖析

  • 案例一:小米"超級小愛同學"——生態(tài)融合的端側AI大腦

小米公司在其澎湃OS(HyperOS)中集成的"超級小愛同學",是SLM在智能手機終端應用的標桿案例。它不再是一個簡單的語音問答工具,而是深度融合了SLM能力的端側AI大腦。

該助手具備強大的多模態(tài)交互、全局自然語言搜索、屏幕識別和跨設備執(zhí)行能力。例如,用戶可以直接用自然語言命令手機"幫我查找上周拍的帶狗的照片,并發(fā)送給媽媽",系統(tǒng)能理解指令、識別圖像內容、調用聯(lián)系人并執(zhí)行發(fā)送動作。其核心是結合了全生態(tài)感知的個人本地信息庫。SLM在端側直接處理和理解用戶的個人數(shù)據(jù)(如日程、照片、偏好),無需上傳云端,從而具備了高度個性化的記憶能力,極大地保護了用戶隱私。該功能已于2024年11月開始在小米15、小米14等系列機型上推送內測。

  • 案例二:長安馬自達EZ-60——端側模型賦能的智能座艙

面壁智能與長安馬自達的合作,誕生了全球首批搭載純端側大模型并實現(xiàn)量產的車型——MAZDAEZ-60,標志著SLM在智能汽車領域的商業(yè)化落地取得了重大突破。

在智能座艙內,SLM作為長安馬自達的車載AI助手,負責處理導航、娛樂、車輛控制等多種語音指令。用戶可以通過自然語言與車輛交互,例如"幫我找一家附近評分高的川菜館,并導航過去",系統(tǒng)能夠理解意圖、搜索信息、規(guī)劃路線并啟動導航。車載助手即使在隧道、山區(qū)等無網(wǎng)絡環(huán)境下,依然能夠提供毫秒級的快速響應和穩(wěn)定流暢的交互。同時,所有語音交互數(shù)據(jù)和用戶偏好數(shù)據(jù)都在車內本地處理,最大限度地保障了用戶的隱私和數(shù)據(jù)安全。

  • 案例三:GooglePixel的GeminiNano——操作系統(tǒng)級整合

在國際市場,Google的GeminiNano代表了另一種端側AI的落地路徑——通過操作系統(tǒng)級別的深度整合,將SLM能力開放給整個Android生態(tài)。GeminiNano推出了1.8B和3.25B兩個參數(shù)版本,專為移動設備優(yōu)化,支持4位量化部署,可在主流Android手機上流暢運行。其核心能力包括設備端文本生成、智能回復建議、實時語音轉寫等。

Google的策略是將GeminiNano作為Android操作系統(tǒng)的基礎AI能力,開放給所有應用開發(fā)者調用。這意味著,未來數(shù)十億臺Android設備都將內置端側AI能力,開發(fā)者無需自己訓練模型,即可為用戶提供智能化體驗。這種"平臺化"策略,與小米、面壁智能的"場景化"落地形成了有趣的對比,反映了不同企業(yè)在SLM商業(yè)化路徑上的差異化選擇。

圖表10SLM在主流終端的應用功能對比


信息來源:融中咨詢


(1)市場參與者圖譜:多元化競爭生態(tài)

全球小語言模型市場已初步形成"國際科技巨頭生態(tài)壟斷、中國AI獨角獸技術突破、專注型初創(chuàng)快速落地、硬件終端巨頭跨界整合"的多元化競爭格局。

  • 第一梯隊:國際科技巨頭

以Google、Apple為代表。這些企業(yè)通過操作系統(tǒng)和芯片的生態(tài)控制力,構建了難以撼動的競爭壁壘。Google的GeminiNano深度集成Android系統(tǒng),覆蓋全球數(shù)十億設備;Apple的AppleIntelligence基于自研芯片,強調隱私優(yōu)先和端云協(xié)同,截至2024年Q4,超過10億臺設備將獲得該功能。

谷歌:谷歌的小語言模型(如Gemma)是基于谷歌最強大的大模型(如Gemini)的技術和研究構建的輕量級、開源模型。它們共享相同的技術基礎架構和組件,但在參數(shù)規(guī)模上進行了精簡,旨在讓更多的開發(fā)者和組織能夠輕松獲取和使用先進的AI技術。

Gemma模型的核心特點是輕量級和高度優(yōu)化,確保它們可以在從移動設備到云端系統(tǒng)等各種計算環(huán)境中靈活訪問和運行。谷歌發(fā)布了兩個主要版本的Gemma模型,分別為20億參數(shù)和70億參數(shù)的規(guī)模。每個版本都提供預訓練模型和指令調優(yōu)的變體,以滿足不同開發(fā)者的需求和應用場景。

微軟:微軟在小語言模型領域也有著清晰的戰(zhàn)略和出色的產品,微軟開源了一個名為Phi-3-mini的小型語言模型,它擁有38億參數(shù),并在多種任務上展現(xiàn)出了出色的性能。Phi系列(開源模型)是微軟SLM研究的主力軍,已經迭代了多個版本。Phi-3系列(2024年4月發(fā)布),Phi-3使用了與Llama2類似的更現(xiàn)代架構,并在一個由高度篩選的網(wǎng)頁數(shù)據(jù)和合成數(shù)據(jù)組成的超大數(shù)據(jù)集上進行了訓練,進一步鞏固了“數(shù)據(jù)質量至上”的理念。

英偉達:英偉達的SLM代表作是Nemotron和ChatQA系列,但其影響力更體現(xiàn)在它提供的整個開發(fā)生態(tài)上。與谷歌、微軟等主要從模型研發(fā)角度切入不同,英偉達的SLM戰(zhàn)略是其全棧AI帝國藍圖中的關鍵一環(huán),核心思想是:“我們提供從芯片、軟件到模型的一整套最佳實踐,告訴全世界如何最高效地構建和使用SLM。

Meta:Meta的SLM戰(zhàn)略核心非常清晰,Meta強力推進開源,與OpenAI和Anthropic的閉源策略相反,Meta選擇將其最重要的模型(如Llama系列)開源,允許研究者和開發(fā)者免費商用、研究和修改。這極大地推動了AI技術的民主化。此外,Meta構建模型家族,Meta不滿足于只發(fā)布一個模型,而是構建了從70億到700億參數(shù)的完整模型譜系,覆蓋從手機到數(shù)據(jù)中心的各類場景。同時,Meta注重社區(qū)驅動創(chuàng)新,通過開源,Meta吸引了全球最聰明的頭腦在其模型基礎上進行微調、優(yōu)化和創(chuàng)新,形成了一個強大的飛輪效應。社區(qū)貢獻的無數(shù)微調版本反過來又增強了Llama生態(tài)的活力。

Apple:OpenELM是蘋果在2024年4月發(fā)布的一個模型家族,它清晰地展示了蘋果在SLM領域的技術路線。OpenELM是一個基礎語言模型,而非對話模型。它的目的是作為一個強大的起點,供社區(qū)和研究者進行微調和進一步開發(fā),同時也向業(yè)界展示了蘋果在模型架構上的創(chuàng)新能力。

  • 第二梯隊:中國AI獨角獸

以智譜AI、MiniMax為代表。這些企業(yè)在通用大模型領域已建立深厚的技術和資本壁壘,現(xiàn)階段正利用其優(yōu)勢向下布局端側市場。智譜AI推出GLM-Edge系列,與高通深度適配;MiniMax探索MoE等高效架構以降低推理成本。

此外,阿里巴巴的SLM戰(zhàn)略是其宏大AI藍圖中的關鍵一環(huán),旨在滿足不同場景下的算力和效率需求。Qwen2.5系列是阿里巴巴最新一代的小語言模型,這是目前阿里最新、最強大的模型家族,其中包含了多個卓越的小模型,包括Qwen2.5-1.5B/3B/7B、Qwen2.5-72B-IN-9B等。

  • 第三梯隊:專注型初創(chuàng)企業(yè)

以面壁智能為代表。此類企業(yè)自創(chuàng)立之初就聚焦于端側AI和輕量化模型賽道,技術迭代迅速,商業(yè)化落地目標明確。其核心優(yōu)勢在于技術專注度和靈活性,能夠快速響應市場需求。

  • 第四梯隊:硬件及終端巨頭

以小米、地平線為代表。小米通過自研"超級小愛同學",將SLM能力深度集成到手機和IoT產品生態(tài)中;地平線則作為上游芯片領導者,通過提供高性能車規(guī)級AI芯片,賦能下游智能汽車應用。

此外,vivo的“藍心大模型”是一個覆蓋不同規(guī)模的模型家族,其中端側模型是其重中之重,也是一個典型的代表。其中藍心大模型7B(70億參數(shù))及以下,這是vivo端側能力的核心,主要包括藍心大模型7B,這是能夠在旗艦機型上流暢運行的、能力最全面的端側模型。它負責處理手機端大部分復雜的AI任務。

(2)核心競爭力分析:技術、生態(tài)、場景三維博弈

不同類型的參與者圍繞技術、生態(tài)和場景三個維度構建自身的核心競爭力,形成了差異化的競爭格局。

圖表11全球小語言模型競爭格局分布


信息來源:融中咨詢

(3)國內代表企業(yè)分析

  • 面壁智能——專注端側,快速迭代

面壁智能是當前中國SLM賽道中最具代表性的領跑者。公司成立于2022年8月,核心戰(zhàn)略是專注于端側AI和小語言模型的研發(fā)。其推出的MiniCPM系列輕量化模型,在輕量化與高性能方面表現(xiàn)突出。其最新模型可在端側設備上實現(xiàn)GPT-3.5級別的性能,而參數(shù)量大幅減少。公司堅持開源戰(zhàn)略,模型在HuggingFace等平臺廣受認可,截至2025年5月,全平臺下載量累計已突破1000萬。它通過創(chuàng)新的模型壓縮、量化和蒸餾技術,在保持性能的前提下,將模型規(guī)模壓縮到可以在手機、車機等終端設備上流暢運行的程度。

面壁智能的商業(yè)化路徑清晰且迅速。2025年4月,其端側模型成功搭載于長安馬自達MAZDAEZ-60量產車型上,完成了車規(guī)級場景的重大突破。這是全球首批搭載純端側大模型并實現(xiàn)量產的車型,具有里程碑意義。車規(guī)級應用的難度遠高于消費電子。它要求模型不僅性能優(yōu)異,還要滿足極端溫度、振動、電磁干擾等嚴苛環(huán)境下的穩(wěn)定運行,以及汽車行業(yè)對安全性的極高標準。面壁智能的成功,證明了其技術的成熟度和工程化能力。

憑借清晰的技術路線和商業(yè)化進展,面壁智能獲得了資本市場的高度認可。在2024年12月至2025年5月的半年內,連續(xù)完成兩輪由龍芯創(chuàng)投、北京市人工智能產業(yè)投資基金、洪泰基金等參與的數(shù)億元融資。這種密集融資節(jié)奏反映了投資方對其長期價值的看好,也為公司后續(xù)的技術研發(fā)和市場拓展提供了充足的資金支持。

  • 地平線——車規(guī)芯片,生態(tài)賦能

地平線是SLM產業(yè)鏈上游的核心企業(yè),是邊緣人工智能芯片的全球領導者,也是國內唯一實現(xiàn)車規(guī)級AI芯片大規(guī)模量產前裝的企業(yè)。地平線是國內首家、也是目前規(guī)模最大實現(xiàn)車規(guī)級AI芯片前裝量產的企業(yè)。征程系列芯片出貨量已達數(shù)百萬片,與超過30家國內外主流車企建立了合作關系。截至2024年底,其芯片已搭載于超過200萬輛汽車上,覆蓋比亞迪、長城、上汽、理想等主流車企。

圖表12地平線征程系列芯片算力對比


信息來源:融中咨詢

公司基于自研的BPU(BrainProcessingUnit)人工智能專用計算架構,打造了征程(Journey)系列芯片。其征程5單芯片算力可達96TOPS,最新的征程6系列性能更強,能夠滿足L2至L4級自動駕駛的算力需求。BPU架構的核心優(yōu)勢在于,針對AI推理任務進行專門優(yōu)化,相比通用GPU,在能效比和成本上具有顯著優(yōu)勢。這使得地平線的芯片能夠在車載這種對功耗、散熱、成本都有嚴格限制的場景下,提供強大的AI算力。

公司與上汽、小米等頭部企業(yè)及超過20家機器人廠商建立了深度合作關系。通過提供強大的、開放的芯片平臺,地平線為下游廣大的SLM模型和應用廠商提供了堅實的硬件基礎。這種開放生態(tài)策略的價值在于,通過成為產業(yè)鏈的"基礎設施提供者",地平線不僅能夠獲得芯片銷售收入,更重要的是在整個產業(yè)生態(tài)中占據(jù)了不可或缺的核心地位,建立了長期的競爭壁壘。

地平線的商業(yè)模式正在從單純的芯片銷售,向"芯片+算法+工具鏈"的整體解決方案演進。公司不僅提供硬件,還提供配套的算法開發(fā)工具、模型優(yōu)化服務,幫助客戶快速將AI能力落地到產品中。這種轉型使得地平線能夠獲取更高的產品附加值,同時也加深了與客戶的綁定關系。

  • 阿里巴巴——算力支持,性能領先

阿里巴巴集團控股有限公司是中國領先的互聯(lián)網(wǎng)科技企業(yè),創(chuàng)立于1999年,是開源模型領域的積極推動者之一。其通義千問團隊既研發(fā)千億級別的超大模型以處理核心難題,也大力推廣其1.8B、7B等“輕量化”模型,以滿足端側部署和低成本快速響應的需求,形成了完整的技術覆蓋。其Qwen1.5系列提供了從0.5B到72B的完整模型矩陣,其中1.8B、4B、7B等輕量化模型在同等規(guī)模中性能表現(xiàn)相對領先。

通義千問團隊背靠阿里云遍布全球的數(shù)據(jù)中心和強大的算力設施(如倚天710等自研芯片),在模型訓練和推理上具備顯著優(yōu)勢。在落地場景方面,阿里巴巴龐大的電商、支付、物流、文娛等業(yè)務生態(tài),為通義千問模型提供了海量的真實世界測試數(shù)據(jù)和落地場景,這是絕大多數(shù)團隊不具備的獨特優(yōu)勢。

  • 深度求索——技術驅動,垂直領域突出

深度求索(DeepSeek)成立于2023年,總部位于杭州,由幻方量化孵化,專注于人工智能底層模型與技術的研發(fā)。DeepSeek-V2及其Lite版本是其重要的模型產品。他們的DeepSeek-Coder系列在代碼模型領域表現(xiàn)優(yōu)異。

深度求索專注于“高效性能”的核心技術路線。DeepSeek-V2采用了創(chuàng)新的MoE(混合專家)架構,總參數(shù)量為236B,但通過路由機制每次推理僅激活約21B參數(shù),實現(xiàn)了以較低的計算成本獲得接近大模型的性能。深度求索公司通過技術驅動,在代碼和數(shù)學等垂直領域能力突出,堅持開源策略,具有較高的成本效益比。

  • 全志科技——“算力底座”,芯片賦能

全志科技的芯片產品作為底層算力平臺,對小語言模型在端側設備的普及和高效運行提供了關鍵支持。全志科技成立于2007年,2015年在創(chuàng)業(yè)板上市,主營業(yè)務涵蓋智能應用處理器SoC、高性能模擬器件及無線互聯(lián)芯片的研發(fā)與銷售。全志科技2025年上半年營業(yè)收入為13.37億元,同比增長25.82%;歸屬于上市公司股東的凈利潤1.61億元,同比增長35.36%。

近年來,全志科技發(fā)布的多款新一代SoC(如MR系列、R系列和H系列的部分型號)都原生集成了專用NPU。這意味著芯片在設計階段就為AI計算進行了優(yōu)化,能夠高效地執(zhí)行小語言模型的推理任務。此外,全志科技正致力于深化“算力底座”的角色,通過推出算力更強的AIoT芯片,并與模型廠商深度合作,為客戶提供“推薦芯片型號+適配的輕量級模型+優(yōu)化部署工具”的一站式解決方案,極大降低終端產品實現(xiàn)AI智能化門檻。


(1)政策環(huán)境:從"通用鼓勵"到"精準扶持”

2024至2025年,中國AI產業(yè)的政策環(huán)境呈現(xiàn)出清晰的結構性傾斜——從對通用大模型的全面鼓勵,轉向對應用落地和算力高效性的精準扶持,為小語言模型(SLM)和端側AI的發(fā)展打開了關鍵的政策窗口期。

國家層面通過《關于深入實施“人工智能+”行動的意見》、《國家人工智能產業(yè)綜合標準化體系建設指南(2024版)》、《“十四五”數(shù)字經濟發(fā)展規(guī)劃》等頂層設計,明確了智能終端的規(guī)模化普及目標,直接為SLM創(chuàng)造了廣闊的市場需求。其政策信號明確,政策指出到2027年,新一代智能終端、智能體等應用普及率要超過70%,這意味著未來三年內,數(shù)以億計的智能設備將需要配置高效的端側AI能力。

同時,地方政府政策迅速跟進。北京作為AI產業(yè)的政策高地,出臺《北京市推動"人工智能+"行動計劃(2024-2025年)》,為面壁智能等本地端側AI企業(yè)提供了從研發(fā)補貼到場景開放的全方位支持。深圳也發(fā)布了《深圳市加快推動人工智能高質量發(fā)展高水平應用行動方案(2023—2024年)》。

圖表13中國小語言模型(SLM)扶持政策


信息來源:融中咨詢

(2)融資動態(tài):資本聚焦"輕量化"新賽道

近年來對小語言模型的投資呈現(xiàn)出巨額資本集中于頭部項目、于近年全球性爆發(fā)、并由戰(zhàn)略性和生態(tài)性投資驅動的鮮明趨勢。

小語言模型的巨額融資成為常態(tài),彰顯資本對其的強烈信心。如下圖所示,頭部公司的單輪融資額動輒達到數(shù)億美金或歐元量級。例如,MistralAI在短短半年內從種子輪(1.05億歐元)迅速躍升至B輪(3.85億歐元),彰顯了資本對其的強烈信心。中國的01.AI在A輪融資后估值即超過10億美元,迅速躋身獨角獸行列。這表明市場愿意為平臺的潛在價值支付高額溢價。

小語言模型融資近年來全球爆發(fā)。2023年是小語言模型融資的爆發(fā)年,下圖中大部分核心融資事件(MistralAI兩輪融資、Cohere的C輪、HuggingFace的D輪等)都密集發(fā)生在2023年。這表明在ChatGPT帶來生成式AI熱潮后,市場意識到小語言模型是具有商業(yè)化潛力的方向,資本在當年集中涌入。融資事件覆蓋了美國(AdeptAI)、歐洲(MistralAI)和中國(01.AI,智譜AI),形成了北美、歐洲、亞洲三足鼎立的競爭格局。

融資階段從早期到成長期并重,戰(zhàn)略投資占據(jù)主導地位。小語言模型的融資市場不僅限于早期投資(種子/A輪),B輪、C輪乃至D輪的成熟期項目同樣活躍。這說明一批領先的初創(chuàng)公司已經跑通了技術或初步商業(yè)模式,獲得了持續(xù)的大額資金支持以加速擴張。此外,小語言模型的投資方名單中出現(xiàn)了阿里云、小米等產業(yè)資本,以及a16z、Lightspeed等頂級風投。產業(yè)資本的深度參與,意味著小語言模型的發(fā)展與各大科技公司的云服務、硬件生態(tài)等核心戰(zhàn)略緊密綁定。

圖表14全球重點小語言模型融資情況


信息來源:融中咨詢


安全與濫用風險:AIBussiness研究指出,由于SLMs的代碼是開源的,數(shù)據(jù)盜竊和隱私問題等安全風險會更加嚴重。浙江大學區(qū)塊鏈與數(shù)據(jù)安全全國重點實驗室發(fā)現(xiàn),近50%的SLMs在遭受越獄攻擊時顯示出高脆弱性,開發(fā)人員需從開發(fā)早期階段優(yōu)先考慮安全設計原則。

模型泛化能力風險:SLMs雖然在特定任務中表現(xiàn)優(yōu)秀,但在應對更廣泛、多變的場景時,如復雜推理、跨領域知識整合上,往往難以維持高效表現(xiàn)。相較于LLMs,SLMs可能更容易受到數(shù)據(jù)偏見的影響,缺乏足夠的適應能力。盡管SLMs在特定場景表現(xiàn)良好,但在復雜推理、代碼生成等任務上仍難以匹敵大規(guī)模LLMs。

數(shù)據(jù)質量風險:如果訓練數(shù)據(jù)中存在偏差或不平衡,小模型可能會在特定場景下表現(xiàn)出較低的泛化能力,甚至產生不準確的預測或生成內容。因此,要確保訓練數(shù)據(jù)的質量。一方面,在數(shù)據(jù)清洗時要進行去噪處理,通過去除重復項、糾正標注錯誤等方式來提高數(shù)據(jù)質量。另一方面,要結合外部的知識庫,彌補數(shù)據(jù)中存在的不足,增強模型的泛化能力。

小模型局限性風險:小語言模型通常設計為專門處理特定領域或任務,因此其知識庫相對有限,難以應對跨領域的復雜問題。為了解決小模型使用局限性的問題,一是模塊化設計,將小模型設計為可擴展的模塊系統(tǒng),可以通過引入專門的插件或外部知識庫,擴充其對不同主題的處理能力。二是多模型集成,通過將多個小模型進行集成,形成一個組合型的系統(tǒng),充分發(fā)揮每個模型在特定領域的優(yōu)勢。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
1962年李敏生子求賜名,毛主席盯著窗外看了許久,毛主席:給娃取名,別用我的字

1962年李敏生子求賜名,毛主席盯著窗外看了許久,毛主席:給娃取名,別用我的字

寄史言志
2025-12-18 18:37:14
日哈14項協(xié)議簽訂,高市早苗萬萬沒想到,托卡耶夫竟然還留了一手

日哈14項協(xié)議簽訂,高市早苗萬萬沒想到,托卡耶夫竟然還留了一手

凡知
2025-12-20 05:04:30
繼父、同母異父弟弟?墜亡女教師身世曝光,這才是她走絕路的真相

繼父、同母異父弟弟?墜亡女教師身世曝光,這才是她走絕路的真相

知法而形
2025-12-19 23:33:57
天皇親自出山,日本對中國的反擊正式開始,高市早苗憋出了一毒計

天皇親自出山,日本對中國的反擊正式開始,高市早苗憋出了一毒計

時時有聊
2025-12-19 11:52:34
特殊島:希望加入中國大陸或與臺灣省合并,但絕對不會承諾日本!

特殊島:希望加入中國大陸或與臺灣省合并,但絕對不會承諾日本!

聊歷史的阿稼
2025-12-18 16:01:02
全國碩士研究生招生考試今日開考,這些新變化值得關注

全國碩士研究生招生考試今日開考,這些新變化值得關注

澎湃新聞
2025-12-20 07:40:26
苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

科普100克克
2025-12-07 18:20:34
黎智英判決剛落“國籍”又成問題?反華勢力施壓,英美果斷出手

黎智英判決剛落“國籍”又成問題?反華勢力施壓,英美果斷出手

策前論
2025-12-19 12:14:30
臺北車站攻擊事件已致3死6傷:一人疑因阻止行兇被刺身亡 27歲行兇者墜樓身亡

臺北車站攻擊事件已致3死6傷:一人疑因阻止行兇被刺身亡 27歲行兇者墜樓身亡

紅星新聞
2025-12-19 22:53:16
利潤289億的龍頭企業(yè),公募基金扎堆持股,市盈率卻僅有13倍

利潤289億的龍頭企業(yè),公募基金扎堆持股,市盈率卻僅有13倍

投資觀
2025-12-20 08:20:03
新加坡估計怎么也想不通一覺醒來,家門口的海南釜底抽薪

新加坡估計怎么也想不通一覺醒來,家門口的海南釜底抽薪

忠于法紀
2025-12-12 09:14:49
牡丹花下死,“縱欲過度”的張雨綺,終究為自己的行為付出了代價

牡丹花下死,“縱欲過度”的張雨綺,終究為自己的行為付出了代價

娛樂看阿敞
2025-12-17 14:11:15
普京:俄方愿在烏克蘭選舉期間暫時停止打擊

普京:俄方愿在烏克蘭選舉期間暫時停止打擊

新京報
2025-12-19 21:48:02
工信部:生產老百姓滿意的電動車,后座、儲物、后視鏡或將成標配

工信部:生產老百姓滿意的電動車,后座、儲物、后視鏡或將成標配

電動車的那些事兒
2025-12-20 08:05:35
炮轟西哈莫尼有私心,洪森為兒子掃平天下,但卻高估了洪瑪奈能力

炮轟西哈莫尼有私心,洪森為兒子掃平天下,但卻高估了洪瑪奈能力

潮鹿逐夢
2025-12-20 12:22:40
因愛潑斯坦檔案,F(xiàn)BI二把手上任9個月宣布辭職!特朗普:他想回去做節(jié)目了

因愛潑斯坦檔案,F(xiàn)BI二把手上任9個月宣布辭職!特朗普:他想回去做節(jié)目了

紅星新聞
2025-12-18 19:13:18
《潛伏》:時隔40年,余則成重回大陸,在公園重逢抱著孫子的翠平

《潛伏》:時隔40年,余則成重回大陸,在公園重逢抱著孫子的翠平

星宇共鳴
2025-12-20 09:29:39
就算是緊急求饒也沒用!中國已經拿捏日本命門,多家日企被迫停工

就算是緊急求饒也沒用!中國已經拿捏日本命門,多家日企被迫停工

科普100克克
2025-12-19 17:22:57
官宣!中國男籃核心遭重傷!打日本隊需大換血,郭士強或帶2小將

官宣!中國男籃核心遭重傷!打日本隊需大換血,郭士強或帶2小將

老吳說體育
2025-12-19 22:50:11
局勢逆轉,柬埔寨大軍開始反撲,俘虜大批泰軍,泰方公布傷亡人數(shù)

局勢逆轉,柬埔寨大軍開始反撲,俘虜大批泰軍,泰方公布傷亡人數(shù)

現(xiàn)代小青青慕慕
2025-12-20 08:27:49
2025-12-20 14:00:49
融資中國 incentive-icons
融資中國
股權投資與產業(yè)投資媒體平臺
7114文章數(shù) 21300關注度
往期回顧 全部

科技要聞

許四清:具身智能的"ChatGPT時刻"還未到來

頭條要聞

牛彈琴:歐洲最后還是慫了 最打臉的就是馮德萊恩

頭條要聞

牛彈琴:歐洲最后還是慫了 最打臉的就是馮德萊恩

體育要聞

我開了20年大巴,現(xiàn)在是一名西甲主帥

娛樂要聞

戚薇女兒大變樣,10歲就進入“尷尬期”

財經要聞

日本加息落地:暴跌沒有,麻煩在后頭

汽車要聞

嵐圖推進L3量產測試 已完成11萬公里實際道路驗證

態(tài)度原創(chuàng)

本地
手機
旅游
藝術
公開課

本地新聞

云游安徽|訪黃山云海古村,讀一城山水風骨

手機要聞

800元新年禮遇優(yōu)惠:華為Pura X,這份雙旦好禮藏著滿分品味

旅游要聞

明十三陵景陵將于12月22日對公眾預約開放

藝術要聞

馬巖松新作!桂林“超級星”正式揭幕!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版