国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

【金猿CIO展】聯(lián)想集團(tuán)CIO Art Hu:小模型為邊緣計(jì)算應(yīng)用而生

0
分享至



Art Hu

“【提示】2025第八屆年度金猿頒獎(jiǎng)典禮將在上海舉行,此次榜單/獎(jiǎng)項(xiàng)的評(píng)選依然會(huì)進(jìn)行初審、公審、終審三輪嚴(yán)格評(píng)定,并會(huì)在國(guó)內(nèi)外渠道大規(guī)模發(fā)布傳播歡迎申報(bào)。

隨著AI應(yīng)用的浪潮從模型訓(xùn)練逐漸過渡到部署和實(shí)施,企業(yè)面臨著諸多問題:如何優(yōu)化戰(zhàn)略投資以實(shí)現(xiàn)最大回報(bào)?其中一個(gè)核心問題是——那些在訓(xùn)練過程中消耗了大量資源的模型,究竟該選擇大型語(yǔ)言模型(LLM)還是小型語(yǔ)言模型(SLM)?答案在于理解兩者之間的權(quán)衡,并明確它們?cè)谒膫€(gè)關(guān)鍵方面的影響:硬件能力、安全性、延遲以及邊緣計(jì)算。雖然行業(yè)內(nèi)對(duì)此存在爭(zhēng)論,但所謂的“LLM與SLM之爭(zhēng)”其實(shí)并不是真正的爭(zhēng)論。企業(yè)只需根據(jù)應(yīng)用場(chǎng)景進(jìn)行選擇,答案自然清晰。

硬件成本與復(fù)雜性

將模型規(guī)模與硬件能力匹配至關(guān)重要,因?yàn)長(zhǎng)LM對(duì)計(jì)算能力的需求遠(yuǎn)高于普通應(yīng)用,包括高帶寬內(nèi)存(HBM)和多塊GPU。大多數(shù)LLM依賴集中式云基礎(chǔ)設(shè)施,因?yàn)樵诒镜剡\(yùn)行它們成本高昂,幾乎不可能在受限設(shè)備上實(shí)現(xiàn)。

相比之下,SLM的參數(shù)更少(通常低于40億),因此所需內(nèi)存顯著減少,并且不需要HBM。這使得它們能夠在更廣泛的硬件上高效運(yùn)行,并顯著降低基礎(chǔ)設(shè)施成本和復(fù)雜性。在計(jì)算能力有限的環(huán)境中,如物聯(lián)網(wǎng)設(shè)備、移動(dòng)平臺(tái)或AI PC,SLM往往是唯一可行的解決方案。

安全性與數(shù)據(jù)主權(quán)

SLM在數(shù)據(jù)隱私和安全方面也具有顯著優(yōu)勢(shì)。數(shù)據(jù)泄露或泄密無論何時(shí)都代價(jià)高昂,但對(duì)于金融、醫(yī)療或交通等高度監(jiān)管行業(yè)的企業(yè)來說,風(fēng)險(xiǎn)更大。這些企業(yè)無法將敏感數(shù)據(jù)跨網(wǎng)絡(luò)長(zhǎng)距離傳輸至云端API。雖然隔離或自托管的LLM可以緩解數(shù)據(jù)傳輸問題,但它們效率極低,因?yàn)樾枰笠?guī)模資源和復(fù)雜架構(gòu)。

SLM可以完全在本地部署,甚至直接嵌入硬件,使企業(yè)能夠保持嚴(yán)格的數(shù)據(jù)治理和合規(guī)性。當(dāng)數(shù)據(jù)絕對(duì)不能離開數(shù)據(jù)中心或設(shè)備時(shí),SLM不僅是一個(gè)選擇,而是必需品。

延時(shí)與實(shí)時(shí)決策

選擇語(yǔ)言模型時(shí),延遲敏感性是另一個(gè)關(guān)鍵因素。隨著行業(yè)從訓(xùn)練轉(zhuǎn)向推理,這些模型被部署在分布式、去中心化的環(huán)境中。許多應(yīng)用需要實(shí)時(shí)數(shù)據(jù)來支持決策,延遲往往無法容忍。對(duì)于響應(yīng)至關(guān)重要的場(chǎng)景,如語(yǔ)音助手、客服機(jī)器人或邊緣設(shè)備,延遲可能帶來嚴(yán)重影響。如果延遲升級(jí)為停機(jī),財(cái)務(wù)后果可能是災(zāi)難性的。

與駐留在數(shù)據(jù)中心或云端、引入2至10秒數(shù)據(jù)傳輸和處理時(shí)間的LLM不同,SLM專為速度而設(shè)計(jì)。它們可以實(shí)現(xiàn)亞秒級(jí)響應(yīng),非常適合需要即時(shí)反饋的應(yīng)用。

底層模型對(duì)用戶來說可能是“隱形”的,但其響應(yīng)速度和準(zhǔn)確性卻至關(guān)重要。對(duì)于優(yōu)先考慮無縫、快速用戶體驗(yàn)的企業(yè),SLM是最佳選擇。

邊緣應(yīng)用

前面三個(gè)因素最終指向一個(gè)簡(jiǎn)單事實(shí)——SLM是為邊緣計(jì)算應(yīng)用而生的。無論是驅(qū)動(dòng)遠(yuǎn)程醫(yī)療設(shè)備還是工業(yè)機(jī)器,SLM都可以獨(dú)立于網(wǎng)絡(luò)運(yùn)行。它們能夠在本地進(jìn)行決策,確保隱私,例如醫(yī)院在邊緣部署AI患者監(jiān)測(cè),或在工廠車間進(jìn)行實(shí)時(shí)異常檢測(cè),即使連接不穩(wěn)定也能運(yùn)行。

在各行業(yè)中,下一代邊緣解決方案(如聯(lián)想的TruScale for Edge and AI),旨在將實(shí)時(shí)智能帶到數(shù)據(jù)生成的更近位置,體現(xiàn)了向敏捷、分布式AI轉(zhuǎn)變的趨勢(shì),這種AI優(yōu)先考慮速度和安全,而非規(guī)模。共同點(diǎn)是韌性,因?yàn)檫@些應(yīng)用需要更精簡(jiǎn)的計(jì)算基礎(chǔ)設(shè)施、更高的數(shù)據(jù)安全性和最低延遲才能運(yùn)行。

當(dāng)速度和效率是更重要的考量時(shí),SLM是首選。即使在隔離環(huán)境中,LLM的規(guī)模和基礎(chǔ)設(shè)施要求使其在邊緣部署中不切實(shí)際。對(duì)于邊緣AI,SLM不僅是更優(yōu)選擇——它們是必不可少的。

LLM的應(yīng)用場(chǎng)景

然而,并非所有應(yīng)用都運(yùn)行在邊緣。

雖然大多數(shù)企業(yè)在評(píng)估邊緣應(yīng)用以最大化生成式AI投資,但有些確實(shí)需要LLM的功能,這些功能存在于核心數(shù)據(jù)中心或云端。全面推理、深度上下文理解和跨領(lǐng)域知識(shí)都來自LLM。

這類應(yīng)用更看重全面甚至詳盡的分析,而非快速?zèng)Q策。因此,它們需要巨大的計(jì)算能力來運(yùn)行LLM,以生成所需輸出。在這種情況下,某些延遲是可以接受的。擁有支持云訪問或本地化部署基礎(chǔ)設(shè)施的企業(yè)能夠從中受益。此外,這些應(yīng)用通常不屬于高度監(jiān)管行業(yè),因此數(shù)據(jù)隱私和安全標(biāo)準(zhǔn)相對(duì)寬松

成本與資源考量

評(píng)估LLM與SLM時(shí),最后一個(gè)考量是所需資源。LLM的處理和分析能力遠(yuǎn)強(qiáng)于SLM,但代價(jià)也更高。除了訪問云API的成本外,運(yùn)行這些模型還需要持續(xù)投資于專用基礎(chǔ)設(shè)施。它們的計(jì)算需求和數(shù)據(jù)消耗使其僅適用于預(yù)算充足、需要通用智能或特定領(lǐng)域深度的大型項(xiàng)目。

相反,SLM更具成本效益,所需計(jì)算資源相對(duì)較少,部署輕量化。它們適用于中小企業(yè)、初創(chuàng)公司和企業(yè)邊緣部署。對(duì)于常規(guī)任務(wù)、模板化響應(yīng)或延遲敏感操作,它們?cè)诓辉黾舆\(yùn)營(yíng)負(fù)擔(dān)的情況下提供顯著投資回報(bào)。

結(jié)論:基于需求,而非標(biāo)簽

選擇LLM還是SLM應(yīng)由應(yīng)用場(chǎng)景決定,而非流行詞匯——因?yàn)橛脩舨⒉魂P(guān)心模型是“大”還是“小”,他們關(guān)心的是速度、準(zhǔn)確性、隱私和成本。智能的AI戰(zhàn)略應(yīng)權(quán)衡這些實(shí)際因素,以部署最適合的模型。

隨著企業(yè)不斷擴(kuò)展AI能力,許多企業(yè)會(huì)發(fā)現(xiàn)SLM能夠在邊緣實(shí)現(xiàn)新的可能性,而LLM在復(fù)雜、集中化任務(wù)中仍不可或缺。認(rèn)識(shí)到兩者的應(yīng)用場(chǎng)景并在它們之間找到平衡,是企業(yè)釋放AI全部潛力的關(guān)鍵。

換句話說,成功的AI并非“一刀切”,而是將合適的模型與業(yè)務(wù)需求、基礎(chǔ)設(shè)施和風(fēng)險(xiǎn)狀況匹配。無論企業(yè)需要在數(shù)據(jù)中心實(shí)施LLM,還是在邊緣部署SLM,都必須選擇具備混合AI方法和專業(yè)服務(wù)的合作伙伴,以滿足其在AI旅程中的不同階段。

·申報(bào)人“Art Hu”簡(jiǎn)介:

Art Hu,聯(lián)想集團(tuán)高級(jí)副總裁,首席信息官,方案服務(wù)業(yè)務(wù)集團(tuán)首席技術(shù)和交付官

作為聯(lián)想的全球首席信息官(Global CIO),Art Hu領(lǐng)導(dǎo)著覆蓋整個(gè)企業(yè)的信息技術(shù)組織,負(fù)責(zé)提供信息服務(wù)、管理關(guān)鍵運(yùn)營(yíng)系統(tǒng),并推動(dòng)聯(lián)想的技術(shù)驅(qū)動(dòng)型轉(zhuǎn)型。憑借他將IT視為業(yè)務(wù)戰(zhàn)略合作伙伴的遠(yuǎn)見卓識(shí),他推動(dòng)了聯(lián)想從一家以PC為主導(dǎo)的公司成長(zhǎng)為全球領(lǐng)先的技術(shù)解決方案企業(yè)。

這場(chǎng)轉(zhuǎn)型包括構(gòu)建全球技術(shù)平臺(tái),支持聯(lián)想快速發(fā)展的業(yè)務(wù),包括電子商務(wù)和游戲業(yè)務(wù),以及新的“即服務(wù)”(as a Service)業(yè)務(wù)模式,為客戶提供更多選擇和以結(jié)果為導(dǎo)向的交付方式。

除了擔(dān)任全球CIO的角色外,Art于2023年2月被任命為聯(lián)想方案服務(wù)業(yè)務(wù)集團(tuán)(SSG)的首席技術(shù)與交付官(CTDO)。作為CTDO,Art領(lǐng)導(dǎo)一個(gè)新成立的組織,將全球IT、研發(fā)、服務(wù)支持和交付職能整合在一起,以提升聯(lián)想向全球客戶提供創(chuàng)新解決方案的能力。

2023年,Art被《福布斯》評(píng)為值得關(guān)注的CIO之一,并帶領(lǐng)團(tuán)隊(duì)獲得多個(gè)CIO100獎(jiǎng)項(xiàng),該獎(jiǎng)項(xiàng)表彰通過技術(shù)推動(dòng)創(chuàng)新、轉(zhuǎn)型和業(yè)務(wù)價(jià)值的組織及其IT團(tuán)隊(duì)。2024年,在北京舉辦的企業(yè)智能轉(zhuǎn)型峰會(huì)上的榮獲“杰出CIO獎(jiǎng)”。他的遠(yuǎn)見領(lǐng)導(dǎo)力和卓越戰(zhàn)略能力還為他贏得了面向全球管理人群的媒體C-Suite Insider頒發(fā)的2025年全球“年度CIO”獎(jiǎng),2025福布斯中國(guó)科技創(chuàng)新人物獎(jiǎng),以及2025年HotTopics全球名人堂大獎(jiǎng),及2025年鼎革獎(jiǎng)年度CIO。

本文由聯(lián)想集團(tuán)CIO Art Hu撰寫并投遞參與“數(shù)據(jù)猿第八屆年度金猿策劃活動(dòng)——2025中國(guó)大數(shù)據(jù)產(chǎn)業(yè)年度優(yōu)秀CIO榜單及獎(jiǎng)項(xiàng)”評(píng)選。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
京東2025年終獎(jiǎng)投入同比漲幅超70%

京東2025年終獎(jiǎng)投入同比漲幅超70%

界面新聞
2025-12-25 16:05:39
笑發(fā)財(cái)了!趁年輕多給自己買點(diǎn)衣服吧,不然老了只能穿這些款式了

笑發(fā)財(cái)了!趁年輕多給自己買點(diǎn)衣服吧,不然老了只能穿這些款式了

另子維愛讀史
2025-12-25 16:06:29
慘烈!飛機(jī)墜海 多人遇難! 海水猛灌機(jī)艙殘骸 乘客深海絕望

慘烈!飛機(jī)墜海 多人遇難! 海水猛灌機(jī)艙殘骸 乘客深海絕望

北國(guó)向錫安
2025-12-24 10:28:47
印度人入侵各國(guó)遭驅(qū)趕!250萬(wàn)印裔作惡多端招人煩,中國(guó)受害咋辦

印度人入侵各國(guó)遭驅(qū)趕!250萬(wàn)印裔作惡多端招人煩,中國(guó)受害咋辦

阿傖說事
2025-12-25 11:06:20
腿粗屁股大的金發(fā)辣妹,黑背心配紅瑜伽褲,凸顯飽滿臀線魅力

腿粗屁股大的金發(fā)辣妹,黑背心配紅瑜伽褲,凸顯飽滿臀線魅力

小喬古裝漢服
2025-12-17 15:54:55
太牛了,又是33個(gè)商業(yè)航天龍頭集體漲停,社保提前埋伏23龍頭

太牛了,又是33個(gè)商業(yè)航天龍頭集體漲停,社保提前埋伏23龍頭

風(fēng)風(fēng)順
2025-12-25 13:57:02
這個(gè)說法很火:中日若開戰(zhàn),除俄羅斯外,全世界各國(guó)都會(huì)暗自叫好

這個(gè)說法很火:中日若開戰(zhàn),除俄羅斯外,全世界各國(guó)都會(huì)暗自叫好

百態(tài)人間
2025-12-23 16:38:00
原來她已離世26年!23歲登春晚一夜成名,卻因一個(gè)巴掌付出生命

原來她已離世26年!23歲登春晚一夜成名,卻因一個(gè)巴掌付出生命

法老不說教
2025-12-24 12:22:51
杜蘭特的交易 火箭到底虧沒虧 為何狄龍的適配性比杜蘭特高

杜蘭特的交易 火箭到底虧沒虧 為何狄龍的適配性比杜蘭特高

大話火箭隊(duì)
2025-12-25 19:24:28
臉都打腫了!新華社這回算是直接把那個(gè)遮羞布給掀開了。

臉都打腫了!新華社這回算是直接把那個(gè)遮羞布給掀開了。

忠于法紀(jì)
2025-12-24 21:27:55
漲的有點(diǎn)多!小米17 Ultra今天發(fā)布:共有5個(gè)版本 這售價(jià)如何

漲的有點(diǎn)多!小米17 Ultra今天發(fā)布:共有5個(gè)版本 這售價(jià)如何

快科技
2025-12-25 19:33:04
棉衣批量塌房!月薪3千和月薪3萬(wàn)都穿聚酯纖維,內(nèi)行人揭秘貓膩

棉衣批量塌房!月薪3千和月薪3萬(wàn)都穿聚酯纖維,內(nèi)行人揭秘貓膩

法老不說教
2025-12-24 20:04:54
破局!WS-21發(fā)動(dòng)機(jī)曝光, 中國(guó)殲-35擺脫動(dòng)力枷鎖, 西方壟斷落幕

破局!WS-21發(fā)動(dòng)機(jī)曝光, 中國(guó)殲-35擺脫動(dòng)力枷鎖, 西方壟斷落幕

策前論
2025-12-25 17:05:14
向太太敢說了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

向太太敢說了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

小娛樂悠悠
2025-12-23 14:57:09
2025乒超聯(lián)賽賽程出爐!國(guó)乒已抵達(dá)南京,王楚欽、孫穎莎率隊(duì)沖冠

2025乒超聯(lián)賽賽程出爐!國(guó)乒已抵達(dá)南京,王楚欽、孫穎莎率隊(duì)沖冠

卷史
2025-12-25 17:16:01
斷舍離50件衣服,我發(fā)誓:冬天不再買這8類衣服了,純坑人!

斷舍離50件衣服,我發(fā)誓:冬天不再買這8類衣服了,純坑人!

Home范
2025-12-24 13:46:48
49歲陸毅曬鮑蕾贈(zèng)送的生日禮物,網(wǎng)友提醒陸毅:注意心腦血管疾病

49歲陸毅曬鮑蕾贈(zèng)送的生日禮物,網(wǎng)友提醒陸毅:注意心腦血管疾病

小老頭奇聞
2025-12-25 18:54:35
Goal發(fā)布2026年金球獎(jiǎng)實(shí)力榜:凱恩居首,哈蘭德第2,梅西第9

Goal發(fā)布2026年金球獎(jiǎng)實(shí)力榜:凱恩居首,哈蘭德第2,梅西第9

懂球帝
2025-12-25 17:16:09
愛潑斯坦案涂黑文件被輕松解密

愛潑斯坦案涂黑文件被輕松解密

財(cái)聯(lián)社
2025-12-25 20:56:06
恭喜國(guó)乒3人!入圍2025十大運(yùn)動(dòng)員,王楚欽孫穎莎落選,理由如下

恭喜國(guó)乒3人!入圍2025十大運(yùn)動(dòng)員,王楚欽孫穎莎落選,理由如下

侃球熊弟
2025-12-24 15:05:13
2025-12-25 21:48:49
數(shù)據(jù)猿DataYuan incentive-icons
數(shù)據(jù)猿DataYuan
數(shù)據(jù)智能產(chǎn)業(yè)創(chuàng)新服務(wù)媒體
2505文章數(shù) 599關(guān)注度
往期回顧 全部

科技要聞

小米17Ultra發(fā)布,徠卡2億像素 ,6999元起

頭條要聞

韓國(guó)"最毒"財(cái)閥千金被捕 韓國(guó)人稱"經(jīng)過她身邊就會(huì)死"

頭條要聞

韓國(guó)"最毒"財(cái)閥千金被捕 韓國(guó)人稱"經(jīng)過她身邊就會(huì)死"

體育要聞

單賽季11冠,羽壇“安洗瑩時(shí)代”真的來了

娛樂要聞

朱孝天把阿信好意當(dāng)球踢!

財(cái)經(jīng)要聞

時(shí)隔15月,人民幣升破7,三大推手曝光

汽車要聞

速來!智界在上海西岸準(zhǔn)備了年末潮流盛典

態(tài)度原創(chuàng)

本地
房產(chǎn)
旅游
家居
公開課

本地新聞

這輩子要積多少德,下輩子才能投胎到德國(guó)當(dāng)狗

房產(chǎn)要聞

太猛了!單月新增企業(yè)4.1萬(wàn)家,又一波巨頭涌向海南!

旅游要聞

正式官宣|“冬日秘境”,首發(fā)團(tuán)限時(shí)開啟!

家居要聞

經(jīng)典彌新 品味浪漫居所

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版