国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

大模型創(chuàng)業(yè)公司,為什么越來越多在往“小”做?

0
分享至


題圖來自:AI生成

把一臺主流安卓手機切到飛行模式,然后問屏幕上的AI:“幫我總結(jié)一下昨天的會議,挑三個待辦事項。”

它會答出來。答得不算驚艷,但靠譜。

從2022年11月OpenAI正式發(fā)布ChatGPT以來,幾乎所有人對AI 的認知都建立在一個樸素的邏輯上:你提的問題,會跑去一個遙遠的數(shù)據(jù)中心,由幾萬張GPU 算出答案,再傳回你的屏幕。這個過程貴、慢、依賴網(wǎng)絡(luò),但所有人都默認那就是 AI 應(yīng)該有的樣子。

然而僅僅三年時間,這種印象被一臺斷網(wǎng)的手機輕飄飄地推翻了。

特別是最近半年,和大模型行業(yè)的人聊天時,會發(fā)現(xiàn)一個詞的頻率越來越高——端側(cè)。

云端之上,并沒有“錢”

大模型上半場的邏輯非常清晰:參數(shù)大就是好。

GPT-4 出來之后那一年,國內(nèi)拿到融資的公司,PPT 第一頁幾乎都在堆數(shù)據(jù)——多少 B 參數(shù)、多少萬億 token、多少張 H100。投資人也吃這一套。先把規(guī)模拉滿,故事就成立了。

但資金燒到當下,賬就逐漸算清楚了。

2025年OpenAI的估值雖然推到了五千億美元量級,但預(yù)計稅前虧損也達到了驚人的212億美元。Anthropic的情況看上去好一些:毛利率從2024年的 -94%改善到2025年的40%出頭,但同期 EBITDA(息稅折舊及攤銷前利潤)虧損仍有52億美元。Cohere和Mistral則反復(fù)傳出尋求被收購的消息。

這一行業(yè)里所有靠賣API 調(diào)用為生的公司,最后都站在同一條曲線的不同位置上,營收在漲,虧損也在漲,用戶越多,虧得越多。毛利率好轉(zhuǎn)的速度趕不上算力消耗擴張的速度。

這是反互聯(lián)網(wǎng)常識的。過去二十年,規(guī)模意味著壁壘,規(guī)模也意味著利潤。但大模型這門生意,規(guī)模意味著持續(xù)的算力消耗,因為每一次用戶和AI 的對話,背后都是真實的電費和GPU折舊。

更尷尬的是,這條曲線沒有明顯的下行點。模型再大、能力再強,單次推理的邊際成本依然擺在那里。


云端之外,暗流已動

把視線移到云端之外。

2023 年,在手機發(fā)布會上聽到“NPU”這個詞,多半會覺得有點尷尬。芯片廠商講了好幾年,但市面上幾乎沒有什么模型真的用得上,它像一個反復(fù)被寫進 PPT 又被現(xiàn)實辜負的未來能力。

到了2025年,這種能力開始兌現(xiàn)。

芯片廠商開始主動找模型公司談適配,因為客戶在問。手機用戶也開始問:為什么我的 AI 助手離線就用不了?為什么我換個網(wǎng)絡(luò)環(huán)境,它的反應(yīng)慢了一截?這些問題意味著AI 已經(jīng)被人當成水電一樣的存在了。它需要隨時可用,不能挑網(wǎng)絡(luò)。

模型這一側(cè)也終于跟上了。

過去幾年,量化、蒸餾、稀疏注意力這些工程方法被一批團隊反復(fù)打磨,一個幾B 參數(shù)的模型,經(jīng)過精心設(shè)計,在多模態(tài)、長文本、OCR 這些原本被認為只有大模型才能干的活上,已經(jīng)能做到讓人挑不出毛病的水平。

最直接的體現(xiàn),是它真的能裝進設(shè)備里。手機芯片那點顯存,蘋果 A 系列大概八九 GB,驍龍旗艦差不多。以前看是天花板,現(xiàn)在反過來成了一種剛剛夠用的約束,逼著模型公司把每一層結(jié)構(gòu)都摳到極致。

由此可見,端側(cè)AI 這兩年的真正拐點不是某一項技術(shù)突然成熟,而是模型、芯片、終端三方在同一個時間窗口里,互相找到了對方。


誰在押這條路

把端側(cè)作為主線在押的玩家,已經(jīng)分成了幾撥。

第一撥是終端廠商,自己下場做模型。

蘋果的Apple Intelligence是其中最有代表性的——大約30億參數(shù)級別,主打“端側(cè)優(yōu)先、云端兜底”。它的存在意味著蘋果決定不再把AI能力外包給OpenAI,即使前者聲稱是“合作”。Google 走得更激進,把Gemma Nano直接預(yù)裝到Pixel 系列,并且在Android 14之后開始向手機廠商開放底層API。

終端廠商下場的邏輯很清楚,AI 一旦成為系統(tǒng)級功能,它就不該是別人收過路費的地方。

第二撥是大公司開源出來的小模型。

微軟的Phi系列是這條路上的標志性產(chǎn)品。Phi-3用3.8B參數(shù)做出了能對標 70B模型的部分能力,證明了“小模型+ 精選數(shù)據(jù)”路線的可行性。Meta的Llama 3.2在2024年下半年推出1B / 3B版本,明確標注“為端側(cè)設(shè)計”。Google的Gemma系列走類似路線,開源出來供整個生態(tài)用。

這一撥的共同特點是:它們沒指望靠這些小模型直接掙錢。它們是在為生態(tài)鋪路。路鋪好了,再回頭收硬件、云端、其他業(yè)務(wù)的錢。

第三撥是真的把“小尺寸”當成核心戰(zhàn)略的創(chuàng)業(yè)公司。

Mistral是其中最早的。7B起家,在歐洲拿下了一批政企客戶。但因為太依賴單一開源故事,2024年微軟入股之后處境變得復(fù)雜。

國內(nèi)這邊,阿里的Qwen 系列推出了從 0.5B 到 7B 的小尺寸版本,覆蓋端側(cè)多個段位,但因為同時還在做大尺寸 API 業(yè)務(wù),端側(cè)不是主線。智譜 GLM 也有端側(cè)版本,但商業(yè)重心仍在云端。把端側(cè)當成絕對主線在做的,國內(nèi)最有代表性的是面壁智能,MiniCPM 系列做到了GPT-4o同級水平。這種說法一年前幾乎所有人都覺得是夸口,但它發(fā)生了。

把這幾撥玩家放在一起看,端側(cè)AI 已經(jīng)不是“小公司的避風港”,它正在成為整個行業(yè)重新組織自己的方式。


端側(cè)不是免費午餐

寫到這里,也得說句實話。端側(cè)AI前景雖然無限,但不是完美故事。

把模型塞進設(shè)備這件事,工程上的麻煩比想象中碎。安卓機型上千種,芯片各家API 不一樣,系統(tǒng)定制層每個廠商各有講究。一個端側(cè)模型想在這片土壤里跑順,光適配就夠小公司喝一壺——這件事沒有捷徑,只有一行行的代碼、一臺臺機器的實測,一次次跑通之后被下一代芯片打破,再重新跑通。這種活算法工程師不愛干,但端側(cè)這條路就是由這些不性感的活鋪出來的。

模型公司還得面對一個更隱性的處境:手機廠、芯片廠、車廠本身就是產(chǎn)業(yè)鏈里強勢的一方。被預(yù)裝、被集成看上去是“贏了”,但同時也意味著隨時要面對被替換、被壓價、被邊緣化。Mistral 這兩年在歐洲的處境多少能說明問題——它既要滿足法國政府對“主權(quán)AI”的期待,又要應(yīng)付微軟入股之后被主導(dǎo)話語權(quán)的尷尬,左右都難做。

端側(cè)換來了商業(yè)化更扎實的路徑,但也意味著融入合作生態(tài),成為產(chǎn)業(yè)鏈里若干環(huán)節(jié)中的一環(huán)。

大模型上半場比的是誰能把山攀得最高。下半場比的,是誰愿意走下山,走進具體的設(shè)備里、具體的場景里、具體的人面前。

去年那臺跑在飛行模式下的安卓手機,今年我又見過一次。

在朋友的車上,離線導(dǎo)航和語音都跑在本地。

云在很遠的地方。

但AI 已經(jīng)到了。

本內(nèi)容由作者授權(quán)發(fā)布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯(lián)系 tougao@huxiu.com。

本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4854778.html?f=wyxwapp

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
殲15霸氣喊話日本軍機:你在我導(dǎo)彈射程內(nèi)

殲15霸氣喊話日本軍機:你在我導(dǎo)彈射程內(nèi)

閃電新聞
2026-04-30 15:08:43
隨著希金斯13-10贏羅伯遜,吳宜澤13-8,世錦賽最新奪冠排行出爐

隨著希金斯13-10贏羅伯遜,吳宜澤13-8,世錦賽最新奪冠排行出爐

球場沒跑道
2026-04-30 08:08:19
扎心了!女兒頻繁用生殖器官類詞匯辱罵父母,一家長哭訴引發(fā)熱議

扎心了!女兒頻繁用生殖器官類詞匯辱罵父母,一家長哭訴引發(fā)熱議

火山詩話
2026-04-30 07:03:35
葡超又爆冷!葡體2-2差本菲卡2分,穆帥笑了:后3場拿7分進歐冠

葡超又爆冷!葡體2-2差本菲卡2分,穆帥笑了:后3場拿7分進歐冠

體育知多少
2026-04-30 07:07:33
60萬血本無歸!無限暢吃的自助火鍋,正在批量收割餐飲小白

60萬血本無歸!無限暢吃的自助火鍋,正在批量收割餐飲小白

青眼財經(jīng)
2026-04-29 17:47:33
菲律賓副總統(tǒng)再次面臨彈劾

菲律賓副總統(tǒng)再次面臨彈劾

澎湃新聞
2026-04-29 22:49:05
湖南中醫(yī)附一再爆大瓜!這次牽扯的是院長兒子,還是葉新萍的科室

湖南中醫(yī)附一再爆大瓜!這次牽扯的是院長兒子,還是葉新萍的科室

小鋭有話說
2026-04-30 12:17:58
曾經(jīng)紅火一時的貝貝南瓜,為何遇冷不好賣了?4個原因,很現(xiàn)實

曾經(jīng)紅火一時的貝貝南瓜,為何遇冷不好賣了?4個原因,很現(xiàn)實

超喜歡我
2026-04-30 03:53:07
這年頭縣城里面流行共享前任!

這年頭縣城里面流行共享前任!

微微熱評
2026-04-28 11:47:10
奧運金牌不是免死金牌!羽協(xié)張軍被查更多細節(jié)曝光,乒乓球干凈嗎

奧運金牌不是免死金牌!羽協(xié)張軍被查更多細節(jié)曝光,乒乓球干凈嗎

曹說體育
2026-04-30 15:43:18
五糧液,突發(fā)!股民:財務(wù)造假?

五糧液,突發(fā)!股民:財務(wù)造假?

新浪財經(jīng)
2026-04-30 20:11:05
今夜,漲爆了!特朗普,突然宣布!

今夜,漲爆了!特朗普,突然宣布!

中國基金報
2026-04-30 00:15:46
谷維素加維生素B12,可改善老年人4大常見問題,建議收藏!

谷維素加維生素B12,可改善老年人4大常見問題,建議收藏!

醫(yī)學原創(chuàng)故事會
2026-03-19 23:42:04
破案了!杜鋒用年輕球員時間為何減少?張明池道出了原因

破案了!杜鋒用年輕球員時間為何減少?張明池道出了原因

體育哲人
2026-04-30 23:37:12
張軍被查創(chuàng)下多個尷尬“紀錄”,18年前曾因酒駕被查

張軍被查創(chuàng)下多個尷尬“紀錄”,18年前曾因酒駕被查

元芳有看法
2026-04-30 09:25:44
廣東男籃背水一戰(zhàn)!杜鋒陣容調(diào)整,兩員大將被重用,不能輸只能贏

廣東男籃背水一戰(zhàn)!杜鋒陣容調(diào)整,兩員大將被重用,不能輸只能贏

中國籃壇快訊
2026-04-30 18:30:59
38票反對6票贊成!菲律賓眾院審議莎拉彈劾案現(xiàn)分歧

38票反對6票贊成!菲律賓眾院審議莎拉彈劾案現(xiàn)分歧

顧史
2026-04-30 05:51:49
電影里自盡,為什么歐美人喜歡吞槍飲彈,而我們喜歡槍打太陽穴?

電影里自盡,為什么歐美人喜歡吞槍飲彈,而我們喜歡槍打太陽穴?

小蘭聊歷史
2026-04-30 10:07:24
湖人隊詹姆斯:如果在3-0領(lǐng)先的情況下崩盤,媒體將“蜂擁而至”

湖人隊詹姆斯:如果在3-0領(lǐng)先的情況下崩盤,媒體將“蜂擁而至”

好火子
2026-04-30 23:58:32
中國籍23歲男子在日本鬧市區(qū)釀7車連環(huán)車禍!3人重傷,警察被撞飛重摔落地!

中國籍23歲男子在日本鬧市區(qū)釀7車連環(huán)車禍!3人重傷,警察被撞飛重摔落地!

東京新青年
2026-04-30 16:41:15
2026-05-01 01:07:00
虎嗅APP incentive-icons
虎嗅APP
個性化商業(yè)資訊與觀點交流平臺
26232文章數(shù) 687703關(guān)注度
往期回顧 全部

財經(jīng)要聞

易會滿被“雙開”!

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

頭條要聞

英國國王給特朗普送了口鐘 還貼臉開大"有需要盡管敲"

體育要聞

季后賽場均5.4分,他憑啥在騎士打首發(fā)?

娛樂要聞

孫楊博士學歷有問題?官方含糊其辭

科技要聞

9000億美元估值,Anthropic即將反超OpenAI

汽車要聞

專訪捷途汪如生:捷途雙線作戰(zhàn) 全球化全面落地

態(tài)度原創(chuàng)

本地
藝術(shù)
健康
公開課
軍事航空

本地新聞

用青花瓷的方式,打開西溪濕地

藝術(shù)要聞

耗資21億的故宮北院,網(wǎng)友看后直搖頭:怎么撞臉高鐵站了?

干細胞治燒燙傷面臨這些“瓶頸”

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

意大利議會批準:捐贈航母給印度尼西亞

無障礙瀏覽 進入關(guān)懷版