国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

攪局者來了!智譜重磅開源AutoGLM,讓“豆包手機(jī)”人人可造!官方:AI手機(jī)不該掌握在少數(shù)廠商手中

0
分享至


作者 | 木子、高允毅

2023 年 4 月,在很多人剛聽說“大模型”這個(gè)詞的時(shí)候,智譜團(tuán)隊(duì)開始研究一個(gè)聽上去不太現(xiàn)實(shí)的目標(biāo):

讓 AI 真正學(xué)會(huì)“使用手機(jī)”,也就是像真人一樣,對智能手機(jī)等設(shè)備具有使用能力。

32 個(gè)月后,智譜把階段性重要成果、核心 AI Agent 模型:AutoGLM完整開源了出來,并放話:“每臺(tái)手機(jī),都可以成為 AI 手機(jī)!


AutoGLM 擁有Phone-Use(手機(jī)操作)能力,包括點(diǎn)擊、滑動(dòng)、輸入、截圖理解、流程恢復(fù)、噪聲處理……既能穩(wěn)定完成外賣點(diǎn)單,也能完成機(jī)票預(yù)訂等長達(dá)數(shù)十步的復(fù)雜操作流程。

目前,AutoGLM 已支持上百個(gè)主流 APP,包括以下這些:


另外,AutoGLM 還能同時(shí)在上千臺(tái)云端虛擬手機(jī)里“練功”,通過強(qiáng)化學(xué)習(xí)等極大地?cái)U(kuò)展了 Agent 的準(zhǔn)確性和泛化能力。而且它被嚴(yán)格關(guān)在虛擬設(shè)備的安全沙箱里,既能自由試錯(cuò),又不會(huì)碰到用戶真實(shí)手機(jī)上的隱私數(shù)據(jù)。

智譜今天開源的是一整套可以“拿來就用”的能力,具體包括:

  • 訓(xùn)練好的核心模型;

  • Phone Use 能力框架與工具鏈;

  • 可直接跑通的 Demo,覆蓋 50+ 高頻中文 App;

  • 針對 Android 的適配層與示例工程;

  • 文檔、快速上手指南

模型會(huì)以MIT 開源許可證的形式開放,而所有代碼會(huì)以Apache-2.0 開源許可證的形式,托管在 GitHub 倉庫中:github.com/zai-org/Open-AutoGLM。

為什么選擇開源?

“從產(chǎn)品的角度,AutoGLM 已經(jīng)可以支撐起很多真實(shí)場景;從工程的角度,AutoGLM 的積累足夠?qū)懗梢淮筠夹g(shù)報(bào)告!

為什么選擇在這個(gè)時(shí)間點(diǎn)把辛辛苦苦做的東西開源呢?看完官方自白,不得不說,智譜的格局還挺大。

首先,智譜認(rèn)為“AI 手機(jī)”是大勢所趨,但這不是一家公司就能完成的任務(wù),更不應(yīng)該掌握在極少數(shù)廠商手里

18 年前,蘋果以智能手機(jī)奠定生態(tài)時(shí)代的范式;Siri 問世后,語音助手成了標(biāo)配,但功能多停留在查天氣、設(shè)鬧鐘,距離真正的智能仍相去甚遠(yuǎn)。

如今 AI 登場,變革已成共識。大模型不再只是給手機(jī)添點(diǎn)“智能”、做做答問,而是深入系統(tǒng)流程,像全能管家般跨 App 完成訂票、點(diǎn)餐、取消續(xù)費(fèi)等復(fù)雜操作,讓手機(jī)真正邁向下一代計(jì)算入口。

也正因?yàn)檫@將重塑手機(jī)的能力與地位,一旦被少數(shù)廠商壟斷,那么開發(fā)者的創(chuàng)新空間,要看平臺(tái)愿不愿意開放接口;而用戶日常生活中最重要的那臺(tái)設(shè)備,也會(huì)越來越像“別人家的入口”。

智譜希望:“AutoGLM 的開源,能把這一層能力變成整個(gè)行業(yè)可以共同擁有、共同打磨的公共底座。”

他們把 AutoGLM 比喻成積木,表示可以拿來即用,成為系統(tǒng)的一部分,也可以拆開、重寫、改造,變成新產(chǎn)品的元素。

其次,隱私是 AI 手機(jī)一個(gè)避不開的問題

可以想象,如果 AI 可以操控手機(jī),像管家一樣讀取、操作、解決問題,雖然帶來了便利,但也成為了知曉用戶一切根底的隱形炸彈。

像個(gè)人微信、支付、聊天記錄、照片相冊、企業(yè)內(nèi)部系統(tǒng)等等信息,必須掌握在用戶自己手里。

智譜的解法是,通過開源和私有化部署,企業(yè)和開發(fā)者可以在自己的合規(guī)環(huán)境中完整掌控?cái)?shù)據(jù)、日志和權(quán)限。也就是說,這個(gè) AI 能力免費(fèi)發(fā)放,數(shù)據(jù)與隱私永遠(yuǎn)留在使用方這一側(cè)。

第三,智譜希望“自己吃過的苦,別人別再吃了”。

“把我們走過的路,變成大家在 Agent 爆發(fā)時(shí)代的起跑線。 AutoGLM 是一條很陡的路:我們啃過的技術(shù)難題、踩過的坑、重寫過的框架,在很多場景里都可以復(fù)用,也值得被復(fù)用。”

他們想在未來看到這樣情形:

  • 商業(yè)層面上,有團(tuán)隊(duì)因?yàn)?AutoGLM,做出真正意義上的 AI 原生手機(jī);

  • 技術(shù)層面上,有研究者因?yàn)槠渲心硞(gè)模塊,寫出一篇新論文、新算法;

  • 生態(tài)層面上,個(gè)人開發(fā)者可以利用 AutoGLM,做出自己的項(xiàng)目,在某個(gè)小眾場景里真正跑起來。

AutoGLM&AI 手機(jī)行業(yè)前景

其實(shí) AutoGLM 的這些智能手機(jī)操作能力,和最近熱門的“豆包手機(jī)助手”也有不少異曲同工之處。我們先來回顧一下 AutoGLM 是什么,再來聊聊 AI 手機(jī)行業(yè)前景。

全球首個(gè)手機(jī)智能體

2024 年 11 月,有件事在技術(shù)圈“小引熱議”:AI 第一次自己發(fā)出了一個(gè)手機(jī)紅包。

這不是腳本自動(dòng)化,也不是調(diào)用某個(gè)內(nèi)部 API,而是一個(gè)模型就能“看懂”界面內(nèi)容,再一步一步完成點(diǎn)擊流程。過去大家普遍認(rèn)為這件事極其困難,還有人覺得不可能做到足夠穩(wěn)定。

而這背后的神奇新模型,正是 AutoGLM。


圖源:智譜官方微信公眾號

簡單來說,它是智譜打造的、用于真實(shí)設(shè)備 GUI(圖形用戶界面)操作的基礎(chǔ)智能體(foundation agents), 可以在真實(shí)或虛擬手機(jī)上執(zhí)行長鏈路、多步驟的操作任務(wù),初代于 2024 年 10 月發(fā)布。

AutoGLM 不僅能理解復(fù)雜 UI、規(guī)劃復(fù)雜任務(wù),還具備錯(cuò)誤恢復(fù)能力,這是 Agent 可以部署的前提。

而它之所以能實(shí)現(xiàn) Phone-Use 等強(qiáng)大能力,主要?dú)w功于以下三大核心技術(shù)的突破或創(chuàng)新應(yīng)用

首先,AutoGLM 創(chuàng)新地把 Agent 的行為拆成兩層Planner負(fù)責(zé)思考“做什么”,并輸出動(dòng)作描述,比如:“點(diǎn)擊右下角的提交按鈕”、“輸入商家名稱并搜索”等;Grounder負(fù)責(zé)“在哪里執(zhí)行”,其功能包括識別界面元素、定位坐標(biāo)、檢測按鈕位置、解析視覺信息等等。

這種結(jié)構(gòu),讓規(guī)劃層更加靈活,解決“LLM 看得懂但點(diǎn)不準(zhǔn)”的核心難題,大幅提升跨 APP、跨網(wǎng)頁的泛化能力。

據(jù)智譜論文信息,中間接口(Intermediate Interface)設(shè)計(jì),讓 GPT-4o 視覺模式的網(wǎng)頁任務(wù)執(zhí)行成功率,從 18%(端到端方式) 提到了36.4%,翻了倍。


提出 MobileRL、ComputerRL、AgentRL;驗(yàn)證強(qiáng)化學(xué)習(xí)規(guī)模擴(kuò)展定律;在上千臺(tái)虛擬設(shè)備中并行訓(xùn)練,能力顯著增強(qiáng)。

第二,AutoGLM 的錯(cuò)誤恢復(fù)能力,主要得益于自進(jìn)化式的Curriculum RL,模型通過這個(gè) RL 框架可以自進(jìn)化、自我糾錯(cuò)、自我變強(qiáng)。

通過獎(jiǎng)勵(lì)模型(RM)評估每一步是否朝正確方向推進(jìn),還可以通過 mutate 指令提高或降低任務(wù)難度。模型提前在上千個(gè)虛擬環(huán)境經(jīng)過大量試錯(cuò)和恢復(fù)訓(xùn)練,讓其能在真機(jī)上順利跑通幾十步流程。

第三,是大規(guī)?煽丨h(huán)境,包括 WebArena、AndroidLab,和云手機(jī)集群。

其中,WebArena 是真實(shí)網(wǎng)頁環(huán)境,AndroidLab 是系統(tǒng)級 Android 環(huán)境,云手機(jī)集群則是上千臺(tái)虛擬和真實(shí)設(shè)備并行訓(xùn)練。

大量的場景覆蓋和經(jīng)驗(yàn),讓模型具備了出色的泛化能力,這和谷歌的 AutoRT、WebVoyager、Gemini + Android App 等 Agent 技術(shù)高度類似。

——模型不是靠記規(guī)則,而是靠大量真實(shí)任務(wù)經(jīng)驗(yàn),學(xué)會(huì)在陌生場景中穩(wěn)健執(zhí)行操作。

值得一提的是,今年初 Manus 橫空出世,讓 AI Agent 迅速爆紅,但 Manus 僅在 3 個(gè)月后便迅速撤出了中國市場。不久后,在今年 8 月,智譜發(fā)布 AutoGLM 2.0,也是全球首個(gè)手機(jī)智能體

但“一花獨(dú)放不是春”

手機(jī) Agent浪潮奔涌之時(shí),智譜愿化作那塊關(guān)鍵拼圖,為未來的版圖添上應(yīng)有的一角:

“‘一花獨(dú)放不是春’。Agent 的爆發(fā),需要所有人一起參與!

至于“AI 手機(jī)”這個(gè)概念,本質(zhì)上是把大模型深度塞進(jìn)手機(jī)里,讓其從單一工具升級成能感知、能決策、能跨 App 代辦事務(wù)的隨身智能體。

隨著端側(cè) AI 的成熟,AI 手機(jī)的盤子正在快速擴(kuò)張。

據(jù) IDC 預(yù)計(jì),2026 年中國新一代 AI 手機(jī)出貨量將達(dá)到 1.47 億臺(tái),占總體市場的 53%。

而賽迪顧問也發(fā)布了一個(gè)報(bào)告,判斷 2027 年 AI 手機(jī)銷量將躍升至 1.86 億部,占比 56.1%,并強(qiáng)調(diào)“端側(cè)主導(dǎo)、生成式創(chuàng)新與硬件突破”將繼續(xù)推進(jìn)行業(yè)高速增長。


這和之前的數(shù)據(jù)相比,已有大幅躍升:2023 年,中國 AI 手機(jī)銷售量達(dá)到 1100 萬部,占全球 AI 手機(jī)銷售量 22%。2024 年,中國市場的新型 AI 智能手機(jī)出貨量預(yù)計(jì)將超過 3500 萬部,預(yù)估市場占有率為 12%

但目前 AI 手機(jī)效果如何呢?實(shí)際體驗(yàn)仍處在“宣傳大于實(shí)際”的早期階段。

今年年初,21 財(cái)經(jīng)曾對六款 AI 手機(jī)進(jìn)行了測評,發(fā)現(xiàn)多數(shù)智能體在訂咖啡、跨應(yīng)用操作等場景下不是中途卡住,就是需要多輪確認(rèn);能穩(wěn)定跑完流程的主要是榮耀 YOYO,但離“全自動(dòng)化”仍有明顯差距,跨 App 操作成功率依然受限于權(quán)限、界面變化等工程難題。


這也讓行業(yè)將技術(shù)路線分成兩派:依賴 App 授權(quán)的“意圖框架”,和無需授權(quán)、靠讀屏與模擬操作的“視覺路線(GUI Agent)”。

簡單來說,前者是走“官方通道”,App 得先點(diǎn)頭授權(quán),Agent 才能直接調(diào)用它的功能;后者則是“看著學(xué)”:智能體自己讀屏幕、看按鈕、模擬人手點(diǎn)來點(diǎn)去,就像站在你旁邊學(xué)你怎么操作手機(jī)。

最近出圈的“豆包手機(jī)”,就是嘗試把 GUI Agent 做到系統(tǒng)級。

豆包手機(jī)其實(shí)是字節(jié)跳動(dòng)在做的一次低調(diào)試水,它由中興代工,首批約 3 萬臺(tái),主要供內(nèi)部測試,沒有對外銷售。不過據(jù)傳,因需求旺盛,目前在閑魚被炒到近 8000 元。

據(jù)晚點(diǎn)報(bào)道,該手機(jī)背后的核心團(tuán)隊(duì)是字節(jié)負(fù)責(zé) AI 硬件的 Ocean,他們由 PICO、OlaDance、錘子等多個(gè)硬件團(tuán)隊(duì)整合而來,目標(biāo)是探索“大模型 + 超級 App + 硬件”的新形態(tài)。

字節(jié)原本想把豆包大模型提供給手機(jī)廠商作為系統(tǒng)級能力,但多數(shù)廠商擔(dān)心失去大模型時(shí)代的主導(dǎo)權(quán)而拒絕合作,最終促使字節(jié)決定親自下場做手機(jī),并已啟動(dòng)第二代產(chǎn)品研發(fā),預(yù)計(jì)在 2026 年底推出。

高盛在報(bào)告中指出,第三方 AI 想在手機(jī)里大規(guī)模落地并不容易:權(quán)限拿不到、數(shù)據(jù)摸不到、應(yīng)用不一定愿意配合,導(dǎo)致智能體既難看清手機(jī)、也難穩(wěn)定操作。

如今各大廠商普遍把“大模型”當(dāng)作下一代手機(jī)的靈魂,更傾向與體量更小、可控性更強(qiáng)的大模型公司合作——比如 OPPO 選擇階躍星辰,而榮耀、三星等廠商則采用了智譜。

也正是在這場競爭中,智譜的角色愈發(fā)清晰:他們不是要取代手機(jī)廠,而是以開放、易集成的底層能力,成為 AI 手機(jī)生態(tài)里那塊關(guān)鍵拼圖,幫助更多廠商真正把“智能體”從概念變成用戶愿意天天依賴的體驗(yàn)。

AI 手機(jī)的下一代入口之爭剛剛開始,而決定最終格局的,將是哪些技術(shù)力量能夠真正讓智能體落地、跑穩(wěn)、跑廣。

傳送門:

github.com/zai-org/Open-AutoGLM

https://arxiv.org/abs/2411.00820

https://www.21jingji.com/article/20250317/herald/6410c6c74c64a254bdc041898ecbd76c.html

聲明:本文為 AI 前線整理,不代表平臺(tái)觀點(diǎn),未經(jīng)許可禁止轉(zhuǎn)載。

從 Chatbot 到 Action Agent,企業(yè)級落地最怕什么?是長程推理的顯存天價(jià)成本,還是業(yè)務(wù)邏輯的“死循環(huán)”風(fēng)險(xiǎn)?如何利用 MCP 協(xié)議解決接口調(diào)用的“信任危機(jī)”?本次直播集結(jié)值得買、商湯、明略三位技術(shù)專家拆解可信 Agent 的構(gòu)建之道。


會(huì)議預(yù)告

12 月 19~20 日,AICon 2025 年度收官站在北京舉辦。現(xiàn)已開啟 9 折優(yōu)惠。

兩天時(shí)間,聊最熱的 Agent、上下文工程、AI 產(chǎn)品創(chuàng)新等等話題,與頭部企業(yè)與創(chuàng)新團(tuán)隊(duì)的專家深度交流落地經(jīng)驗(yàn)與思考。2025 年最后一場,不容錯(cuò)過。

今日薦文

你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
龍珠:一口氣看完角色原型,中國元素真的很多!

龍珠:一口氣看完角色原型,中國元素真的很多!

動(dòng)漫心世界
2026-01-19 14:13:39
警惕!美媒:衛(wèi)星圖像揭露日本“出云”級艦艇“航母化”改造最新進(jìn)展

警惕!美媒:衛(wèi)星圖像揭露日本“出云”級艦艇“航母化”改造最新進(jìn)展

環(huán)球網(wǎng)資訊
2026-01-18 19:14:49
特朗普寫信給挪威首相:不給我諾獎(jiǎng),就別怪我不和平了

特朗普寫信給挪威首相:不給我諾獎(jiǎng),就別怪我不和平了

觀察者網(wǎng)
2026-01-19 17:42:09
不要在心里養(yǎng)一條毒蛇

不要在心里養(yǎng)一條毒蛇

洞見
2026-01-18 20:38:04
超模卡門:77歲被騙光積蓄,83歲仍有性生活,91歲雙腿依舊迷人

超?ㄩT:77歲被騙光積蓄,83歲仍有性生活,91歲雙腿依舊迷人

豐譚筆錄
2025-12-11 11:41:19
《瘋狂動(dòng)物城2》票房超120億,奪得全球亞軍,《哪吒2》無可撼動(dòng)

《瘋狂動(dòng)物城2》票房超120億,奪得全球亞軍,《哪吒2》無可撼動(dòng)

影視高原說
2026-01-19 19:22:02
77年來首次,歷史性的一幕發(fā)生,德國總理下定決心,必須要去中國

77年來首次,歷史性的一幕發(fā)生,德國總理下定決心,必須要去中國

近史博覽
2026-01-19 14:36:36
0-3出局?各國球迷熱議U23亞洲半決賽,看好越南進(jìn)決賽,坐等打臉

0-3出局?各國球迷熱議U23亞洲半決賽,看好越南進(jìn)決賽,坐等打臉

大秦壁虎白話體育
2026-01-20 09:13:37
皇馬要賣了!巴西天王 “已同意” 加盟藍(lán)軍,1.5 億歐創(chuàng)隊(duì)史紀(jì)錄

皇馬要賣了!巴西天王 “已同意” 加盟藍(lán)軍,1.5 億歐創(chuàng)隊(duì)史紀(jì)錄

奶蓋熊本熊
2026-01-20 04:50:06
1000架殲-20和900架殲-16?英國智庫:難以戰(zhàn)勝2030年的中國空軍

1000架殲-20和900架殲-16?英國智庫:難以戰(zhàn)勝2030年的中國空軍

滄海旅行家
2026-01-17 14:05:11
葉文斌,找到了!

葉文斌,找到了!

中國新聞周刊
2026-01-19 15:47:29
唐嫣在國外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

唐嫣在國外很豪放!穿連體衣下面不系扣,難道不好好穿衣就時(shí)髦?

章眽八卦
2026-01-05 12:27:07
當(dāng)年藥廠抓了譚秦東,但這次西貝不可能抓羅永浩了?

當(dāng)年藥廠抓了譚秦東,但這次西貝不可能抓羅永浩了?

芳華青年
2026-01-19 20:55:13
丹麥放話不再接受中國投資,不到3天,特朗普反手一記悶棍

丹麥放話不再接受中國投資,不到3天,特朗普反手一記悶棍

阿天愛旅行
2026-01-20 11:07:40
戲子無情!賀嬌龍去世,與她合作過的吳京于適竇驍沒有一個(gè)人悼念

戲子無情!賀嬌龍去世,與她合作過的吳京于適竇驍沒有一個(gè)人悼念

小娛樂悠悠
2026-01-20 10:30:06
動(dòng)物交配六親不認(rèn),若雄性遇上自己母親呢?馬不欺母是不是真的?

動(dòng)物交配六親不認(rèn),若雄性遇上自己母親呢?馬不欺母是不是真的?

答案在這兒
2025-12-05 01:58:07
扎心了!原來只要失業(yè),所有人都一樣!網(wǎng)友分享越看越心涼 太難了

扎心了!原來只要失業(yè),所有人都一樣!網(wǎng)友分享越看越心涼 太難了

有趣的火烈鳥
2025-12-31 20:39:06
梁小龍生前深愛的兩個(gè)女人,一個(gè)毀容他不走,一個(gè)平淡他守到底

梁小龍生前深愛的兩個(gè)女人,一個(gè)毀容他不走,一個(gè)平淡他守到底

趣味八卦
2026-01-20 10:56:45
春節(jié)檔看《鏢人》,直接統(tǒng)一全家審美

春節(jié)檔看《鏢人》,直接統(tǒng)一全家審美

閑人電影
2026-01-19 20:00:59
亞洲最大的飛機(jī)墳場,藏于中國一小縣城里,停放數(shù)量僅次于美國?

亞洲最大的飛機(jī)墳場,藏于中國一小縣城里,停放數(shù)量僅次于美國?

顧史
2026-01-19 20:21:12
2026-01-20 12:32:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1257文章數(shù) 109關(guān)注度
往期回顧 全部

科技要聞

去年預(yù)虧60億后再投百億 兩大車企緊抱華為

頭條要聞

貝克漢姆長子發(fā)長文公開指責(zé)父母:試圖破壞我的婚姻

頭條要聞

貝克漢姆長子發(fā)長文公開指責(zé)父母:試圖破壞我的婚姻

體育要聞

新的時(shí)代!東契奇生涯首奪全明星票王 此前10年詹姆斯7次奪魁

娛樂要聞

貝克漢姆長子發(fā)文決裂:全家都在演戲

財(cái)經(jīng)要聞

2026年,7個(gè)趨勢正在爆發(fā)

汽車要聞

奇瑞張貴兵:墨甲不做秀技術(shù)的企業(yè) 只做痛點(diǎn)終結(jié)者

態(tài)度原創(chuàng)

本地
數(shù)碼
親子
公開課
軍事航空

本地新聞

云游遼寧|漫步千年小城晨昏,“康”復(fù)好心情

數(shù)碼要聞

1399元小米兒童手表發(fā)布:5MP + 8MP高清翻轉(zhuǎn)雙攝,藍(lán)紫雙色可選

親子要聞

什么字呢

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

古美關(guān)系高度緊張 古巴啟動(dòng)"戰(zhàn)爭狀態(tài)"

無障礙瀏覽 進(jìn)入關(guān)懷版