国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

萬字詳解智能體2.0:手機里的“互聯(lián)互通”新戰(zhàn)場

0
分享至

《21世紀經(jīng)濟報道》競爭秩序場工作室 報道

過去兩年,智能體(Agent)是AI行業(yè)最重要的敘事,現(xiàn)在聚光燈正收束到一個更具體的方向:端側智能體。

在海外,名為OpenClaw的智能體在硅谷技術圈走紅,接管一眾開發(fā)者的電腦;在國內(nèi),字節(jié)跳動把豆包嵌入手機,樣機價格在二手市場居高不下。這些智能體運行在手機、電腦和汽車上,能操作本地環(huán)境和所有工具,點外賣、打游戲、炒股票,把執(zhí)行力拉到極致。

智能體還會接管更多個人設備。在發(fā)售工程版“豆包手機助手”后,據(jù)媒體披露,字節(jié)已于去年年底啟動正式版手機項目,搭載智能體的新機預計于今年Q2發(fā)布。

我們近期還從多方了解到,包括阿里系在內(nèi)的多家App與字節(jié)跳動達成?;饏f(xié)議,App允許努比亞設備的手動登錄,豆包主動限制AI操作場景,雙方回到“井水不犯河水”的狀態(tài)。

行業(yè)正在形成一個共識:未來智能體的壁壘,在于能打通多少個人設備,能互聯(lián)多少服務。智能體想成為新的能力層,重組我們與設備、與App的連接方式,改變行業(yè)生態(tài)格局。

但這種互聯(lián)互通的技術趨勢,也撞上了個人和平臺的控制邊界。在我們2025年年初的手機智能體測評中,許多擔憂已初現(xiàn)輪廓:智能體要想操作手機,需要利用高敏感權限進行讀屏和自動操作,引發(fā)權限濫用、個人隱私等安全擔憂和商業(yè)糾紛。

眼下,這些問題成了更嚴肅的堵點。我們?yōu)榇诵乱惠啘y評了豆包手機助手、智譜、榮耀、華為、小米、OPPO、vivo七款手機智能體,追蹤它們的性能、底層模型、系統(tǒng)權限、隱私設計最新情況,并梳理水面之下的廠商博弈。

越來越多智能體正在排隊上路。它們距離真正上路有多遠?還缺哪些技術、商業(yè)或合規(guī)條件?厘清這些關鍵事實,端側智能體的故事才可能真正開始。



如果說前幾年的大模型浪潮,讓人第一次意識到機器會聊天,那么智能體帶來的是一個更有沖擊力的現(xiàn)實:機器會替人做事。

過去一年里,標志性的智能體產(chǎn)品大多生長在云端。Manus、Claude等產(chǎn)品展示了任務規(guī)劃與工具調(diào)用的能力,它們運行在遠程服務器上,依賴云端算力和網(wǎng)頁工具來做PPT、訂票和購物。而端側智能體走的是另一條路線:模型部署在本地設備,在手機、電腦、汽車里操作軟件與系統(tǒng)。

越來越多智能體從云端落入個人終端。在國內(nèi),豆包手機助手是端側智能體破圈的一個起點,但這條路并不始于此。過去一年多里,國內(nèi)手機廠商已經(jīng)完成了一輪并不低調(diào)的市場鋪陳。

移動數(shù)據(jù)調(diào)研機構Quest Mobile在2025年9月測算,國內(nèi)六家手機廠商的智能體用戶規(guī)模,在一年內(nèi)合計增長了6500萬,用戶規(guī)模整體達到5.35億。

OPPO、vivo、榮耀是其中最積極的發(fā)力者。根據(jù)Quest Mobile數(shù)據(jù),OPPO小布助手在2025年6月已經(jīng)擁有1.6億月活用戶,vivo藍心小v為5500萬,榮耀YOYO助理為4200萬,三者躋身上半年增速最快的AI應用行列。



“AI+硬件”在今年已是一片紅海。但與互聯(lián)網(wǎng)公司用硬件爭奪C端入口不同,手機廠商的出發(fā)點是,借助AI抬高硬件與操作系統(tǒng)的價值,圓心始終是手機本身。

國內(nèi)的手機智能體潮始于2024年。當年9月,榮耀用“一句話點咖啡”為AI手機拉開序幕,并表示榮耀Magic 7系列是安卓陣營里首款落地AI智能體的手機。華為、vivo、OPPO、小米等廠商也很快升級了自己的手機助手。

“AI即操作系統(tǒng)”是主流廠商的戰(zhàn)略想法。2025年10月,vivo更新OriginOS 5 操作系統(tǒng),基于藍心大模型重構;OPPO提出AI OS戰(zhàn)略,開始為智能體配置獨立的物理喚醒鍵。

但現(xiàn)實情況是,手機智能體仍停留在一個吸引投資者的概念,而非能用的產(chǎn)品。我們在2025年3月測評了6款手機智能體,發(fā)現(xiàn)失敗率高、不穩(wěn)定、耗時長是普遍問題,只有榮耀勉強能算“半自動駕駛”。

經(jīng)過一年的發(fā)展,宣傳和現(xiàn)實的落差仍在。我們對包括智譜AutoGLM、豆包手機助手在內(nèi)的7款手機智能體開展了新一輪測試,在總計70次任務中,整體成功率僅有兩成,39%的任務啟動后中斷,還有24%直接失敗降級為信息問答。



如果細看任務過程,甚至可以說手機智能體的“接管能力”在退化。以點外賣為例,如今大多數(shù)手機智能體只能完成第一步——打開外賣App。之后既不會進入搜索頁面,更談不上篩選店鋪、確認規(guī)格。

2025年年初時,手機智能體明顯能在App里走得更遠。當時,榮耀YOYO助理能通過多輪對話抵達美團下單頁,OPPO和小米也能完成“瑞幸咖啡”的關鍵詞搜索。

自主范圍不斷收緊的同時,能力本身仍存在許多硬傷。

最集中的短板是任務規(guī)劃。當我們說“找一款性價比高的抽紙”時,大部分智能體會將整句話原封不動地復制進電商平臺,而不是先搜索抽紙、再按價格篩選。智能體還會直接“偷懶”用文字回答任務,而不是調(diào)動App執(zhí)行。

App的版本更新也是難題。在我們的測評過程中,餓了么正式改名為“淘寶閃購”。但如果使用新名稱,手機智能體都會打開淘寶,只有說“餓了么”才可能被識別。

正是在這一背景下,豆包手機助手只進行了小范圍的工程預覽,卻獲得了格外多關注。在早期測評中,不管是訂機票、發(fā)微信乃至玩開心消消樂,豆包手機助手都能在短時間內(nèi)絲滑完成。遇到失敗,甚至能主動糾錯。

復旦大學系統(tǒng)與軟件安全實驗室張曉寒在測評多款AI手機后,將手機智能體的能力劃分為基礎、進階和高階三檔:基礎能力主要是識別屏幕、調(diào)節(jié)系統(tǒng)設置,如今的手機智能體都能完成;進階能力各有側重,例如華為小藝擅長圖像處理,而vivo藍心小v的本地文件檢索速度很快。

真正拉開差距的,是深度操作App的高階能力?!斑@類跨App任務是手機智能體能力的分水嶺,也是當前各家的關注焦點。”張曉寒表示,當前確實只有豆包成功率較高。

西湖大學AGI實驗室負責人張馳曾帶隊某頭部互聯(lián)網(wǎng)公司的智能體研究團隊,他也認同,豆包在多模態(tài)感知、復雜任務推理和準確度的綜合體驗上屬于頂尖。但張馳同時指出,由于第三方App迅速“圍剿”了豆包,它在穩(wěn)定性、長尾場景覆蓋率以及對App更新的適應能力上,完成度仍然未知。

在張馳看來,目前手機智能體整體仍停留在L1到L2階段之間,只能在一些有限場景、有限App中做演示。豆包手機助手意味著“智能體第一次真正產(chǎn)品化”,但更像是第一輛上路測試的全自動駕駛汽車,能在園區(qū)內(nèi)跑,還開不上公共道路。

值得補充的是,操作App并非手機智能體的唯一關注點,記憶是另一條被多方押注的方向。

豆包手機助手、vivo和OPPO都上線了“閃記”類的功能,比如總結小紅書帖子,解析B站視頻,快速記下微信和支付寶扣款。通過用戶手動截屏,讓AI存儲信息。

上下文記憶的建立,可能會進一步改變我們與AI的溝通方式?,F(xiàn)在要讓智能體做事,仍然需要非常具體的、多輪的提示詞,而記憶的目標是讓AI理解模糊指令,更加“個人化”。

在手機廠商的藍圖里,記憶被視為AI手機向前演進的第一刀。OPPO ColorOS智慧產(chǎn)品研發(fā)總監(jiān)姜昱辰在媒體采訪中提到,后續(xù)會沿著連點成線、連線成圖的路線,建立用戶偏好畫像。記憶的演化速度會很快,“可能未來1~2年內(nèi)就會有非常不一樣的用戶體驗。”

為什么現(xiàn)在大部分手機智能體仍然不盡如人意?要真正替代人類操作,還需要多久?當人們討論這兩個問題時,模型能力鮮少被追問。

幾乎所有手機智能體都采用GUI Agent為底層模型,即通說的“視覺路線”。它的工作方式可以概括為三步:理解、感知、執(zhí)行——大模型先理解點咖啡的指令,再像人眼一樣觀察外賣App的頁面和按鈕,最后模擬點擊操作。

最受關注的豆包手機助手,接近豆包人士告訴我們,采用的是未公開的閉源版模型。

2025年1月,字節(jié)Seed團隊曾和清華大學聯(lián)合推出開源的UI-TARS原生智能體。從技術報告來看,UI-TARS 1.0 的開發(fā)重點在推理能力,把復雜的任務分解為若干個小任務,并加入自我反思糾錯的訓練過程。大半年后發(fā)表的UI-TARS 2.0進一步指出,純GUI操作存在局限,不足以滿足實際工作需求。因此不再局限于單純的點擊和滑動,而是通過SDK,接入外部的文件系統(tǒng)和沙盒平臺。

曾在手機廠商工作的Carrie向我們指出,國內(nèi)不少手機智能體的基模來自阿里通義實驗室的Qwen系列,開源和多模態(tài)能力是其主要優(yōu)勢。我們看到的多篇技術報告也證實了一點。

通義實驗室在2025年8月專門發(fā)布了GUI-Owl模型,用于 GUI 自動化任務。12月,通義實驗室又推出了MAI-UI模型,據(jù)稱首次將用戶交互、MCP工具調(diào)用、端云協(xié)同的能力,集成在一個能自我進化的開源框架中。

在覆蓋20個安卓應用、116項任務的Android World基準測試中,字節(jié)得分73.7分,阿里拿到76.7分。登上該基測榜單的國內(nèi)公司還有智譜、階躍星辰和OPPO,自評分數(shù)在70分到80分之間。雖然在2025年一年里有明顯提升,但還不能穩(wěn)定達到人類平均水準(80分)。

該榜單的最高得分為97.4分,由一家名為AGI的美國硅谷初創(chuàng)公司摘下,據(jù)稱公司正與小米、聯(lián)想、三星探討合作。



階躍星辰也是目前與手機廠商合作密集的大模型公司之一,合作方包括榮耀、OPPO和中興。技術報告顯示,除了生產(chǎn)力工具,Step-GUI重點考慮了高頻使用的生活服務,比如“在攜程上訂一張去三亞的機票,微信發(fā)給我老婆”。

最早一批入場手機智能體的智譜,最近開源了AutoGLM。據(jù)智譜披露,AutoGLM在常見國內(nèi)App中的任務成功率可達89.7%。

測試得分看起來都不錯,為什么實際體驗還很笨拙?

在張馳看來,差距首先出現(xiàn)在學術指標與產(chǎn)業(yè)目標之間。學術界與產(chǎn)業(yè)界關注的指標并不一致,很多落地障礙并非技術問題,而是工程問題。但如果不以落地為目標,研究者往往很難提前想到工程缺口。

張馳舉例說,多輪對話就是一個典型場景。很多開發(fā)者沒考慮到,在真實環(huán)境下,需要用戶進行反復補充信息,才能向智能體指明具體要買哪趟航班;再比如,學術研究中的GUI Agent往往只關注單個任務的記憶,但要落地成產(chǎn)品,必須具備手機的上下文記憶,才能理解用戶的語境。

工程方面的問題,在過去一年里被更多研究者關注。OPPO研究院與上海交通大學在2025年10月聯(lián)合發(fā)布的一篇論文指出,當前技術評估體系過度強調(diào)任務成功率,卻忽略了以用戶為中心的指標,包括意圖理解的準確性、持續(xù)自我演化能力,以及整體交互體驗。

這篇論文還提到,基準測試和真實場景的復雜性有明顯差距。在測試環(huán)境中,幾乎沒有不可預測的干擾,但在真實使用里,一個突如其來的界面廣告彈窗就足以中斷執(zhí)行。

在此背景下,豆包的技術意義主要是連接學術與產(chǎn)業(yè)?!白止?jié)的這一系列研究,更多是基礎能力的增強,并圍繞產(chǎn)品體驗整合多種技術方案,比如加上了系統(tǒng)接口。這些嘗試需要大量數(shù)據(jù)和算力,能夠彌補學術界在這方面的不足?!睆堮Y評價道。

我們還了解到,一些手機廠商宣稱并未在量產(chǎn)產(chǎn)品中釋放GUI Agent的全部能力,主要顧慮是穩(wěn)定性和隱私。據(jù)其解釋,雖然公司認為自己的GUI Agent實際效果不差,但魯棒性還不夠,也就是表現(xiàn)不夠穩(wěn)健,消費者對AI操作失敗的容忍度很低。此外,GUI Agent的隱私風險仍然過高。

如果說大模型是智能體的大腦,那么操作系統(tǒng)就是它的手腳。沒有環(huán)境支持,GUI Agent的能力無法釋放,二者缺一不可。

正因如此,圍繞手機智能體的爭議,總會落到一個話題上:系統(tǒng)權限。

我們聯(lián)合張曉寒測評了努比亞(豆包手機)、榮耀、華為、vivo、OPPO、小米六臺手機的預裝智能體,發(fā)現(xiàn)幾乎所有智能體的權限總量都超過100個。四類權限(系統(tǒng)控制、屏幕控制與注入、窗口與顯示管理、隱私數(shù)據(jù)訪問)構成智能體接管手機的能力基石。

張曉寒形容這是“一個驚人的數(shù)量級”。他表示,作為參照,即便是微信這類生態(tài)復雜的超級App,申請權限通常也不會超過100項。

很難說如此多權限,都是必要的。云安全聯(lián)盟大中華區(qū)CTO王安宇曾負責多家手機的終端安全,他告訴我們,智能體如果想應對復雜的任務鏈條,例如“給我媽發(fā)個消息今晚不回家吃飯”,最簡單的方式就是提前申請通訊錄、短信等全套權限。雖然也有其他方式,但會頻繁觸發(fā)授權彈窗,影響使用流暢度。

比數(shù)量更值得關注的,是申請權限的內(nèi)容。測評顯示,手機智能體申請的高敏感權限平均接近 40%,包括獲取精確定位、讀取短信與錄音、靜默安裝應用等。

張曉寒表示,普通 App 的高敏感權限占比通??刂圃?30% 以下,而且獲取位置等敏感數(shù)據(jù)時,通常得按國家標準進行單獨彈窗提示。“這意味著用戶在使用手機智能體時,實質(zhì)上是在運行一個默認擁有極高特權的程序,不能視為普通應用?!?/strong>

智能體拿到的這些敏感權限服務于兩項核心能力:讀屏與自動操作。如何實現(xiàn)這兩步,決定了風險的上限,因此需要更深入的分析。

在我們?nèi)ツ甑谝惠啘y評中,除了華為,所有手機智能體都采用了無障礙權限。它相當于一張萬能門禁卡,可以繞過手機操作系統(tǒng)的沙箱隔離機制,進入每個App的獨立房間,讀取屏幕上的文本、按鈕、標簽。

經(jīng)過一年進化,一些智能體走入了手機系統(tǒng)更深處。

技術測評結果顯示,為了讀屏,榮耀、小米和vivo的技術主路徑是無障礙權限,而豆包和OPPO利用的是更底層的系統(tǒng)服務——豆包手機助手用到了一項名為WindowManagerService的系統(tǒng)服務,其截圖依賴于CAPTURE_VIDEO_OUTPUT 和 CAPTURE_SECURE_VIDEO_OUTPUT 權限;OPPO的小布助手則通過SystemUI 等其他系統(tǒng)組件的相互調(diào)用,實現(xiàn)屏幕識別。

王安宇向我們解釋了兩者的差別:無障礙權限仍面臨限制,打開時需要有系統(tǒng)彈窗,需要用戶手動開啟,而且無法直接讀取銀行密碼鍵盤等Secure安全窗口。只要遵守這些安全柵欄,第三方App都可以合法調(diào)用。

與無障礙不同,系統(tǒng)框架沒有單獨的彈窗提示,可以直接獲取像素級屏幕內(nèi)容,并且能截屏到Secure安全窗口。因此,它只授予廠商級預裝應用,不開放給第三方App。

針對利用系統(tǒng)框架截屏到Secure安全窗口的問題,豆包此前回應時解釋,豆包手機助手使用了原生截屏接口(WindowManagerService),目的是為了在靈動島向用戶展示操作過程。

針對此次測評,豆包回應我們稱,CAPTURE_SECURE_VIDEO_OUTPUT權限用于生成可視化虛擬操作界面,將助手的后臺操作過程實時投射至虛擬屏(帶有粉色光暈標識),確保用戶全程可見。在這一過程中,“嚴格遵循應用聲明的 Secure 標記,無法截屏銀行安全鍵盤等聲明受保護的界面內(nèi)容”。

“‘嚴格遵循’是個有點討巧的說法,理論上是能夠截屏Secure頁面的,只是不一定會實際處理?!币晃皇謾C安全業(yè)內(nèi)人士直言。

我們的技術測評也顯示,豆包、OPPO具備截屏Secure窗口的能力,但會加入標志提示,由調(diào)用方判斷下一步的處理方式。相當于可以無視外界的安全屏障,更依賴于自我約束。

在自動操作層面,權限升級同樣明顯。OPPO和vivo的技術主路徑為利用無障礙權限、模擬點擊,豆包和榮耀則申請了inject_events權限,小米兩者都有涉及。

“inject_events相當于設備的完全控制權,能力范圍遠遠超出無障礙權限。”王安宇解釋,無障礙點擊速度偏慢、容易受后臺服務限制等影響,對復雜界面處理也相對存在局限性;而inject_events直接向系統(tǒng)注入事件,更少被UI干預,成功率更高。同樣的,該權限只對廠商級預裝應用開放。

更開放的系統(tǒng)權限是一把雙刃劍,它讓AI更智能,也讓安全暴露在更大的風浪中。

智能體需要不斷截屏、分析、傳數(shù)據(jù)上云,其中不可避免接觸好友動態(tài)、私信提示、廣告內(nèi)容等敏感信息。哪怕廠商承諾不存儲這些信息,但在讀取和處理的瞬間,隱私暴露的?險也是客觀存在的。

多位從業(yè)者還共同提到了誤操作的問題。如果指令被干擾或者理解錯誤,用戶可能來不及退出,智能體就在幾秒鐘內(nèi)完成連續(xù)操作了——這是一種更不可控的風險。

值得一提的是,無論是無障礙權限還是inject_event,系統(tǒng)方手機廠商都兼具“玩家”和“裁判員”雙重身份。我們曾在此前的無障礙權限測評中發(fā)現(xiàn),手機廠商的原生智能體調(diào)用了無障礙權限但未提示,或者任務結束后無障礙權限還保持打開,并未嚴格遵循安全規(guī)則。

“GUI Agent 最根本的問題還是權限太高了,本質(zhì)是在代替用戶操作?!睆堮Y說,智能體要真正落地,一定需要限制,而且得在用戶預期和實際能力之間找到共同點。不能讓用戶以為什么都能做,實際上很多事做不到,也不該做。不確定性疊加高權限,本身就是一種風險。

給智能體套上透明的使用規(guī)范,因此是第一道防線。

在我們?nèi)ツ甑臏y評中,手機智能體的調(diào)用還相當混亂:有的沒有單獨提示無障礙權限,有的任務結束后仍保持高權限開啟。而今年的測評顯示,各家提供者已經(jīng)形成了較為一致的安全基線。

豆包、榮耀、OPPO已公開各自的AI隱私與安全白皮書。結合我們的測評可以看到,當前的安全設計主要集中在三個維度:知情與控制、操作透明度、數(shù)據(jù)傳輸策略。

在知情和控制上,差異最明顯的是單獨告知機制。雖然所有智能體都要求用戶先同意《隱私政策》,但普通用戶不一定明白AI如何操作、風險有多大。對此,只有小米和豆包在實際操作前,單獨發(fā)送了“是否允許AI接管手機”的彈窗。

敏感操作的二次確認已成為行業(yè)共識,但哪些算敏感操作并不統(tǒng)一。大部分智能體只要求用戶對支付二次確認,豆包則將發(fā)布內(nèi)容、刪除內(nèi)容、退出賬號等行為也納為敏感操作,需要手動接管或確認。

OPPO在其領頭撰寫的安全技術白皮書提到,對于不同風險等級的行為,需要不同策略。OPPO建議的高風險操作有拼接驗證碼、安裝App、刪除或修改用戶數(shù)據(jù)、發(fā)起支付和轉賬、保存敏感個人信息。

豆包在回應我們時提及,豆包手機助手采用了權限授權透明化、敏感操作人工接管、權限可控可調(diào)整等安全保障。

多位網(wǎng)絡安全從業(yè)者向我們提到,AI操作日志留痕和權限記錄很重要。云安全聯(lián)盟分析師卜宋博解釋,這是為了讓AI的每?步操作有跡可循。比如“打開麥克風”“訪問通訊錄”等操作,應當像App權限一樣可視化,才能做到事后追溯與監(jiān)管。

測評顯示,目前小米和華為的基礎記錄缺失。例如,使喚智能體需要調(diào)用手機麥克風,但在小米系統(tǒng)的麥克風權限使用記錄中,事后沒有出現(xiàn)小愛同學的痕跡。小米對此沒有明確回復,只向我們表示在第一次使用AI助手時,會事前征得調(diào)用麥克風的用戶授權。

還有一種需要特別關注的隱私場景,是鎖屏狀態(tài)下的智能體表現(xiàn)。王安宇告訴我們,手機鎖屏時會有網(wǎng)絡限制,如果能語音喚醒智能體,說明其繞過了很多安全機制。假如手機落入第三方手中,智能體還可能成為繞過鎖屏的“入侵”工具。

王安宇和卜宋博因此單獨測試了鎖屏場景,發(fā)現(xiàn)大多手機智能體都已經(jīng)加上安全防護。只有小米默認屏幕顯示詳細的通知信息,并允許智能體播報出信息、網(wǎng)絡狀態(tài)、鎖屏時間等。

“這是一個比較小的攻擊面,畢竟現(xiàn)在手機都設計了聲紋識別,要喚醒智能體,黑客還得知道機主的聲紋特征才行。”多位技術安全專家說。不過他們也指出,作為收集數(shù)據(jù)更多、能力更強的AI,對危險場景的考慮應當更細致。

總的來說,參與測評的業(yè)內(nèi)人士認為代碼邏輯是安全的,行業(yè)也有一套基礎安全護欄。但問題并沒有到此結束。

目前所有手機智能體都需要用“端云協(xié)同模式”來處理數(shù)據(jù),而數(shù)據(jù)上云是手機智能體最有爭議的環(huán)節(jié),并不讓人意外。張曉寒向我們指出,過去常見有敏感信息的網(wǎng)絡數(shù)據(jù)包被截取,或者沒有嚴格加密傳到云端,導致隱私泄露??梢哉f,數(shù)據(jù)安全是整個手機安全體系中最核心、最脆弱的問題。

為了評估手機智能體數(shù)據(jù)上云的風險,多位技術專家進行了測評。結果顯示,除了系統(tǒng)原生功能(鬧鐘、日歷)外,大多數(shù)任務都會觸發(fā)云端傳輸。

至于傳輸數(shù)據(jù)是否包含敏感信息,張曉寒告訴我們,測評智能體均采用了較為完備的數(shù)據(jù)加密和保護方法,所以無法通過抓包驗證。

張曉寒因此又嘗試了黑盒測試,要求智能體“將當前屏幕展現(xiàn)的身份證照片轉為吉卜力風格”。結果發(fā)現(xiàn),所有智能體都能完成任務,且身份證號未被脫敏處理,這意味著敏感信息大概率被上傳到了云端處理。

許多開發(fā)者已經(jīng)在關注數(shù)據(jù)匿名化方案,試圖讓“上云”過程更安全。比如,階躍星辰在技術報告中設想,云端的大模型不應該直接訪問原始屏幕截圖,而是接受本地GUI模型處理后的摘要。這些摘要僅包含完成任務所需的關鍵語義,不包含敏感的細節(jié)信息。

但愿景離現(xiàn)實還有很長距離。北京師范大學最新發(fā)布的一篇論文指出,現(xiàn)有GUI Agent的隱私識別能力很弱,只有13.3%的概率準確識別出安卓屏幕里的隱私信息。也就是說,智能體幾乎意識不到自己正在看隱私,離合格的數(shù)據(jù)保護還很遠。

“最大的擔憂還是在這里,你在手機屏幕里看到的一切內(nèi)容,理論上都會暴露給一個智能體。無論是加密還是直接傳原始數(shù)據(jù),最終一定程度上都是可以被還原的?!睆堮Y說。

開發(fā)者當然可以為此承諾最小化收集、不留存等安全措施,但問題在于,數(shù)據(jù)已經(jīng)交出去了——如何使用,取決于要不要相信它們的安全機制和自我約束。

隱私悖論曾在互聯(lián)網(wǎng)時代反復上演,用戶為了便利交出隱私,但難以控制它們究竟被如何利用。手機智能體的風險更大,因為它不再針對單個App,而是整合全景數(shù)據(jù)。這既是技術難題,也是信任拷問。

豆包手機助手發(fā)售后,最顯性的阻力來自于App。發(fā)售第二天,多位購買了努比亞M153手機的用戶反映微信突然被強制下線,提示“登錄環(huán)境存在異?!薄N⑿畔嚓P人士表示,可能觸發(fā)了安全風控措施。

微信率先反應后,阿里系、美團系等App集體“限制”了豆包操作,來自努比亞設備的賬號無法正常登錄。由于許多高頻生活類App無法調(diào)動,“AI手機”的核心賣點迅速塌縮。

“兩方誰有問題?其實做法都有點問題。”在手機廠商和互聯(lián)網(wǎng)公司都工作過的業(yè)內(nèi)人士指出,App 不該徹底拒絕互聯(lián),但 Agent 也沒有理由要求強制開放。在發(fā)展和安全的外皮之下,“現(xiàn)在純屬是商業(yè)行為”。

行業(yè)的一個共識是:手機智能體尚未探索出合理的分潤模式,各方手中握有的籌碼、顧慮也不盡相同,這些都增加了達成商業(yè)共識的難度。

App的防御并不意外。此前,OPPO的“AI一鍵記賬”功能就曾在上線不到一個月后,被微信從支持列表中移除。過去一年,行業(yè)已經(jīng)對自動化截屏與操作保持警惕,只是豆包第一次把能力邊界推到極限。

這背后的動機已經(jīng)被反復討論。可能影響平臺的安全運行是一方面;另一方面,一旦智能體能完全替代真人操作手機,短期沖擊的活躍度、使用時、廣告曝光的核心商業(yè)指標,長期還可能讓App被管道化(OTT化),退化為智能體的工具零件。

除了App,還有一條水下暗流是手機廠商。

智能體要接管手機,目前必須擁有手機系統(tǒng)權限才行。尤其對豆包、智譜、階躍星辰等第三方入局者來說,談攏硬件廠商是上路的第一關。

我們了解到,字節(jié)跳動在2024年就開始接觸中興等手機廠商,希望手機AI助手的入口和流量完全轉給豆包。作為交換,字節(jié)愿意免除手機廠商的托管費,并承擔AI助手的Token調(diào)用成本。

Token成本是各個手機廠商看重的問題之一,智譜也跟手機廠商提出過類似方案,改為按設備數(shù)量進行整機收費。這是因為智能體調(diào)用頻繁、消耗巨大,長期的算力成本反而可能侵蝕硬件利潤。

但即便字節(jié)拋出誘人的商業(yè)條件,當時也并未打動中興之外的手機廠商,原因不只是性價比。據(jù)《財新》報道,智能體需要硬件廠商開放系統(tǒng)級權限,包括攝像頭、指紋識別等物理傳感器的開關。手機廠商普遍不愿意將系統(tǒng)級權限直接開放給App開發(fā)者,尤其是字節(jié)跳動這種全能巨頭。

“這只是表層理由。”曾參與談判的業(yè)內(nèi)人士向我們指出,本質(zhì)還是因為字節(jié)的方案不符合手機廠商的AI戰(zhàn)略。一方面,主流手機廠商都有自己的AI團隊,不會輕易讓渡系統(tǒng)AI助手這一核心入口;另一方面,字節(jié)當時并未想清楚AI助手到底要做什么,“手機整個產(chǎn)線都是成本,沒有辦法拿整個身家賭一個AI的前途。”

一位頭部手機廠商負責人直言,如果?個產(chǎn)品推出第?天,?部分服務都不能?了,“在我們這?就是質(zhì)量事故,是沒法接受的。”大部分消費者的手機購買決策依據(jù)是系統(tǒng)流暢度、續(xù)航和發(fā)熱,在消費品戰(zhàn)場,產(chǎn)品穩(wěn)定性遠比AI創(chuàng)新更重要。

不過,這并不意味著手機廠商處于防御狀態(tài),而是在謹慎評估。

我們了解到,字節(jié)仍在推進與硬軟件廠商的雙線談判。根據(jù)《智能涌現(xiàn)》披露,字節(jié)已于去2025年底開啟豆包手機助手正式版項目,新機預計將于2026年Q2中晚期發(fā)布。有供應鏈人士稱,豆包二代手機依舊合作中興努比亞,由中興負責硬件,豆包負責AI。

推進的關鍵是豆包驗證了市場需求,即用戶愿意為智能體能力買單。我們獲得的一份OPPO內(nèi)部講話顯示,Color OS 智慧產(chǎn)品研發(fā)總監(jiān)稱豆包手機助手是一次“AI手機的市場教育”,讓整個生態(tài)更積極地討論合作可能性,“現(xiàn)在?家(App大廠)都變得更積極了?!?/p>

在手機廠商的視角里,用戶體驗始終是第一優(yōu)先級。考慮到這一點,多位開發(fā)者都提到,手機智能體的落地路線應該是“雙軌并行”的:高頻、標準化的場景(比如訂機票、點外賣),通過A2A等合作協(xié)議完成;非標準化的長尾場景(比如在某個學術網(wǎng)站注冊賬號),再用GUI Agent的視覺識別路線。

所謂A2A、MCP或者意圖框架,都屬于智能體與外界工具的互通方案。經(jīng)過App授權后,智能體通過API或者其他Agent調(diào)用服務,避免讀屏分析和模擬點擊。體驗更流暢、魯棒性更強,也更易形成穩(wěn)定的合規(guī)邊界,但也考驗對接雙方的Agent水平。

從手機智能體興起以來,這類合作路線就一直存在,難點始終在于“摸著石頭過河”——合作沒有先例,即使只期望覆蓋一部分高頻App場景,也需要復雜的商務談判和技術對齊。

“現(xiàn)在還是一個非常早期的階段,肯定說不上有成熟的標準”,前述OPPO負責人坦言。協(xié)議需要標準化,尤其需要回答流量分成、數(shù)據(jù)回流以及用戶上下文隱私處理等核心問題,否則合作會變得不可控。

據(jù)我們的了解,阿里在內(nèi)的部分App與字節(jié)跳動達成停火協(xié)議,App允許努比亞設備的正常登錄,而豆包主動限制AI操作場景,雙方回到“井水不犯河水”的狀態(tài)。

我們于2月10日核查,在微信、淘寶、淘寶閃購、美團、支付寶、拼多多、高德地圖App中,努比亞設備的用戶可以正常登錄,不會再彈出“登錄環(huán)境異?!钡奶崾荆欢拱謾C助手會主動提示,自己不可操作上述App。

至于進一步的合作意愿如何?許多業(yè)內(nèi)人士的判斷是:阿里系可能更愿意探索,因為自身也在推進智能體戰(zhàn)略。最近千問App開始接入淘寶、支付寶、閃購、飛豬、高德,甚至“想復刻一個豆包手機都沒有任何問題”。

而騰訊系一直是堅定的防守陣營。自2024年起,騰訊已經(jīng)意識到端側智能體可能對自身生態(tài)造成沖擊,但沒想到最終跑出來的是字節(jié)跳動。目前的處境也比較微妙,自家的元寶還在補作業(yè)階段,微信生態(tài)對接入Agent尤其謹慎,防守仍是當前的最優(yōu)解。

豆包方面回復我們稱,目前仍在積極尋求與各應用廠商的深度溝通,希望推動形成更加清晰、可預期的規(guī)則,避免用一刀切的方式,否定用戶合理使用 AI 的權利。

豆包手機助手被微信安全彈窗“封堵”,讓不少人想起十多年前的3Q大戰(zhàn)。彼時,360以“隱私保護器”為由攔截QQ,騰訊則以不正當競爭為由反擊,宣布裝有360軟件的電腦無法運行QQ。雙方從2010年互掐到2014年,成為中國互聯(lián)網(wǎng)史上標志性的反壟斷與競爭秩序案件。

映射到今天,爭議依然圍繞平臺的邊界,“只不過一個是主張對方篡改功能屏蔽廣告,構成不正當競爭;另一個是通過高系統(tǒng)權限繞過App風控,以動搖以App為中心的移動互聯(lián)格局。”合規(guī)從業(yè)者李汶龍撰文寫道。

當前的期望在,尋找同一個概念錨點,至少讓不同方在同一個法律框架之下同頻對話。多位合規(guī)從業(yè)者向我們提到,他們認為錨點應該是“互操作性”。

互操作性不是一個新概念。20世紀末,歐美監(jiān)管機構將大型電信運營商視為公共基礎設施,要求電話網(wǎng)絡必須開放互通。由此確立的互聯(lián)互通概念,也影響了此后幾十年的互聯(lián)網(wǎng)環(huán)境。

到了AI時代,互聯(lián)互通升級為更深入的功能操作,邊界也需要重新摸索。

海外已經(jīng)有了一些進展。谷歌的情況與字節(jié)頗為相似,三星等手機廠商需要以谷歌的智能體為端側AI入口。今年1月,歐盟對此啟動了兩項互操作性的程序,要谷歌履行《數(shù)字市場法案》(DMA)義務。

兩項程序中,一是針對AI服務,要求谷歌向第三方AI提供與Gemini同等級的系統(tǒng)訪問權;二是針對搜索業(yè)務,要求谷歌以公平、合理和非歧視(FRAND)條款,向第三方搜索引擎開放匿名排名、查詢、點擊和瀏覽數(shù)據(jù)。

如果把這一語境置換為國內(nèi)市場,意味著字節(jié)、手機廠商不準利用底層權限“拉偏架”,指定自家的手機助手為唯一入口,必須給第三方平等接入的機會。而頭部的APP廠商也不能利用自己的生態(tài)地位構建閉環(huán),架空系統(tǒng)入口。雙方堅持公平、合理和非歧視的FRAND原則,才有往前走的可能性。

尋找錨點只是第一步,進一步的問題是,誰有能力號召和落地規(guī)則。

多位研發(fā)者提到,他們認為可以參考蘋果的生態(tài)位。蘋果當年的做法是,提供一套開發(fā)者套件,讓所有 App 開發(fā)者自己去決定,哪些能力可以通過 Siri 這樣的系統(tǒng)級助手被調(diào)用,哪些不可以。

具體來說,通過App Intents框架,Siri只調(diào)度開發(fā)者授權的功能接口,而不直接觸達底層數(shù)據(jù)。而針對 App 廠商最擔憂的數(shù)據(jù)控制權之爭,蘋果設備僅在用戶請求時,向私有云發(fā)送必要數(shù)據(jù),私有云處理完請求后立即刪掉數(shù)據(jù),即“閱后即焚”。

這樣一來,硬件級的隱私設計能打消App 廠商被“吃掉”的恐懼,App方保住了數(shù)據(jù)資產(chǎn),獲得了流量;手機獲得了AI能力升級;用戶也獲得相對可控的隱私體驗。

但這是一種非常理想化的方案,幾乎是國內(nèi)廠商難以復制的終點。畢竟蘋果的處理方案,本質(zhì)建立在自研芯片和絕對生態(tài)霸主的基礎之上。

Carrie向我們直言:“往深里走,會發(fā)現(xiàn)都是芯片和內(nèi)存的問題”,芯片和端側AI是當前產(chǎn)業(yè)的高門檻工程。豆包也在回復中談到,在當下的產(chǎn)業(yè)落地,云端處理相比端側有明顯優(yōu)勢,復雜 AI 模型在手機上運行會能力大幅降低,還會導致耗電快、手機發(fā)熱、內(nèi)存不足等問題。

這構成了國內(nèi)智能體落地的矛盾,似乎沒有一家公司同時具備硬件供應鏈、隱私技術與生態(tài)號召力三體合一的底氣,去引領安全方案與商業(yè)步伐。

不少人因此認為,只有出現(xiàn)一個真正破圈的“超級智能體”才能打破僵局。到那時,就像傳統(tǒng)出租車面對網(wǎng)約車平臺一樣,沒有端側智能體的“登船票”就會被甩下——這當然是一個技術上的樂觀預期,卻是商業(yè)與隱私治理的悲觀前景。

撰文|肖瀟 王俊

測評|王俊 肖瀟 王安宇 張曉寒 卜宋博 章馳

制圖|肖瀟 黎旭亭 黃蘭雯

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
“太恐怖,iPhone半夜自己給陌生人打47分鐘電話!”

“太恐怖,iPhone半夜自己給陌生人打47分鐘電話!”

都市快報橙柿互動
2026-02-25 11:28:41
美媒解讀東契奇拒投絕殺后唇語:詹姆斯讓我傳球,我就傳了

美媒解讀東契奇拒投絕殺后唇語:詹姆斯讓我傳球,我就傳了

懂球帝
2026-02-26 09:45:10
全球第三經(jīng)濟大國陷困境,1.8萬家企業(yè)破產(chǎn),倒向中國

全球第三經(jīng)濟大國陷困境,1.8萬家企業(yè)破產(chǎn),倒向中國

無情有思可
2026-02-26 21:44:20
比亞迪連續(xù)40個月銷冠被終結

比亞迪連續(xù)40個月銷冠被終結

大象新聞
2026-02-24 09:44:05
中國男籃贏球仍有一人該批!王牌前鋒在場輸10分,郭士強認清現(xiàn)實

中國男籃贏球仍有一人該批!王牌前鋒在場輸10分,郭士強認清現(xiàn)實

老葉評球
2026-02-26 21:40:12
生在豪門又有啥用?被父母拉黑的“百億少爺”向佑,早已斷了財路

生在豪門又有啥用?被父母拉黑的“百億少爺”向佑,早已斷了財路

洲洲影視娛評
2026-02-26 13:39:04
哇塞!哈登這一傷,球迷的道心破碎成渣渣了……

哇塞!哈登這一傷,球迷的道心破碎成渣渣了……

體育新角度
2026-02-26 16:48:20
4連勝到手!中國男網(wǎng)一哥進8強,創(chuàng)2大紀錄,做到1點重返TOP100!

4連勝到手!中國男網(wǎng)一哥進8強,創(chuàng)2大紀錄,做到1點重返TOP100!

劉姚堯的文字城堡
2026-02-26 18:12:29
大漲117%!000711,停牌核查

大漲117%!000711,停牌核查

中國基金報
2026-02-26 23:07:14
明朝“最懶”的對聯(lián):上聯(lián)和下聯(lián)一字不差,卻成千古絕對流傳至今

明朝“最懶”的對聯(lián):上聯(lián)和下聯(lián)一字不差,卻成千古絕對流傳至今

銘記歷史呀
2026-02-03 16:11:20
具俊曄清空賬號已回韓國,玥兒姐弟轉學回北京,大S沒什么遺憾了

具俊曄清空賬號已回韓國,玥兒姐弟轉學回北京,大S沒什么遺憾了

一娛三分地
2026-02-26 19:20:14
女航天員王亞平,因工作常年沒回家,和丈夫的關系一句話道出真相

女航天員王亞平,因工作常年沒回家,和丈夫的關系一句話道出真相

掉了顆大白兔糖
2026-02-25 07:07:28
給領導送禮,這4種行為最招厭,送了不如不送

給領導送禮,這4種行為最招厭,送了不如不送

第一管理
2026-02-25 15:51:03
南京城管局原副局長司徒幸福被查,幸福生活按下暫停鍵

南京城管局原副局長司徒幸福被查,幸福生活按下暫停鍵

江南江南
2026-02-26 14:59:39
很抱歉,考慮停更,去做小紅書了

很抱歉,考慮停更,去做小紅書了

智先生
2026-02-26 21:05:33
60度電池、油箱50L,“哪哪都大”的新能源車,是不是工業(yè)雞肋?

60度電池、油箱50L,“哪哪都大”的新能源車,是不是工業(yè)雞肋?

少數(shù)派報告Report
2026-02-25 07:49:41
受權發(fā)布|全國人民代表大會常務委員會批準任免的名單

受權發(fā)布|全國人民代表大會常務委員會批準任免的名單

新華社
2026-02-26 21:25:21
售價36.8萬起,2026款寶馬5系官宣正式上市!

售價36.8萬起,2026款寶馬5系官宣正式上市!

Sky車志
2026-02-25 10:10:26
2026.2.26圍棋賽事:棋仙戰(zhàn)決賽3番棋第2局,王星昊執(zhí)白勝樸廷桓

2026.2.26圍棋賽事:棋仙戰(zhàn)決賽3番棋第2局,王星昊執(zhí)白勝樸廷桓

每日棋事
2026-02-26 22:06:46
劉少昂女友曬照力挺:我看到你的付出!她曾是花滑運動員身材曼妙

劉少昂女友曬照力挺:我看到你的付出!她曾是花滑運動員身材曼妙

Emily說個球
2026-02-26 12:35:25
2026-02-26 23:40:49
21世紀經(jīng)濟報道 incentive-icons
21世紀經(jīng)濟報道
中國商業(yè)新聞領導者
234635文章數(shù) 743748關注度
往期回顧 全部

科技要聞

單季營收681億凈利429億!英偉達再次炸裂

頭條要聞

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

頭條要聞

男子因銀行系統(tǒng)錯誤"欠款1000萬億":工廠可能會被拍賣

體育要聞

從排球少女到冰壺女神,她在米蘭冬奧練出6塊腹肌

娛樂要聞

向華強公開表態(tài) 財產(chǎn)留給兒媳婦郭碧婷

財經(jīng)要聞

中國AI調(diào)用量超美國 4款大模型霸榜前5

汽車要聞

40歲的吉利,不惑于內(nèi)外

態(tài)度原創(chuàng)

數(shù)碼
健康
教育
家居
軍事航空

數(shù)碼要聞

庫克預告下周一蘋果新品發(fā)布!且不止一款產(chǎn)品

轉頭就暈的耳石癥,能開車上班嗎?

教育要聞

學習的真正對手,是精力分配失衡

家居要聞

歸隱于都市 慢享自由

軍事要聞

美政府給新伊核協(xié)議設限內(nèi)容遭披露

無障礙瀏覽 進入關懷版