国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

基于智能流程自動化的手機(jī)檢測方法研究

0
分享至

通信世界網(wǎng)消息(CWW)生成式AI與智能手機(jī)的深度融合引發(fā)了多模態(tài)交互場景的爆發(fā),導(dǎo)致終端功能檢測的復(fù)雜性與狀態(tài)不確定性激增[1]。傳統(tǒng)腳本回放方案難以應(yīng)對動態(tài)彈窗、跨系統(tǒng)協(xié)同等復(fù)雜邏輯,導(dǎo)致約30%的場景仍需要人工干預(yù),測試效率與一致性瓶頸凸顯。

與此同時,智能流程自動化(Intelligent Process Automation,IPA)融合計算機(jī)視覺、自然語言處理等技術(shù),在財務(wù)、審計等領(lǐng)域已展現(xiàn)出處理非結(jié)構(gòu)化數(shù)據(jù)與支持復(fù)雜決策的能力[2]。然而,目前IPA研究對具備多模態(tài)感知、實(shí)時交互與跨系統(tǒng)協(xié)同特征的手機(jī)測試場景關(guān)注不足[3]。本文首次系統(tǒng)性探索將IPA框架引入手機(jī)檢測領(lǐng)域,旨在實(shí)現(xiàn)“智能識別—動態(tài)決策—自動執(zhí)行”的閉環(huán)。

感知層:集成YOLOv11(一種目標(biāo)檢測算法)與OCR(光學(xué)字符識別技術(shù)),實(shí)現(xiàn)PC與移動端彈窗的統(tǒng)一目標(biāo)檢測與文本識別。

決策層:通過關(guān)鍵語義提取與模糊匹配,將測試需求映射為原子化動作序列,以提升腳本在動態(tài)環(huán)境中的穩(wěn)健性。

執(zhí)行層:結(jié)合ADB(安卓調(diào)試橋)與視覺驅(qū)動RPA(機(jī)器人流程自動化),實(shí)現(xiàn)跨系統(tǒng)端到端協(xié)同控制。

實(shí)踐表明,在無線緊急警報(WEA)等復(fù)雜場景下,該方法使測試效率提升超50%,并支持多終端一致性無人值守測試,為AI時代智能終端的自動化檢測提供了高效的技術(shù)方案。

1 相關(guān)領(lǐng)域現(xiàn)狀

IPA作為RPA智能化演進(jìn)的成果,通過集成機(jī)器學(xué)習(xí)、計算機(jī)視覺(CV)與自然語言處理(NLP)技術(shù),實(shí)現(xiàn)了從“基于規(guī)則”向“數(shù)據(jù)驅(qū)動決策”的范式轉(zhuǎn)型[2]。雖然在金融、制造及網(wǎng)絡(luò)運(yùn)維等領(lǐng)域,IPA處理非結(jié)構(gòu)化數(shù)據(jù)與復(fù)雜業(yè)務(wù)的能力得到驗(yàn)證[1,2],但在手機(jī)測試這類界面變更頻繁、數(shù)據(jù)形態(tài)復(fù)雜,以及流程因操作反饋或系統(tǒng)狀態(tài)不同而存在多種可能路徑的場景中應(yīng)用尚淺。

在技術(shù)并行層面,基于YOLO與OCR的視覺感知技術(shù)有效提升了移動端UI檢測的魯棒性[1,4];與此同時,基于大模型構(gòu)建、以Trident為代表的多模態(tài)框架,在GUI自動化探索方面取得了顯著進(jìn)展[5]。然而,現(xiàn)有研究仍存在以下局限性:首先是協(xié)同缺失,多聚焦單端App或特定目標(biāo)識別,缺乏PC測試平臺與移動終端之間的跨系統(tǒng)協(xié)同控制;其次是映射斷層,難以實(shí)現(xiàn)復(fù)雜測試規(guī)程與彈窗語義之間的深度映射;最后是閉環(huán)能力不足,尚未形成系統(tǒng)性的端到端自動化流程。

綜上所述,雖然IPA的有效性及多模態(tài)技術(shù)的感知能力已得到驗(yàn)證[1,2,5],但將IPA的“感知—決策—執(zhí)行”閉環(huán)能力系統(tǒng)性引入手機(jī)檢測領(lǐng)域的研究仍是空白。本文以此為切入點(diǎn),旨在探索能夠應(yīng)對高復(fù)雜度多模態(tài)交互的智能化測試方案。

2 多模態(tài)IPA手機(jī)檢測平臺架構(gòu)與模塊設(shè)計

本文在IPA思路的基礎(chǔ)上,構(gòu)建了面向手機(jī)檢測的多模態(tài)動態(tài)閉環(huán)架構(gòu),整體由感知層、決策層和執(zhí)行層三部分組成,如圖1所示。系統(tǒng)通過“智能識別—動態(tài)決策—自動執(zhí)行”的閉環(huán)控制,將傳統(tǒng)腳本驅(qū)動的靜態(tài)自動化測試升級為可應(yīng)對復(fù)雜場景的智能自動化測試。


圖1 多模態(tài)IPA手機(jī)檢測平臺架構(gòu)

2.1感知模塊設(shè)計

感知模塊作為IPA平臺的底層支撐,可實(shí)現(xiàn)跨終端界面的高魯棒性統(tǒng)一感知。

彈窗目標(biāo)檢測:為適配測試過程中頻繁出現(xiàn)的各類彈窗提示,本文利用 YOLOv11構(gòu)建檢測模型,針對PC與手機(jī)端異構(gòu)界面(不同分辨率及風(fēng)格)進(jìn)行實(shí)時掃描,實(shí)現(xiàn)彈窗區(qū)域的精確回歸與定位,為后續(xù)分析鎖定感興趣區(qū)(ROI)。

文本與圖標(biāo)語義解析:在獲得彈窗區(qū)域后,集成PaddleOCR并融合空間拓?fù)涮卣鳎瑢OI內(nèi)的文本與功能圖標(biāo)進(jìn)行分塊提取。

2.2 決策模塊設(shè)計

決策模塊的任務(wù)是將感知結(jié)果映射為具體測試任務(wù)和操作意圖。該模塊首先將復(fù)雜的測試規(guī)程解構(gòu)為文本校驗(yàn)、圖標(biāo)匹配及屏幕交互等原子化任務(wù)。針對異構(gòu)系統(tǒng)版本差異、多語言環(huán)境下提示語的不規(guī)范,該模塊引入了基于萊文斯坦距離(Levenshtein Distance)的模糊匹配機(jī)制,通過度量感知文本與預(yù)期規(guī)程之間的語義相似度,實(shí)現(xiàn)操作意圖的精準(zhǔn)判定。這種機(jī)制有效解決了傳統(tǒng)腳本依賴固定字符匹配的問題,顯著增強(qiáng)了系統(tǒng)在語義表述差異場景下的自適應(yīng)性與決策魯棒性,實(shí)現(xiàn)了復(fù)雜測試路徑的閉環(huán)。

2.3 執(zhí)行模塊與原子動作庫

執(zhí)行模塊旨在將高層決策意圖轉(zhuǎn)化為針對終端及環(huán)境的具體物理操作,是實(shí)現(xiàn)端到端自動化的關(guān)鍵一環(huán)。

原子動作庫設(shè)計:針對屏幕交互、系統(tǒng)設(shè)置(如飛行模式、時鐘同步)及多模態(tài)通信等底層規(guī)程,構(gòu)建標(biāo)準(zhǔn)化原子動作集。通過將復(fù)雜操作解構(gòu)為參數(shù)化、可調(diào)用的獨(dú)立函數(shù)接口,確保執(zhí)行層對異構(gòu)終端的高效驅(qū)動與高度適配。

低代碼封裝與流程編排:遵循IPA架構(gòu)理念,將原子動作進(jìn)一步封裝為高階邏輯組件。系統(tǒng)可依據(jù)決策模塊輸出的指令序列,通過動作庫的自動化組合與流程編排,實(shí)現(xiàn)測試路徑的動態(tài)構(gòu)建。

3 IPA手機(jī)檢測方法的實(shí)現(xiàn)細(xì)節(jié)

基于IPA架構(gòu)的多模態(tài)測試平臺以無線緊急警報場景為牽引,實(shí)現(xiàn)了“用例管理—界面感知—決策路由—閉環(huán)執(zhí)行”的自動化流水線。

3.1 彈窗檢測模型設(shè)計與訓(xùn)練

為兼顧檢測精度與實(shí)時性,感知層采用輕量化YOLOv11n網(wǎng)絡(luò),采集并人工標(biāo)注涵蓋PC與移動端的1000個異構(gòu)彈窗樣本,在RTX 3060硬件環(huán)境下進(jìn)行300輪次迭代(Batch Size=64),模型實(shí)現(xiàn)了對多分辨率、多風(fēng)格彈窗區(qū)域的精準(zhǔn)回歸。

3.2 文字識別與關(guān)鍵語義提取算法

語義解析的準(zhǔn)確性直接影響決策邏輯的穩(wěn)健性,針對YOLO返回的檢測框,通過對彈窗內(nèi)關(guān)鍵元素(如警告文本、交互按鈕)的空間分布統(tǒng)計,引入比例分割算法進(jìn)行區(qū)域預(yù)處理。該算法有效解決了異構(gòu)界面下的內(nèi)容偏移問題,配合OCR顯著提升了關(guān)鍵語義的識別精度,為后續(xù)決策路由提供了高質(zhì)量的結(jié)構(gòu)化數(shù)據(jù)支撐。

將目標(biāo)區(qū)域分割成上、中、下三部分之后(如圖2所示),即可對內(nèi)容進(jìn)行分塊提取。其中,中間區(qū)域的內(nèi)容主要用于提取操作的關(guān)鍵提示詞;下面區(qū)域的內(nèi)容主要用于提取按鈕所在的位置,以便后續(xù)的點(diǎn)擊操作。所有提取的信息均須進(jìn)行統(tǒng)一的大小寫格式轉(zhuǎn)換,以免因格式差異導(dǎo)致匹配錯誤,進(jìn)而影響執(zhí)行準(zhǔn)確率。


圖2目標(biāo)區(qū)域分割結(jié)果

3.3 基于萊文斯坦距離的模糊匹配策略

針對OCR識別噪聲及多版本語境下的“語義漂移”問題,本文引入萊文斯坦距離構(gòu)建模糊匹配機(jī)制,即通過計算感知文本與標(biāo)準(zhǔn)詞條間的歸一化相似度,實(shí)現(xiàn)測試意圖的語義對齊。該策略彌補(bǔ)了精確匹配規(guī)則的脆弱性,顯著增強(qiáng)了系統(tǒng)在非結(jié)構(gòu)化提示語環(huán)境下的決策魯棒性。

3.4原子動作庫的設(shè)計與執(zhí)行流程實(shí)現(xiàn)

原子動作庫將復(fù)雜規(guī)程解構(gòu)為ADB指令、內(nèi)容校驗(yàn)及點(diǎn)擊執(zhí)行子庫,通過封裝ADB底層驅(qū)動,實(shí)現(xiàn)主機(jī)對終端狀態(tài)切換(如飛行模式、時鐘同步)及多模態(tài)交互的自主控制。該設(shè)計實(shí)現(xiàn)了業(yè)務(wù)邏輯與底層驅(qū)動的深度解耦,顯著提升了測試執(zhí)行效能與系統(tǒng)的跨平臺適配力。

4實(shí)驗(yàn)設(shè)計效果驗(yàn)證

本研究選取10個典型用例,構(gòu)建PC與移動端耦合的測試環(huán)境。通過50輪蒙特卡羅實(shí)驗(yàn),從執(zhí)行效能、跨終端穩(wěn)健性及故障檢出率三個維度,量化對比IPA與人工測試的性能差異,系統(tǒng)驗(yàn)證了該方案的工程可行性與可靠性。

由圖3可知,IPA系統(tǒng)能夠快速向手機(jī)端發(fā)送相關(guān)指令,自動完成測試信息比對,全程無需人工干預(yù),相比人工操作測試效率提升了約50%。此外,IPA系統(tǒng)還可在夜間自動執(zhí)行測試任務(wù),因此在測試效率上具有顯著優(yōu)勢。


圖3 終端測試工作時間對比

表1為不同被測終端測試效果對比,表2為部分測試用例執(zhí)行結(jié)果清單。綜合分析結(jié)果表明,該系統(tǒng)在異構(gòu)終端測試中表現(xiàn)出優(yōu)異的泛化性。故障注入實(shí)驗(yàn)證實(shí),系統(tǒng)能精準(zhǔn)識別所有異常樣本,具備高可靠的錯誤檢出能力與決策穩(wěn)健性,實(shí)現(xiàn)了復(fù)雜規(guī)程下的閉環(huán)自動化檢測。

表1不同被測終端測試效果對比


表2 部分測試用例執(zhí)行結(jié)果清單


5 結(jié)束語

本文旨在探索構(gòu)建集成人工智能視覺、原子動作庫技術(shù)的IPA自動化測試平臺,并在實(shí)際測試環(huán)境中檢驗(yàn)了所提方法的有效性和可靠性。未來,筆者將根據(jù)實(shí)際測試需求,進(jìn)一步完善和優(yōu)化測試平臺功能,并探索大模型等先進(jìn)人工智能技術(shù)在手機(jī)測試自動化領(lǐng)域的應(yīng)用。

參考文獻(xiàn)

[1] 周映. 基于RPA技術(shù)的網(wǎng)絡(luò)安全運(yùn)營自動化實(shí)踐應(yīng)用研究[J]. 電信科學(xué), 2024, 40(7): 164-174.

[2] 劉勤. 智能財務(wù)之流程自動化變革:從RPA到IPA. 財會月刊[J], 2024(9): 33-40.

[3] 霍麗霞. 基于圖像內(nèi)容識別的移動應(yīng)用智能檢測系統(tǒng)[J]. 警察技術(shù), 2025(1): 61-64.

[4] Anilkumar C, Rani M S, Venkatesh B, et al. Automated License Plate Recognition for Non-Helmeted Motor Riders Using YOLO and OCR[J]. Journal of Mobile Multimedia, 2024(9): 239-265.

[5] Liu Z, Li C, Chen C Y, et al. Vision-driven Automated Mobile GUI Testing via Multimodal Large Language Model[EB/OL]. (2024-07-03) [2025-11-20]. https://arxiv.org/abs/2407.03037.

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
鬧掰了?王曉晨疑發(fā)文內(nèi)涵俞灝明,言語犀利絲毫沒給對方留體面!

鬧掰了?王曉晨疑發(fā)文內(nèi)涵俞灝明,言語犀利絲毫沒給對方留體面!

娛樂團(tuán)長
2026-04-13 20:29:53
長公主被家暴流產(chǎn)了

長公主被家暴流產(chǎn)了

毒舌扒姨太
2026-04-08 22:29:19
匈牙利變局重創(chuàng)普京,3大損失難挽回,俄烏戰(zhàn)局徹底扭轉(zhuǎn)

匈牙利變局重創(chuàng)普京,3大損失難挽回,俄烏戰(zhàn)局徹底扭轉(zhuǎn)

書寫傳奇
2026-04-14 06:14:39
中年返貧4件套,一個也不要碰!

中年返貧4件套,一個也不要碰!

細(xì)說職場
2026-04-13 12:36:59
靠結(jié)婚化債的小仙女越來越多了!

靠結(jié)婚化債的小仙女越來越多了!

黯泉
2026-04-13 08:57:38
不到24小時慘遭打臉!賴清德竄訪非洲吃癟

不到24小時慘遭打臉!賴清德竄訪非洲吃癟

阿離家居
2026-04-14 13:05:10
后來,我才明白,斷聯(lián)后不刪除、不拉黑、不聯(lián)系的人,不是在等對方回頭,而是在等自己放下

后來,我才明白,斷聯(lián)后不刪除、不拉黑、不聯(lián)系的人,不是在等對方回頭,而是在等自己放下

品讀時刻
2026-04-12 09:08:19
換奧巴馬,這兩名美軍F-15飛行員幾乎必死

換奧巴馬,這兩名美軍F-15飛行員幾乎必死

民間胡扯老哥
2026-04-11 10:30:51
合租四年的女生要辭職相親,我開玩笑說嫁我,她的反應(yīng)意外了

合租四年的女生要辭職相親,我開玩笑說嫁我,她的反應(yīng)意外了

霧島夜話
2026-04-11 12:24:27
周總理只是讓他去經(jīng)商,為黨賺取經(jīng)費(fèi),他卻給組織賺回個商業(yè)帝國

周總理只是讓他去經(jīng)商,為黨賺取經(jīng)費(fèi),他卻給組織賺回個商業(yè)帝國

鶴羽說個事
2026-04-02 23:00:01
這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時尚真看不懂

這跟不穿有啥區(qū)別?內(nèi)褲外露、開叉開到腰,有錢人的時尚真看不懂

潮鹿逐夢
2026-03-02 17:19:02
伊朗內(nèi)部分歧,前往巴基斯坦與美國談判的人并不掌握權(quán)力

伊朗內(nèi)部分歧,前往巴基斯坦與美國談判的人并不掌握權(quán)力

山河路口
2026-04-10 23:59:10
17歲成都男孩已被16所名校錄??!他的母校,高知家長首選!

17歲成都男孩已被16所名校錄取!他的母校,高知家長首選!

成都好學(xué)校
2026-04-14 10:56:45
回京第二天,馬筱梅凌晨3點(diǎn)哭紅雙眼,曝為何汪寶兒不能住奶奶家

回京第二天,馬筱梅凌晨3點(diǎn)哭紅雙眼,曝為何汪寶兒不能住奶奶家

阿紿聊社會
2026-04-14 12:08:13
和李榮浩同居4年卻慘遭拋棄,陷入抑郁多年,如今39歲仍是單身

和李榮浩同居4年卻慘遭拋棄,陷入抑郁多年,如今39歲仍是單身

君笙的拂兮
2026-04-13 11:45:52
安宰賢被傳"世界Gay"8年,上綜藝一句話把K.Will整不會了

安宰賢被傳"世界Gay"8年,上綜藝一句話把K.Will整不會了

娛圈觀察員
2026-04-14 08:13:17
錫安-威廉森:我真的很想打季后賽,對此我愿意承擔(dān)責(zé)任

錫安-威廉森:我真的很想打季后賽,對此我愿意承擔(dān)責(zé)任

懂球帝
2026-04-14 11:18:21
美國一旦霸權(quán)結(jié)束,一定會滅亡的三個國家,排第一的果然是它

美國一旦霸權(quán)結(jié)束,一定會滅亡的三個國家,排第一的果然是它

今夜繁星墜落
2026-04-07 02:36:47
網(wǎng)友投訴張雪機(jī)車業(yè)務(wù)員“太狂”,張雪本人回應(yīng):提供證據(jù),獎勵1萬

網(wǎng)友投訴張雪機(jī)車業(yè)務(wù)員“太狂”,張雪本人回應(yīng):提供證據(jù),獎勵1萬

極目新聞
2026-04-13 11:56:44
美國《洛杉磯時報》:電池霸權(quán)!四川宜賓逼停歐洲電池巨頭

美國《洛杉磯時報》:電池霸權(quán)!四川宜賓逼停歐洲電池巨頭

華庭講美食
2026-04-13 03:11:54
2026-04-14 14:47:00
通信世界 incentive-icons
通信世界
多維度 全媒體 整合傳播
12417文章數(shù) 30444關(guān)注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

恒大集團(tuán)、恒大地產(chǎn)及許家印案開庭 許家印認(rèn)罪悔罪

頭條要聞

恒大集團(tuán)、恒大地產(chǎn)及許家印案開庭 許家印認(rèn)罪悔罪

體育要聞

他做對了所有事,卻被整個職業(yè)網(wǎng)壇放逐了八年

娛樂要聞

宋祖兒劉宇寧戀情大反轉(zhuǎn) 正主火速辟謠

財經(jīng)要聞

許家印受審當(dāng)庭表示認(rèn)罪悔罪

汽車要聞

長城歐拉5限定版純電版上市 限量99臺售價13.38萬元

態(tài)度原創(chuàng)

數(shù)碼
旅游
家居
教育
時尚

數(shù)碼要聞

TCL T7M Pro體驗(yàn):SQD-Mini LED技術(shù)加持,客廳換代首選

旅游要聞

申然:塞班軍艦島,一眼淪陷的藍(lán)綠秘境

家居要聞

現(xiàn)代融合 自然靈動

教育要聞

2026高考考生注意!7所高校全部啟動

今年科切拉的風(fēng)吹向了誰?

無障礙瀏覽 進(jìn)入關(guān)懷版