国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

跑分超過Atlas,F(xiàn)lowith 發(fā)了一個最激進的Agent(文末附邀請碼)|一手鮮測

0
分享至


作者 | 黃小藝
郵箱 | huangxiaoyi@pingwest.com

OpenAI發(fā)布Atlas不到一周,F(xiàn)lowith就帶著他們全新的“瀏覽器產品”——FlowithOS,加入了戰(zhàn)局。

這不僅是一次基模廠商和應用層創(chuàng)業(yè)者的正面相遇,F(xiàn)lowith的新產品,有著更大的野心。

你可以從產品的命名看出,盡管以瀏覽器的形態(tài)存在,但FlowithOS的定位是全球首個為 Agent 原生設計的智能體操作系統(tǒng)(Agentic Workspace)。

簡單來說,它不再是一個網頁或插件,而是一個需要下載到電腦上的獨立應用(目前支持 macOS 和 Windows),它可以針對用戶提出的prompt任務指令,自主跨越多網頁搜索,并通過“代碼+視覺”理解用戶屏幕畫面,最終思考、進行自主操作,包括點擊、編輯、發(fā)送、保存等各類執(zhí)行的“最后一公里”。

這也意味著,這種指令的完成不再只存在于云電腦的虛擬環(huán)境中,也不再是隨時等待人類接管的半自動產品,而是真正由AI直接操控瀏覽器的“端到端”執(zhí)行。

此次發(fā)布的FlowithOS,也是繼去年Flowith發(fā)布“畫布式智能體創(chuàng)作平臺”以及今年發(fā)布Neo Agent之后的又一獨立產品形態(tài)。

從FlowithOS,再到最近Manus 1.5 讓 Agent 一句話構建應用,以及 GPT Atlas 將 AI 深度融入瀏覽器,一個清晰的趨勢是:大家都在想辦法給 AI 安上“手腳”,讓它從一個善于言辭的“對話助手”,向一個能夠處理真實世界事務的“自主執(zhí)行者”進化。

不過,和Manus 1.5 、GPT Atlas相比,F(xiàn)lowithOS 的做法顯然更為“激進”。

我們第一時間測試了 FlowithOS,并與 Flowith 團隊聊了聊,試圖搞清楚:他們?yōu)槭裁催x擇在這個時間點,用這樣一種方式入局?以及,它和市面上其他的 Agent、瀏覽器產品,有什么不一樣?

FlowithOS 核心功能:執(zhí)行、執(zhí)行,還是執(zhí)行

FlowithOS 想做的,是徹底讓Agent接手任務的全流程,做跨平臺、高自主性、可交互性的復雜工作。

它為智能體構建了一個能夠持續(xù)進化的行動空間,其核心亮點包括:

一是跨越邊界的任務交付:它讓 Agent 的行動不再局限于單一網頁或應用。通過無限步驟的上下文理解,Agent 能夠串聯(lián)起完整的端到端工作流,直接替你寫作、替你發(fā)布,將你的想法轉化為真實成果。

二是網頁理解能力:基于自研的“代碼+視覺”雙模態(tài)理解框架。該框架在Web Agent 測試(Mind2Web)中登頂全球榜單,跑分超過了OpenAI最新發(fā)布的ChatGPT Atlas,這也意味著OS擁有更強的思考能力、網頁理解力與操作精度。


三是自主進化、自主執(zhí)行:FlowithOS 不是用完即走的工具,而是一個能獨立“上班”的數(shù)字員工,能夠勝任高頻交易監(jiān)控、社媒賬號運營等需要持續(xù)優(yōu)化的動態(tài)任務。

當然,拋開“操作系統(tǒng)”和“自主進化”這些宏大概念,F(xiàn)lowithOS 的本質是通過自動化的降本增效。它在真實場景下的任務成功率有多高,它為用戶節(jié)省的時間,是否多于花在學習、配置和補救失敗任務上的時間......我們圍繞這些問題展開了實測。

1. 基礎交互與任務執(zhí)行

打開 FlowithOS,首先是一個頗有設計感的簡潔界面,中心是一個輸入框。你可以在框中選擇 Google 進行搜索,把它當成一個普通的瀏覽器來用;或者,你可以選擇 Run Task,直接進入 Agent 模式。

同時,界面右下角的圓形按鈕,也提供了一個快捷入口,讓你隨時喚醒 Agent 發(fā)布任務。


為了降低使用門檻,F(xiàn)lowithOS 的輸入框還具備自動補全和優(yōu)化 Prompt 的功能,幫助用戶更清晰、更高效地發(fā)布任務指令。


一旦你提出任務,Agent 會在界面右側實時展示它的“思考過程”——分析任務、拆解步驟、執(zhí)行動作。同時,它會在左側的標簽頁(Tab)中自己打開新的頁面,進行跨頁面的搜索、信息整合與操作。

在OS執(zhí)行的過程中,你可以隨時點擊Pause或雙擊頁面暫停、進行接管,也可以隨時以對話的形式,輸入新的prompt調整AI接下來的進程。

理論說再多,不如直接上場景。

上周,F(xiàn)lowith 市場負責人拐子就在內測中嘗試了讓 OS 接管自己的小紅書賬號,自主創(chuàng)作并發(fā)布了一個帖子“Ask anything”,同時把回復評論的權限也完全交給了 Agent。


盡管這個 Agent 時而會冒出一些略顯“中二”的賽博人機回復,但時而又會有讓人眼前一亮的評論。最經典的莫過于下面這條,當有人問及“能不能突然給我打兩千塊”,Agent 在評論區(qū)直接 @了CEO Derek,申請開通轉賬權限,顯然是“學習”到了人類世界的組織架構。

我們也用一個真實任務測試了它的能力。背景是,我們在杭州舉辦了一場小型的 IROS 會后派對,需要邀請小紅書上對此感興趣的IROS參會用戶。這是一個非常繁瑣、重復性極高的任務,完美契合了 AI 批量執(zhí)行的場景。

結果是,當我將自己的賬號Earth權限交給了OS后,它做到了......一部分。


在這個過程中,我們嘗試了兩版 Prompt:

簡單版 Prompt:

你是 硅星人 的 AI助手,在小紅書上面搜索2025 IROS相關帖子,按時間線確保是今年的,并評論帖子,邀請他來參加我們在23號組織的After party,可以看硅星人pro主頁了解活動詳情,語氣活潑有趣一點。

因為只給出了模糊指令。在執(zhí)行過程中,OS 的成功率大約在 30% 左右。它偶爾會“神游”,比如刷著帖子摸魚;偶爾會“犯迷糊”,打開了帖子但找不到評論按鈕;有時輸入了文本卻沒有點擊發(fā)布,就自己判定任務成功了。

不過,因為并非云電腦虛擬環(huán)節(jié),用戶也可以參與AI協(xié)作,比如,在AI找不到輸入框的時候,我們滑動鼠標點開輸入框,讓AI學習這一路徑。

  • 詳細版 Prompt (由 Claude + 人工優(yōu)化): 提供了非常清晰的步驟和規(guī)則。這次,OS 的成功率飆升至接近 100%。由于它的評論速度實在太快,而我們的派對席位有限,我不得不火速終止了它“狂熱”。

[背景] 你是我的AI助手,你的任務是在小紅書平臺上推廣一場即將舉行的活動。

[目標]

平臺: 小紅書

活動: 23號的IROS After Party

目標用戶: (A) 發(fā)布了關于“2025 IROS”帖子的博主 (B) 每一個回復了這些帖子的用戶。

[核心文案格式] "你好,我是硅星人PRO的AI助手,我們在23號包場組織了一個After party,有興趣參加嗎,可以看硅星人PRO的小紅書主頁了解活動詳情[具體邀請可修改,模擬一個真誠有梗的人,而不是一個冰冷的機器]。"

[執(zhí)行流程 (自動化循環(huán))]

1、登錄: 登錄小紅書賬號。

2、搜索:使用搜索關鍵詞列表: ["2025 IROS", "IROS 杭州", "IROS 2025 杭州", "智能機器人大會 杭州"]。

3、篩選搜索結果:按“最新發(fā)布”排序,確保帖子是近期的。

遍歷帖子 (循環(huán)):

對于搜索結果中的每一個相關帖子,執(zhí)行以下操作:

4、操作A:評論博主 (OP)

打開該帖子。

定位到主評論輸入框。

輸入 [文案]。

點擊“發(fā)送”。

5、操作B:評論所有回復者

在當前帖子下,打開評論區(qū),并確保加載所有評論和回復(可能需要模擬“點擊查看更多回復”)。

遍歷(For-Each Loop)評論區(qū)中的每一條評論(無論是一級評論還是二級回復):

If 該條評論的作者 不是 你自己:

點擊該條評論的“回復”按鈕。

在@對方的輸入框中,輸入 [文案],文案按照格式,可調整。

點擊“發(fā)送”。

完成所有回復的遍歷后,返回搜索結果列表,打開下一個帖子,重復步驟4。

上下滑動查看更多內容

這個任務場景具有極 強的遷移性。任何需要批量聯(lián)系他人、進行重復性網頁操作的場景,理論上都可以交給 OS 來完成。

但現(xiàn)階段,你仍然要以足夠的耐心盯著OS不要拿你的賬號肆意妄為,并忍受長時間的、有失敗概率的任務過程。

除了這些嚴肅的工作,F(xiàn)lowith 還與我們分享了一個極具娛樂性的案例:讓 OS 幫你打德州撲克,而且還贏錢了。

這年頭,一個好的 Agent 真的可以自己出去賺錢養(yǎng)家了。目前這個 Prompt 已經被收錄在 OS 的官方示范案例中,用戶可以直接點擊運行。只是我們很好奇,如果你的 OS 在牌桌上遇到了別人的 OS,到底誰能笑到最后?


當然,除了娛樂和批量任務,由于Flowith 主站原本就擅長的深度研究領域,在沿用了 Neo 技術架構+ 真實的執(zhí)行環(huán)境后,OS也能夠閱讀更多的內容、更好地理解圖文信息、進行跨頁面瀏覽,從而給出更詳盡的報告了。

2. Skills:沉淀可復用的“肌肉記憶”

除了基礎的產品邏輯,OS 還上線了一個關鍵功能:Skills。這與 Claude 有相似之處,更側重于執(zhí)行路徑的沉淀。


當一個 Agent 第一次成功完成某個復雜任務時,比如“在小紅書上篩選特定風格的商品并加入購物車”,它可以將這個任務的最優(yōu)執(zhí)行路徑記錄下來,形成一個可復用的“Skill”。由此,下次當你或其他人需要執(zhí)行類似任務時,Agent 就可以直接調用這個已經驗證過的“肌肉記憶”。

更進一步,F(xiàn)lowithOS 團隊會將用戶高頻使用、反饋良好的任務流程,通過訓練固化為標準的 Skills,讓所有用戶的 Agent 在未來執(zhí)行該任務時都具備極高的成功率。

在目前的 Skill 庫中,OS已經可以打開你的 Claude Code 頁面來編寫代碼,也可以打開你的terminal進行操作了。同時,你也可以將自己調整好的 Skill 上傳,未來或可進行社區(qū)化的分享和傳播。

3. Memory 和 Knowledge Base:讓 Agent 更懂你

除了 Skills,Memory(記憶)系統(tǒng)和 Knowledge Base(知識庫)是讓 Agent 變得“專屬”的另外兩大支柱。

Memory 系統(tǒng)會記住你訪問過的網頁、執(zhí)行過的任務以及個人偏好。這與傳統(tǒng)瀏覽器的歷史記錄似是而非,其記錄的顆粒度要精細得多。這為 Agent 提供了豐富的個性化上下文,使其決策和行動都更貼近你的習慣。

而 Knowledge Base 則從 Flowith 主站延伸而來,允許你上傳文檔、鏈接等資料,構建屬于自己的知識庫。Agent 在執(zhí)行任務時,會優(yōu)先從這個知識庫中尋找答案和背景信息,讓它更懂你的工作領域和特定需求。

還記得上文提到的 OS 接管“拐子”小紅書賬號的案例嗎?Agent 之所以知道要 @Dereck 來申請權限,正是因為它從知識庫中知道了誰是負責人。

總而言之,在多次實測中,我們發(fā)現(xiàn) FlowithOS 對不同類型網頁的適配程度存在一定差異。在 Twitter、小紅書、微博等結構相對標準化的社交媒體平臺上,它能相對準確地識別帖子內容、理解評論語境、甚至把握平臺的“網感”來生成合適的回復。

然而,在淘寶、京東這類電商網站上,面對多重下拉菜單、動態(tài)加載的商品列表以及復雜的促銷彈窗時,它偶爾會出現(xiàn)定位不準或操作失敗的情況,對商品進行比價、對圖文商品鏈接進行整理,表現(xiàn)還不足。

Flowith 對此解釋道,“我們在此處對 Agent 使用了periodic online reinforcement learning,隨著用戶更多使用,整個 OS 會變得更加聰明?!?/p>

“產品目前仍處于公測階段,所有功能均免費開放,公測期間的核心目標是收集用戶在真實場景下的反饋和 Agent 的表現(xiàn)數(shù)據。這些寶貴的數(shù)據,將直接用于后續(xù)的Agent迭代和功能優(yōu)化?!?/p>

FlowithOS是一個Browser Agent,更是一個給Agent使用的操作系統(tǒng)

從實測結果來看,F(xiàn)lowithOS 在產品形態(tài)和底層邏輯上,與市面上其他主流的Agent產品截然不同。要理解它的獨特性,我們必須先明確它與另外兩個代表性產品 Manus 1.5 和 Atlas 的區(qū)別。

相比之下,更側重于編程能力的Manus 1.5 ,核心思路更像是在產品內部構建一個閉環(huán)的、強大的能力集。例如,它強調通過“內置”工具(tool)和配套架構,讓用戶可以直接在產品內“一句話構建應用”,將完成復雜任務所需的核心能力集成到自身。

而Atlas 首先是一個瀏覽器,Agent 在其中是一個核心但可選的“模式”,與常規(guī)瀏覽功能并存,它的重點在于從用戶使用場景切入,為用戶提供一個更完整的生態(tài)鏈路,為 Agent 提供一個更便捷的運行載體。

而FlowithOS 將自己定義為操作系統(tǒng),其瀏覽器界面僅僅是這個系統(tǒng)為 Agent 提供的“圖形界面”。與 Manus 的“內置集成”思路相反,F(xiàn)lowithOS 的核心是調度和編排外部生態(tài)的能力。

例如,在處理編程任務時,它并非自己構建一套編程工具,而是通過調用 Claude Code 等外部功能和生態(tài)來實現(xiàn)。

當我們把 FlowithOS 放置在更宏觀的 AI 產品圖景中進行審視時,會發(fā)現(xiàn)它所做的事情既有差異又有共識。

共識在于,無論是 OpenAI 的 Atlas、Manus 的 1.5,還是各類 AI 編程助手,都在不約而同地從“理解和生成”向“執(zhí)行和自主”進化。AI 不再滿足于作為一個知識問答或內容創(chuàng)作的工具,它必須進入人類的工作流,直接操作應用、完成任務,才能釋放下一階段的生產力價值。瀏覽器,作為連接人與互聯(lián)網服務的最主要入口,自然成為了這場進化的核心戰(zhàn)場。

其差異則在于,它可能是目前市面上第一個明確將自己定義為“Agent 操作系統(tǒng)”,而這決定了產品的進化路徑。FlowithOS的功能、交互設計,都是從“Agent 如何更好地執(zhí)行”這個第一性原理出發(fā),而非“人類如何更方便地使用”。

正如拐子所說:“用戶是否使用我們的 OS 作為瀏覽器其實無所謂,因為這個瀏覽器實際上是給 Agent 做操作系統(tǒng)用的,我們更希望用戶打開 OS 是讓 Agent 可以有更高權限的環(huán)境自主工作?!?/p>

在文末,我們也準備了一些邀請碼,加入公測用戶群,群內有Flowith團隊回應反饋,歡迎大家下載嘗試,為執(zhí)行 Agent 帶來更多有趣的任務場景,幫助產品在公測階段找到更多優(yōu)化的方向。

PS:邀請碼含F(xiàn)lowith主站付費會員及FlowithOS公測資格,掃描下方二維碼聯(lián)系硅星人獲取。

附下載鏈接:flowith.com

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
女航天員王亞平,因工作常年沒回家,和丈夫的關系一句話道出真相

女航天員王亞平,因工作常年沒回家,和丈夫的關系一句話道出真相

掉了顆大白兔糖
2026-02-25 07:07:28
美國要變天了?

美國要變天了?

安安說
2026-01-20 10:11:06
紐約期金突破5420美元/盎司

紐約期金突破5420美元/盎司

每日經濟新聞
2026-03-02 15:25:10
500萬英鎊輸光,住出租屋的破產冠軍,對陣開勞斯萊斯的豪門公子

500萬英鎊輸光,住出租屋的破產冠軍,對陣開勞斯萊斯的豪門公子

情感大頭說說
2026-03-01 13:41:53
美以伊激戰(zhàn)48小時!三方損失全曝光,誰最慘?后續(xù)走向徹底明朗

美以伊激戰(zhàn)48小時!三方損失全曝光,誰最慘?后續(xù)走向徹底明朗

起喜電影
2026-03-02 12:46:05
2026手機套餐新規(guī):老用戶多等7天,續(xù)約可省數(shù)百元

2026手機套餐新規(guī):老用戶多等7天,續(xù)約可省數(shù)百元

透視到底
2026-03-01 10:16:29
乾隆登基后,平反了諸多被雍正打壓的叔伯,為何不愿平反其大伯?

乾隆登基后,平反了諸多被雍正打壓的叔伯,為何不愿平反其大伯?

鶴羽說個事
2026-03-01 18:29:37
伊朗革命衛(wèi)隊宣布大規(guī)模軍事行動

伊朗革命衛(wèi)隊宣布大規(guī)模軍事行動

界面新聞
2026-02-28 18:18:55
臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

臺軍女飛行員郭文靜:只要長官敢下令,我會毫不猶豫的擊落殲20!

顧史
2026-01-21 21:04:39
“重大作戰(zhàn)”,要打多久?

“重大作戰(zhàn)”,要打多久?

中國新聞周刊
2026-02-28 20:19:57
比賽還沒開打,巴薩先迎一個致命壞消息,國王杯晉級決賽基本沒戲

比賽還沒開打,巴薩先迎一個致命壞消息,國王杯晉級決賽基本沒戲

零度眼看球
2026-03-02 13:58:36
克宮:俄方正與伊朗領導層保持持續(xù)接觸

克宮:俄方正與伊朗領導層保持持續(xù)接觸

環(huán)球網資訊
2026-03-02 19:21:46
搞笑圖片第1148期:為什么老年人總能在網上買到我們想不到的東西

搞笑圖片第1148期:為什么老年人總能在網上買到我們想不到的東西

今天的快樂
2026-03-01 21:03:56
錢再多也沒用!身價千萬的撒貝寧,面對家庭牽掛煩心事還是太多了

錢再多也沒用!身價千萬的撒貝寧,面對家庭牽掛煩心事還是太多了

不甜的李子
2026-03-02 16:59:30
苦等多年,中國最強地級市,終于要建機場了

苦等多年,中國最強地級市,終于要建機場了

快刀財經
2026-03-01 22:15:01
小米上架米家燃氣灶3猛火版,到手價899元

小米上架米家燃氣灶3猛火版,到手價899元

ZAEKE知客
2026-02-27 12:41:13
股民系好安全帶了,明天3月3號,A股牛市能否再次歷史重演?

股民系好安全帶了,明天3月3號,A股牛市能否再次歷史重演?

股市皆大事
2026-03-02 16:12:09
劉詩詩吳奇隆突然官宣!女方罕見發(fā)聲:一切早已注定...

劉詩詩吳奇隆突然官宣!女方罕見發(fā)聲:一切早已注定...

草莓解說體育
2026-03-01 15:10:45
突發(fā)!真主黨二號核心被定點清除,以色列再下狠手

突發(fā)!真主黨二號核心被定點清除,以色列再下狠手

老馬拉車莫少裝
2026-03-02 12:49:32
你占過最大的便宜是啥?網友:我也是,撿漏一個老公

你占過最大的便宜是啥?網友:我也是,撿漏一個老公

帶你感受人間冷暖
2026-02-25 00:17:46
2026-03-02 20:00:49
硅星GenAI incentive-icons
硅星GenAI
比一部分人更先進入GenAl。
244文章數(shù) 14關注度
往期回顧 全部

科技要聞

榮耀發(fā)布機器人手機、折疊屏、人形機器人

頭條要聞

美記者詢問就伊朗局勢中方會采取什么行動 外交部回應

頭條要聞

美記者詢問就伊朗局勢中方會采取什么行動 外交部回應

體育要聞

“想要我簽名嗎” 梅西逆轉后嘲諷對手主帥

娛樂要聞

美伊以沖突爆發(fā),多位明星被困中東

財經要聞

金銀大漲 市場仍在評估沖突會否長期化

汽車要聞

國民SUV再添一員 瑞虎7L靜態(tài)體驗

態(tài)度原創(chuàng)

親子
游戲
家居
藝術
房產

親子要聞

阿寶和藏區(qū)老二居然就差一天的生日時間,今天我們給他們過生日哦

《王者榮耀世界》終于定檔!你會第一時間玩嗎?

家居要聞

萬物互聯(lián) 享科技福祉

藝術要聞

簡約的風景畫,美國畫家Ben Bauer作品

房產要聞

方案突然曝光!??诒睅煷蟾叫#钟袝蟊P殺出!

無障礙瀏覽 進入關懷版