国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

搶先實(shí)測豆包1.8模型,多模態(tài)Agent超強(qiáng)!

0
分享至


這是蒼何的第 463 篇原創(chuàng)!

大家好,我是人在火山大會(huì)的蒼何。


說實(shí)話,我現(xiàn)在就在火山引擎 FORCE 原動(dòng)力大會(huì)的現(xiàn)場,人太多了,多到要擠著才能進(jìn)來。


這一年也見證了豆包大模型的快速成長,今天豆包大模型 1.8 也正式發(fā)布。

這次模型的更新帶來了更強(qiáng)的 Agent 能力和多模態(tài)理解能力,在公開測試集中的表現(xiàn)相對(duì)于豆包 1.6有了很大的提升。


不少能力都可以和其他全球頂尖模型一爭高下,在不同場景維度下的測試集表現(xiàn)也很出色。


豆包大模型 1.8 大幅增強(qiáng)工具調(diào)用(Tool Use)能力,長文和多輪指令遵循大幅度增強(qiáng),Coding能力也顯著增強(qiáng)。

具備 OS Agent 落地能力,支持 Agent 完成屏幕操作任務(wù)。模型格式輸出更穩(wěn)定,執(zhí)行規(guī)劃能力和復(fù)雜流程理解再提升,更適合復(fù)雜多步多分支的企業(yè)級(jí) Agent 任務(wù)。


同時(shí)視覺理解基礎(chǔ)能力大幅躍升,圖片理解Tokens消耗更少,理解精度更高,單次視頻理解幀數(shù)從640幀提升至1280幀,(在1秒1幀的情況下,可支持20分鐘長視頻理解)。

同時(shí)火山方舟應(yīng)用實(shí)驗(yàn)室還支持Video Cup Tool體驗(yàn):新增低幀率(如每5s一幀)查看完整視頻后,聚焦某個(gè)與問題強(qiáng)相關(guān)的視頻片段,正?;蚋邘剩ㄈ缑?s一幀或5幀)具體理解并回答問題。

模型推理能力更出色,支持思考長度可調(diào)節(jié),各模式下思考更加精簡,Tokens更節(jié)省。


關(guān)于模型信息更新信息給大家介紹完畢,接下來是帶來一手實(shí)測,其實(shí)前些天就拿到了內(nèi)測資格,這次測試我更聚焦于實(shí)際 Agent復(fù)雜場景,而非簡單case測試。

先是來一個(gè)自動(dòng)寫公眾號(hào)圖文并發(fā)布的場景,要求根據(jù)主題搜索相關(guān)圖文信息,并寫文章,同時(shí)發(fā)布到公眾號(hào)后臺(tái)。

我是在 Trae 中調(diào)用豆包大模型 1.8 的 API,然后自定義的智能體。


智能體的提示詞是這樣子的:

你是專業(yè)的內(nèi)容編輯,擅長做公眾號(hào)文章的創(chuàng)作,你能根據(jù)指定的主題創(chuàng)作一篇公眾號(hào)文章,并寫入到文件中,文件名以標(biāo)題.md來命名,你需要先調(diào)用Chrome DevTools 工具去瀏覽器搜索查找相關(guān)信息(注意這一步是必須的,你必須調(diào)用工具自行百度搜索,
搜索內(nèi)容是用戶輸入的主題,請(qǐng)嚴(yán)格將用戶主題放入搜索而非其他多余元素),然后調(diào)用MiniMax MCP工具來生成文章配圖,
放在image文件夾下,并引入到到文章中。最后幫我到公眾號(hào)后臺(tái)發(fā)布。公眾號(hào)標(biāo)題你自行選擇爆款標(biāo)題。

同時(shí)配置了 Chrome DevTools MCP 和 MiniMax MCP。

可以看到豆包大模型 1.8 會(huì)根據(jù)任務(wù)自動(dòng)調(diào)用瀏覽器搜索內(nèi)容,然后生成文字和配圖,最后發(fā)布。

整個(gè)長時(shí)任務(wù),可以看到豆包大模型 1.8 完成的很不錯(cuò)。

另外看一個(gè)更復(fù)雜的實(shí)測,扮演一個(gè)CTO 助手審核郵件匹配出合適的投資項(xiàng)目。

為了測試它到底有多硬核,我給它設(shè)置了一個(gè)極具挑戰(zhàn)性的 Case:模擬一個(gè) CTO 助手,完成一整套 AI 項(xiàng)目的立項(xiàng)審批。

背景:模擬一家奶茶公司,茶小鮮,要投資 AI 項(xiàng)目的,由各個(gè)分公司提報(bào)項(xiàng)目到指定郵件。CTO再結(jié)合公司的情況進(jìn)行審查出合適的投資項(xiàng)目。

先給大家看下最終的效果:

整個(gè)任務(wù)足夠復(fù)雜,從郵件中提取附件并解析附件,然后去調(diào)用眾多的公司文件解析,最終生層決策報(bào)告。

你可以看下我給的提示詞:

作為 CTO 助手,請(qǐng)按照以下詳細(xì)流程完成 AI 項(xiàng)目審批工作:
1. 郵件篩選與提?。?br/>● 使用 Chrome DevTools 工具登錄 163 郵箱
● 精確篩選滿足以下條件的郵件:
○ 主題包含"立項(xiàng)申請(qǐng)"的郵件
○ 主題包含"2026年戰(zhàn)略重點(diǎn)"的郵件
● 確保完整獲上述取郵件正文內(nèi)容和所有附件
1. 附件下載與存儲(chǔ):
● 將所有符合條件的郵件附件下載至指定路徑:/Users/Downloads/*.pdf
2. 內(nèi)容解析與整合:
● 調(diào)用 mcp-email-service 中的專用解析工具
● 對(duì)每份PDF附件進(jìn)行結(jié)構(gòu)化解析
● 將解析結(jié)果與對(duì)應(yīng)郵件正文內(nèi)容進(jìn)行智能整合
3. 戰(zhàn)略契合度評(píng)估:
● 以公司最新發(fā)布的 郵件 2026年戰(zhàn)略重點(diǎn) 的正文和附件內(nèi)容 為評(píng)估基準(zhǔn)
● 為每個(gè)項(xiàng)目生成量化評(píng)分和詳細(xì)評(píng)估意見
4. HTML匯報(bào)頁面制作:
● 創(chuàng)建專業(yè)的企業(yè)級(jí)HTML靜態(tài)頁面,包含:
○ 項(xiàng)目概覽儀表盤
○ 戰(zhàn)略契合度雷達(dá)圖
○ 預(yù)算分配餅圖
○ ROI預(yù)測折線圖
● 確保所有數(shù)據(jù)展示均標(biāo)注明確來源:
○ 直接引用原始PDF文件關(guān)鍵頁截圖
○ 標(biāo)注具體引用位置(頁碼/段落)
● 實(shí)現(xiàn)交互功能:
○ 點(diǎn)擊數(shù)據(jù)可跳轉(zhuǎn)至對(duì)應(yīng)PDF原文
○ 支持篩選和排序功能
5. 自動(dòng)交付:
● 生成完成后自動(dòng)在默認(rèn)瀏覽器中打開HTML頁面
質(zhì)量要求:
1. 數(shù)據(jù)準(zhǔn)確性:所有引用數(shù)據(jù)必須與原始文件100%一致
2. 視覺規(guī)范:符合公司VI標(biāo)準(zhǔn),使用官方配色方案
3. 安全要求:處理過程中不得存儲(chǔ)任何敏感郵件內(nèi)容

可以看到它直接調(diào)用 Chrome DevTools MCP,像真人一樣登錄郵箱、精準(zhǔn)篩選、自動(dòng)下載附件到指定路徑。這種 OS Agent 的落地感,真的非常絲滑。


它沒有上來就盲目操作,而是先在后臺(tái)給自己拆解了 10 個(gè)任務(wù)步驟:

1、登錄163郵箱并篩選包含"立項(xiàng)申請(qǐng)"的郵件
2、下載符合條件郵件的所有PDF附件到/Downloads/
3、調(diào)用mcp-email-service解析所有PDF附件和郵件正文
4、以指定基準(zhǔn)文件評(píng)估項(xiàng)目戰(zhàn)略契合度,選出最合適的投資項(xiàng)目
5、創(chuàng)建企業(yè)級(jí)HTML靜態(tài)匯報(bào)頁面,包含儀表盤、圖表和交互功能
6、在默認(rèn)瀏覽器中打開生成的HTML頁面完成交付
7、解析新增補(bǔ)充文檔:中國茶飲AI應(yīng)用白皮書、投資回報(bào)分析報(bào)告、預(yù)算制度、人力資源檔案
8、結(jié)合補(bǔ)充文檔重新評(píng)估項(xiàng)目投資價(jià)值,確定最終最優(yōu)項(xiàng)目
9、更新HTML評(píng)估報(bào)告,整合新的評(píng)估維度
10、重新打開更新后的HTML報(bào)告完成最終交付

大概總結(jié)一下

登錄與篩選: 搞定 163 郵箱。登錄這個(gè)步驟需要人工掃描參與

收集數(shù)據(jù)(郵件的正文和郵件的附件)


調(diào)用MCP工具 mcp-email-service 提取結(jié)構(gòu)化數(shù)據(jù)這里包含了需要結(jié)合的本地文件。


每一個(gè) PDF的文件都至少有十幾頁,字?jǐn)?shù)非常多,這人要一個(gè)個(gè)看沒個(gè)把小時(shí)很難看完。


此時(shí)整個(gè)任務(wù)需要加載5+5 =10份PDF的解析任務(wù),每份文檔大小不低于500kb

最后是戰(zhàn)略契合度評(píng)估環(huán)節(jié),這一點(diǎn)最難,它需要理解 256K 窗口里的那堆復(fù)雜戰(zhàn)略。


我中途丟給它《中國茶飲 AI 白皮書》和預(yù)算制度,它能迅速合并維度,重新修正投資價(jià)值。

最終自動(dòng)在瀏覽器打開一個(gè)帶交互功能的 HTML 儀表盤。


最后得到評(píng)估報(bào)告:


在測試過程中,我有幾個(gè)非常深刻的體會(huì):

1、工具調(diào)用(ToolUse)極其穩(wěn)定

以前的 Agent 經(jīng)常會(huì)在多步調(diào)用中斷片,但豆包 1.8 的輸出格式非常穩(wěn)定。即使是面對(duì) mcp_mcp-email-service_parse_pdf 這種復(fù)雜的自定義工具,它也能精準(zhǔn)傳參,報(bào)錯(cuò)率低得驚人。

2、思考長度可調(diào)節(jié)

它支持思考過程的精簡或深入。在處理“戰(zhàn)略契合度評(píng)分”時(shí),我能感覺到它在進(jìn)行深度邏輯推理;而在處理下載附件這種確定性任務(wù)時(shí),它又非常節(jié)省 Tokens,這才是成熟模型該有的樣子。

3、視覺與多模態(tài)的精準(zhǔn)度

在 HTML 報(bào)告里,它能直接引用 PDF 原始文件的關(guān)鍵頁截圖,并標(biāo)注頁碼。這種對(duì)多模態(tài)內(nèi)容的“索引”能力,避免了 AI 常見的胡說八道。

最后統(tǒng)計(jì)了下大概的 token 消耗情況:


在企業(yè)級(jí)復(fù)雜的業(yè)務(wù)場景中,豆包大模型 1.8 更適合處理復(fù)雜的 Agent 任務(wù)。

看完豆包 1.8 的表現(xiàn),我一直在想,現(xiàn)在的工具真的太多了,開發(fā)者和職場人的切換成本越來越高。

我覺得工具不應(yīng)該讓人去適應(yīng)它,而應(yīng)該主動(dòng)融入我們的工作流。

豆包這次把 Agent、超長上下文和多模態(tài)打通,其實(shí)是給了每個(gè)人一個(gè)“一站式”的數(shù)字辦公室。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
讓人倒吸一口涼氣:烏軍3個(gè)旅反攻俄軍2個(gè)軍:24小時(shí)竟打進(jìn)市中心

讓人倒吸一口涼氣:烏軍3個(gè)旅反攻俄軍2個(gè)軍:24小時(shí)竟打進(jìn)市中心

瞳哥視界
2025-12-24 21:36:08
浙江2026國補(bǔ)開門紅!臺(tái)州市民成為浙江首單用戶

浙江2026國補(bǔ)開門紅!臺(tái)州市民成為浙江首單用戶

臺(tái)州交通廣播
2026-01-01 15:12:33
祝好!58歲切爾西傳奇病情危急 體重下降32公斤 曾2次來中超執(zhí)教

祝好!58歲切爾西傳奇病情危急 體重下降32公斤 曾2次來中超執(zhí)教

我愛英超
2026-01-01 08:00:51
不是技術(shù)不行,而是體系崩了:拆解俄羅斯軍工的五個(gè)失敗樣本

不是技術(shù)不行,而是體系崩了:拆解俄羅斯軍工的五個(gè)失敗樣本

七分日記
2025-12-30 23:44:36
次次“見光死”的沈佳潤,什么時(shí)候懂,觀眾沒有溺愛星二代的義務(wù)

次次“見光死”的沈佳潤,什么時(shí)候懂,觀眾沒有溺愛星二代的義務(wù)

可樂談情感
2026-01-01 15:33:36
女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來了解

女性的私處哪種形態(tài)更好?女性陰部的形狀類型有哪些?不妨來了解

醫(yī)者榮耀
2025-12-25 12:05:06
劉亦菲小肚子很大

劉亦菲小肚子很大

動(dòng)物奇奇怪怪
2026-01-01 15:22:03
浙江烏鎮(zhèn)一?;莱鋈α耍裁烂匀?,美的無可挑剔,高級(jí)感滿滿

浙江烏鎮(zhèn)一?;莱鋈α?,貌美迷人,美的無可挑剔,高級(jí)感滿滿

可樂談情感
2026-01-01 14:46:38
妹子網(wǎng)購綠植開箱,發(fā)現(xiàn)兩只偷渡小貓,商家天塌了:我的咪呢?

妹子網(wǎng)購綠植開箱,發(fā)現(xiàn)兩只偷渡小貓,商家天塌了:我的咪呢?

Magic寵物社
2025-12-16 20:10:03
徹底賣爆了!“瘋掉了,像不要錢一樣”,有人全部換成黃金……

徹底賣爆了!“瘋掉了,像不要錢一樣”,有人全部換成黃金……

環(huán)球網(wǎng)資訊
2026-01-01 07:20:11
舞蹈老師秦貝貝去世,年僅25歲顏值高,確診僅1年半,喜歡吃燒烤

舞蹈老師秦貝貝去世,年僅25歲顏值高,確診僅1年半,喜歡吃燒烤

180視角
2025-12-31 13:11:45
制造航母所用的特種鋼,全球僅三個(gè)國家能自行制造,包括中國嗎?

制造航母所用的特種鋼,全球僅三個(gè)國家能自行制造,包括中國嗎?

凡知
2026-01-01 12:00:40
張水華沒示好領(lǐng)導(dǎo)沒向公眾道歉,奪冠感言不卑不亢拒絕迎合任何人

張水華沒示好領(lǐng)導(dǎo)沒向公眾道歉,奪冠感言不卑不亢拒絕迎合任何人

楊華評(píng)論
2026-01-01 15:08:51
史詩級(jí)!曝1億歐“帝星”同意加盟巴薩!三大“妖刀”冬窗馳援

史詩級(jí)!曝1億歐“帝星”同意加盟巴薩!三大“妖刀”冬窗馳援

頭狼追球
2026-01-01 11:36:49
為何李莊能守住近萬箱文物,而南京博物院卻守不住一幅畫?

為何李莊能守住近萬箱文物,而南京博物院卻守不住一幅畫?

游子三月三
2025-12-31 19:43:09
人社部明確!2000元低收入退休人員,2026年能漲 400元?答案來了

人社部明確!2000元低收入退休人員,2026年能漲 400元?答案來了

云鵬敘事
2026-01-01 09:47:07
“GOGOGO 出發(fā)嘍”,鄧超跨年演唱會(huì)全開麥唱跳7分鐘,發(fā)文稱:沒有發(fā)揮到最好,還得再練練

“GOGOGO 出發(fā)嘍”,鄧超跨年演唱會(huì)全開麥唱跳7分鐘,發(fā)文稱:沒有發(fā)揮到最好,還得再練練

現(xiàn)代快報(bào)
2026-01-01 07:37:04
羅馬諾:馬雷斯卡與高層矛盾始于科爾維爾重傷;他深夜告知離任

羅馬諾:馬雷斯卡與高層矛盾始于科爾維爾重傷;他深夜告知離任

懂球帝
2026-01-02 00:27:09
三亞不香了?東北人撤離成潮,壓垮他們的不是物價(jià),而是生活現(xiàn)實(shí)

三亞不香了?東北人撤離成潮,壓垮他們的不是物價(jià),而是生活現(xiàn)實(shí)

歷史有些冷
2025-12-04 20:20:06
文章離婚后復(fù)出首作!搭檔閆妮出演新劇,《一步登天》2026他真的能“一步登天”?

文章離婚后復(fù)出首作!搭檔閆妮出演新劇,《一步登天》2026他真的能“一步登天”?

今古深日?qǐng)?bào)
2025-12-30 12:28:47
2026-01-02 01:24:49
蒼何
蒼何
前大廠工程師,努力分享AI干貨知識(shí)
38文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

特斯拉Model 3車主首度全程自駕橫穿美國

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

頭條要聞

女子稱奶奶去世公司不批假被逼離職 公司法人:害群之馬

體育要聞

2026,這些英超紀(jì)錄可能會(huì)被打破

娛樂要聞

跑調(diào)風(fēng)波越演越烈!沈佳潤被網(wǎng)友喊話

財(cái)經(jīng)要聞

巴菲特「身退,權(quán)還在」

汽車要聞

一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創(chuàng)新高

態(tài)度原創(chuàng)

游戲
數(shù)碼
親子
藝術(shù)
公開課

LPL最慘選手誕生!圈內(nèi)主播爆料RNG離譜合同,LPL概念神陪玩掙錢

數(shù)碼要聞

REDMI Note 15系列新春版圖賞:999元起 新增車?yán)遄蛹t配色

親子要聞

九月齡娃喊“二百”沖上熱搜,爸媽懵了,孩子其實(shí)早聽懂了

藝術(shù)要聞

你絕對(duì)想不到,這位東方畫家竟將印象派推向巔峰!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版