国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Agent、圖像、視頻全是大版本升級:春晚還沒開,豆包AI就火了

0
分享至



編輯|澤南、楊文

「2026 年或?qū)⒊蔀槿祟悮v史上最忙碌、也最具決定性的一年?!箈AI 聯(lián)創(chuàng) Jimmy Ba 在離職宣言中如是說。



這話并非夸張。1 月初,Anthropic 推出 Agent 工具 Claude Cowork,并發(fā)布 11 個配套插件;一周前,Anthropic 與 OpenAI 又幾乎同時推出新版本基礎(chǔ)大模型 Claude Opus 4.6 與 GPT-5.3-Codex。

這波密集發(fā)布直接「血洗華爾街」,甲骨文、Adobe、Salesforce、湯森路透、NEC 等知名公司股票遭拋售,近萬億刀市值蒸發(fā)。

國內(nèi)的 AI 戰(zhàn)場火藥味更濃。

騰訊元寶直接撒錢,阿里千問請喝奶茶,而字節(jié)豆包早已官宣深度參與 2026 年春晚互動,期間將送出最高 8888 元的現(xiàn)金紅包,外加超 10 萬份科技禮包,涵蓋宇樹機器人、大疆無人機等 17 類前沿科技產(chǎn)品及智能家電。

這場春節(jié) AI 大戰(zhàn),打的是真金白銀。但第一個堪稱現(xiàn)象級的,是字節(jié)最新上線的視頻創(chuàng)作模型 ——Seedance 2.0。沒發(fā)紅包,甚至還在內(nèi)測中,就火遍了全網(wǎng)。

Seedance 2.0 只是第一波「預(yù)熱」,字節(jié)的 AI 發(fā)力才剛剛開始。

2 月 14 日,火山引擎正式宣布豆包系列模型的全面升級,除了在海外社交媒體上刷屏的 Seedance 2.0,還包括豆包大模型 2.0圖像創(chuàng)作模型 Seedream 5.0 Lite

從基座模型、圖像到視頻生成,全是大版本更新,字節(jié)這次要在 AI 領(lǐng)域全面出擊。

豆包大模型 2.0:多模態(tài) + Agent 躋身第一梯隊

先說這個豆包大模型 2.0(Doubao-Seed-2.0),它是字節(jié)跳動最新推出的多模態(tài) Agent 模型,也是豆包大模型自 2024 年 5 月正式發(fā)布以來首次大版本的跨代升級。

作為此次升級的重頭戲,豆包 2.0 已在多模態(tài)理解、企業(yè)級 Agent 能力以及推理代碼能力三個維度上實現(xiàn)質(zhì)的飛躍。

在技術(shù)報告中,字節(jié)表示,豆包 2.0 專為在大規(guī)模生產(chǎn)環(huán)境中提供最佳用戶體驗而設(shè)計,優(yōu)先考慮了大規(guī)模在線部署環(huán)境下的用戶體驗。因此,模型針對最直接影響交互體驗的視覺和多模態(tài)查詢、推理延遲與復(fù)雜指令可靠性三個方面進行了著重加強:

  • 增強了在幻覺壓力下的視覺推理能力,并改進文檔和圖形的結(jié)構(gòu)化解析能力。
  • 提供多種體量型號(Pro、Lite、Mini 三款通用 Agent 模型和 Code 模型),以應(yīng)對不同部署場景下延遲與性能之間的權(quán)衡。
  • 擁有可靠的復(fù)雜指令執(zhí)行能力,可準(zhǔn)確執(zhí)行高度約束、多步驟任務(wù)。

數(shù)學(xué)與視覺推理方面,豆包 2.0 Pro 在 MathVista、MathVision、MathKangaroo、MathCanvas 等數(shù)學(xué)推理基準(zhǔn)上達到業(yè)界最優(yōu)水平,在科學(xué)領(lǐng)域的整體成績與 Gemini 3 Pro 和 GPT 5.2 相當(dāng)。



在 VLMsAreBiased、VLMsAreBlind、BabyVision 等視覺感知能力基準(zhǔn)中,豆包 2.0 取得了業(yè)界最高分。



推理和 Agent 能力評測中,豆包 2.0 Pro 在 IMO、CMO 數(shù)學(xué)奧賽和 ICPC 編程競賽中獲得金牌成績,也超越了 Gemini 3 Pro 在 Putnam Bench 上的表現(xiàn)。





HLE-text(人類的最后考試)上,豆包 2.0 Pro 取得最高分 54.2 分:



豆包 2.0 還重點強化了指令遵循能力。相關(guān)評測顯示,豆包 2.0 可保持較強的一致性與可控性,這為其作為 Agent 模型在長鏈路、多步驟任務(wù)中嚴(yán)格按約束條件執(zhí)行奠定基礎(chǔ)。

目前,模型 API 已在火山引擎上線。



體驗鏈接:https://console.volcengine.com/

接下來讓我們上手實測一番。

多模態(tài)理解

在多模態(tài)理解方面,豆包 2.0 不僅能精準(zhǔn)提取文字、深度理解圖表,更具備出色的空間感知、運動捕捉和長視頻解析能力。

豆瓣有個「史上寫字最爛小組」,一群寫字稀爛的人在這里展示著自己那飽受爭議的書法,只要字跡足夠潦草、丑陋,就能在組里封神。其中有個「燒腦毒體大合集」,里面全是從餐廳選購食材的本本上摘的爛字,甚至還有「通假字」。



我們選擇豆包 APP 的「專家」模式,讓豆包 2.0 辨認(rèn)下。

這幾個龍飛鳳舞的字,豆包全都認(rèn)對了。它不僅能識別常規(guī)字跡,還能結(jié)合后廚速記習(xí)慣,破譯「自然粉即孜然粉」等諧音簡寫。這說明它沒有停留在字符識別層面,還能根據(jù)業(yè)務(wù)場景進行語義推理。



再來試試表格理解和處理。

我們丟給它一個統(tǒng)計表,要求它先提取文字、計算每種飲料銷售額,并按銷售額從高到低排序。

豆包按需調(diào)用工具,文字提取絲毫不差,自主理解任務(wù)邏輯,準(zhǔn)確應(yīng)用銷售額計算公式,最終排完序以結(jié)構(gòu)化表格呈現(xiàn)。



整個過程體現(xiàn)了 OCR 識別、數(shù)學(xué)運算、邏輯推理的深度融合,并提供可下載的實用化輸出。

我們又試了下圖片識別,讓豆包數(shù)圖中的卡通小狗,并介紹品種。



模型迅速響應(yīng),還標(biāo)注每只小狗的空間方位,描述其外觀特征,如西施犬「頭頂紅色蝴蝶結(jié)」等細節(jié)。

回溯它的思考過程,我們發(fā)現(xiàn)它為了防止出錯,會進行反復(fù)驗證。



推理代碼能力和企業(yè)級 Agent 能力

豆包 2.0 的推理能力也大幅躍升,支持思考長度靈活調(diào)節(jié),且各思考長度下 Token 效率全面提升,在代碼生成特別是前端開發(fā)領(lǐng)域表現(xiàn)尤為亮眼。

比如,我們在 TRAE 中調(diào)用豆包 2.0 Code,輸入 Prompt : write a python code that visualizes how a traffic light works in a one way street with cars entering at random rate.(編寫一個 Python 代碼,可視化單行道中交通信號燈的工作情況,車輛以隨機速率駛?cè)?。?/p>



每輛車被賦予不同色彩以增強視覺辨識度,交通信號燈在紅綠狀態(tài)間自動切換,車輛嚴(yán)格遵循「紅燈停、綠燈行」規(guī)則。

再比如,Prompt:Simulate a realistic water ripple effect on an HTML canvas. When the user clicks, ripples should spread outward and interact with each other.(在 HTML 畫布上模擬逼真的水波紋效果。當(dāng)用戶點擊時,水波紋應(yīng)向外擴散并相互影響。)



它能在點擊位置生成水波紋,以同心圓形式向外自然擴散并逐漸衰減,當(dāng)波紋觸及畫布邊界時還會產(chǎn)生反彈效果,符合真實的水波物理特性。

再來生成個小游戲。

僅憑一句「生成一個精美的超級瑪麗小游戲」,豆包 2.0 就成功生成了功能完整、完全可玩的游戲。



畫面設(shè)計精美細致,模型完整實現(xiàn)游戲核心機制,左上角實時顯示分?jǐn)?shù)和生命數(shù),整個游戲從 UI 設(shè)計到交互邏輯都達到了可發(fā)布水平。

它生成的經(jīng)典貪吃蛇小游戲,也實現(xiàn)了流暢的移動邏輯和碰撞檢測,還加入實時得分系統(tǒng)。



此外,在企業(yè)級應(yīng)用場景中,模型能更好支持對 Skills 的理解和應(yīng)用,F(xiàn)unction Call 、多輪指令遵循、搜索和工具調(diào)用能力顯著增強,格式輸出更穩(wěn)定,并能靈活管理上下文,輕松應(yīng)對數(shù)據(jù)分析、智能客服等復(fù)雜、長程任務(wù)。

Seedance 2.0:內(nèi)測即爆火

Seedance 2.0 的火爆程度無需多言,推特、B 站上網(wǎng)友整活已經(jīng)鋪天蓋地。

人們普遍認(rèn)為,它在視頻創(chuàng)作領(lǐng)域達到了改變業(yè)界走向的水平,其對復(fù)雜場景、多人互動和真實運動邏輯的把控能力讓人難辨真假。

國內(nèi)外一片好評。有網(wǎng)友用 Seedance 2.0 模擬 1670 年的新阿姆斯特丹,效果驚艷,連馬斯克都在底下評論「It’s happening fast.」



賈樟柯公開表示將用該技術(shù)創(chuàng)作短片,成為首位宣布使用該模型的知名導(dǎo)演。



《黑神話:悟空》制作人馮驥則表示「AIGC 童年時代結(jié)束」,同時也提出對虛假內(nèi)容泛濫的擔(dān)憂。



以前拍電影需要劇本、分鏡、拍攝、剪輯、特效,一堆人折騰好幾個月,現(xiàn)在一個人、一句提示詞,再加上幾次抽卡就能完成。

或許很多人還沒意識到這項技術(shù)的顛覆性,但已經(jīng)有不少博主用它「導(dǎo)演」未來電影了。

有網(wǎng)友還發(fā)現(xiàn) Seedance 2.0 可以將任意小說文本生成視頻,看樣子接下來會有一大批精美 AI 短劇來襲。



我們也上手試了下,讓它把世界上最短科幻小說《最后一個人》影視化。

這篇小說只有十七個單詞「The last man on earth sat alone in a room. There was a knock on the door....」(地球上最后一個人獨自坐在房間里,這時,忽然響起了敲門聲……)

僅憑以上提示詞,Seedance 2.0 就精準(zhǔn)捕捉到末日氛圍與懸念設(shè)定,生成一段 10 秒高質(zhì)量短片。



視頻以電影級的鏡頭語言展開敘事,開場畫面中孤獨的男子背對鏡頭坐在破敗房間里,隨著一陣敲門聲,鏡頭切換至男子驚恐的面部特寫,瞪大的雙眼和緊繃的表情比流量明星的演技還在線。

它還支持圖生視頻?;谟顦錂C器人的參考圖,再加上提示詞,Seedance 2.0 完美呈現(xiàn)了所有關(guān)鍵要素,視頻在角色一致性、動作連貫性和氛圍渲染方面都表現(xiàn)得很出色。



圖生視頻。提示詞:視頻整體風(fēng)格為賽博朋克風(fēng)格,中景鏡頭,畫面中只有圖片 1 的機器人和數(shù)字調(diào)音臺。背景閃爍著酒吧里的霓虹燈光。圖片 1 里的機器人在賽博朋克風(fēng)格的酒吧里做 DJ 打碟。圖片 1 里的機器人身穿夸張閃亮的服裝。

字節(jié)表示,Seedance 2.0 支持混合模態(tài)輸入,允許用戶同時輸入多達 9 張圖片、3 段視頻、3 段音頻以及自然語言指令,模型可參考輸入素材中的構(gòu)圖、動作、運鏡、特效、聲音等元素。生成出來的視頻最多 15 秒,還有雙聲道的音頻。

在技術(shù)上,Seedance 2.0 依靠海量世界知識、稀疏架構(gòu)的效能優(yōu)勢,以及多模態(tài)聯(lián)合訓(xùn)練涌現(xiàn)的強大泛化能力,實現(xiàn)了專業(yè)級的生成效果。其采用統(tǒng)一的多模態(tài)音視頻聯(lián)合生成架構(gòu),集成了目前業(yè)界最全面的多模態(tài)內(nèi)容參考和編輯能力。相比 1.5 版本,Seedance 2.0 的生成質(zhì)量大幅提升,在復(fù)雜交互和運動場景下的可用率更高,物理準(zhǔn)確度、逼真度、可控性均顯著增強。

在評測表現(xiàn)上,Seedance 2.0 的視頻能力處于業(yè)內(nèi)領(lǐng)先水平,該模型可精準(zhǔn)呈現(xiàn)高張力大動作與精細的微表情,并支持專業(yè)級組合運鏡與敘事節(jié)奏控制。音頻維度上,Seedance 2.0 針對中文方言、戲曲及演唱場景,其指令響應(yīng)準(zhǔn)確度明顯提升。



Seedance 2.0 文字生成視頻能力評測。

在該模型出現(xiàn)后,我們終于可以肯定地說,視頻生成 AI 已經(jīng)走到了生產(chǎn)力的門檻上。

Seedream 5.0 Lite:圖像創(chuàng)作跨入頂尖水平

在圖像創(chuàng)作領(lǐng)域,從 Seedream 4.0 開始,字節(jié)就與谷歌 Nano Banana Pro 展開正面競爭,并憑借出色的 P 圖質(zhì)量在社交媒體火出圈。也就是說,在 AI 生成圖像這個競爭最激烈的賽道,字節(jié)也已位列領(lǐng)先梯隊。

此次 Seedream 5.0 Lite 則是通向統(tǒng)一多模態(tài)模型的全新探索,相比 4.5 版本,它在理解、推理和生成能力上實現(xiàn)了全面躍升。

模型采用多模態(tài)理解生成統(tǒng)一架構(gòu),能像人類設(shè)計師一樣洞察用戶意圖,即便面對簡短模糊的描述也能準(zhǔn)確推測創(chuàng)作需求,在主體一致性和圖文對齊等方面表現(xiàn)顯著提升。

其內(nèi)置的世界知識體系覆蓋科技與人文多個垂類領(lǐng)域,生成結(jié)果更符合物理規(guī)律,信息可視化能力大幅增強。

Seedream 5.0 Lite首次引入了實時檢索增強能力,可通過聯(lián)網(wǎng)獲取最新知識和資訊,精準(zhǔn)響應(yīng)時效性創(chuàng)作需求,在資訊海報等場景中表現(xiàn)尤為出色。

比如,Prompt:A low-resolution digital picture focuses on a woman in a thick winter coat holding a mug of hot cocoa, laughing. Festive lights and blurred market stalls with holiday decorations fill the background under a light snowfall.



Prompt:A low-light digital picture captures a group of friends laughing around a bonfire on a sandy beach at night. The firelight illuminates their faces while the ocean is dark in the background.



三個模型看過來,我們能發(fā)現(xiàn),豆包的一系列新技術(shù)名副其實,都是大版本級別的提升。隨著豆包的發(fā)布,這個春節(jié)檔已經(jīng)從「流量高峰」演變成了純純的「技術(shù)戰(zhàn)場」。

全模態(tài)的豆包,讓 AI 又上了一個臺階

字節(jié)的 AI 版圖還遠不止如此。

語音領(lǐng)域,字節(jié)發(fā)布豆包實時語音大模型。這是一款語音理解和生成一體化的模型,實現(xiàn)了端到端語音對話,在語音表現(xiàn)力、控制力、情緒承接方面表現(xiàn)驚艷,并具備低時延、對話中可隨時打斷等特性。

比如前段時間羅永浩跨年演講上和豆包斗嘴,隨時打斷、要求每句話后面加「OK」、實時調(diào)整情緒,豆包全都能即時響應(yīng)。



具身智能領(lǐng)域,字節(jié) Seed-Robotics 團隊最新推出 Seed GR-RL 強化學(xué)習(xí)框架,讓機器人在真實場景中穩(wěn)定完成多步驟、高精度的操作任務(wù)。

至于AI for Science,字節(jié)已經(jīng)耐心投入 5 年。Seed-AI for Science 團隊圍繞生物領(lǐng)域基礎(chǔ)模型、量子化學(xué)、分子動力學(xué)等方向,發(fā)布了 SeedFold、SeedProteo 等有影響力的學(xué)術(shù)成果。

這種全方位的技術(shù)儲備,正是字節(jié)敢于與 OpenAI、谷歌、Anthropic 等海外巨頭正面交鋒的底氣。

2026 年的春節(jié),或許會成為 AI 應(yīng)用爆發(fā)的分水嶺。

我們正在見證首個真?國民級 AI 入口的誕生。

文章視頻鏈接:https://mp.weixin.qq.com/s/ZRyuyS3bagk1UvwmUq8ZKw

聲明:包含AI生成內(nèi)容

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
朝鮮人民的9條規(guī)定,真的與我們太不一樣了

朝鮮人民的9條規(guī)定,真的與我們太不一樣了

混沌錄
2026-02-25 22:30:10
獄友問我怎么進來的,我:貪10個億。獄警上來就是一腳:裝什么

獄友問我怎么進來的,我:貪10個億。獄警上來就是一腳:裝什么

懸案解密檔案
2026-02-26 15:34:48
2-1,38歲梅西遭抱摔+替補登場一劍封喉,率隊終結(jié)2場比賽不勝

2-1,38歲梅西遭抱摔+替補登場一劍封喉,率隊終結(jié)2場比賽不勝

側(cè)身凌空斬
2026-02-27 10:56:26
小學(xué)黨委書記教育部發(fā)布會做分享:畢業(yè)班孩子平均比11年前長高5.52厘米

小學(xué)黨委書記教育部發(fā)布會做分享:畢業(yè)班孩子平均比11年前長高5.52厘米

紅星新聞
2026-02-27 17:25:29
伊朗外長:伊朗已將導(dǎo)彈射程限制在2000公里以內(nèi)

伊朗外長:伊朗已將導(dǎo)彈射程限制在2000公里以內(nèi)

新華社
2026-02-27 10:33:20
荷蘭嘗到甜頭,準(zhǔn)備再次對華虎口奪食,已經(jīng)盯上“下一個安世”?

荷蘭嘗到甜頭,準(zhǔn)備再次對華虎口奪食,已經(jīng)盯上“下一個安世”?

健身狂人
2026-02-27 17:28:19
秦檜32世孫發(fā)聲:讓祖宗跪岳飛我認(rèn)了,憑什么還要跪岳飛的母親?

秦檜32世孫發(fā)聲:讓祖宗跪岳飛我認(rèn)了,憑什么還要跪岳飛的母親?

不八卦掌門人
2026-02-23 13:35:25
小卡傷??齑∩掷峭?連敗 華子31分連中關(guān)鍵球蘭德爾10中1

小卡傷停快船惜敗森林狼吞3連敗 華子31分連中關(guān)鍵球蘭德爾10中1

醉臥浮生
2026-02-27 13:41:48
魯比奧認(rèn)錯,希望中國解除反制!事到如今,他想陪特朗普一起訪華

魯比奧認(rèn)錯,希望中國解除反制!事到如今,他想陪特朗普一起訪華

小影的娛樂
2026-02-27 17:10:08
74歲陳凱歌在三亞豪宅過年,穿5萬元皮鞋戴大金表,臉上有老年斑

74歲陳凱歌在三亞豪宅過年,穿5萬元皮鞋戴大金表,臉上有老年斑

洲洲影視娛評
2026-02-26 13:52:42
白鹿帶劇組韓國團建,被罵沒邊界感?憑實績隨心所欲怎么了

白鹿帶劇組韓國團建,被罵沒邊界感?憑實績隨心所欲怎么了

無心小姐姐
2026-02-27 09:41:45
央視肖曉琳:退休5個月,在美國兒子家逝去,臨終26字遺言太深刻

央視肖曉琳:退休5個月,在美國兒子家逝去,臨終26字遺言太深刻

古事尋蹤記
2026-02-06 07:06:55
盤后狂跌超9%!英偉達“干兒子”虧損持續(xù)擴大 668億美元訂單反成沉重包袱?

盤后狂跌超9%!英偉達“干兒子”虧損持續(xù)擴大 668億美元訂單反成沉重包袱?

財聯(lián)社
2026-02-27 12:27:02
女單八強出爐!國乒占5席有望包攬四強,孫穎莎與早田希娜18相約

女單八強出爐!國乒占5席有望包攬四強,孫穎莎與早田希娜18相約

燒體壇
2026-02-27 19:23:22
78歲連路都走不穩(wěn)還開演唱會,全網(wǎng)罵聲一片,她卻揚言回饋粉絲

78歲連路都走不穩(wěn)還開演唱會,全網(wǎng)罵聲一片,她卻揚言回饋粉絲

洲洲影視娛評
2026-01-28 12:23:18
馬筱梅大方曬幸福,坦言不會喂奶、拍嗝,育兒重任全都交給汪小菲

馬筱梅大方曬幸福,坦言不會喂奶、拍嗝,育兒重任全都交給汪小菲

一盅情懷
2026-02-27 15:36:08
開炮真管用!中國海警船果斷開炮,菲律賓50多艘艦船奪命而逃!

開炮真管用!中國海警船果斷開炮,菲律賓50多艘艦船奪命而逃!

頭條爆料007
2026-02-26 08:30:30
父親入獄,母親改嫁丟下我,三嬸說:跟我回家,多年后我叫嬸子媽

父親入獄,母親改嫁丟下我,三嬸說:跟我回家,多年后我叫嬸子媽

人間百態(tài)大全
2026-02-27 06:45:03
戲子誤國!2026年剛開年,就有3位明星相繼塌房,個個荒唐

戲子誤國!2026年剛開年,就有3位明星相繼塌房,個個荒唐

不似少年游
2026-02-24 19:24:23
那條救了中國人餐桌的魚,你可能根本不知道它的故事

那條救了中國人餐桌的魚,你可能根本不知道它的故事

富貴說
2026-02-26 20:49:42
2026-02-27 21:36:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12374文章數(shù) 142571關(guān)注度
往期回顧 全部

科技要聞

單張不到五毛!谷歌深夜發(fā)布Nano Banana 2

頭條要聞

夜間氣溫達零下30℃ 烏總統(tǒng):烏面臨幾十年來最難冬天

頭條要聞

夜間氣溫達零下30℃ 烏總統(tǒng):烏面臨幾十年來最難冬天

體育要聞

一場必須要贏的比賽,男籃何止擊敗了裁判

娛樂要聞

繼網(wǎng)暴谷愛凌后 美國欲沒收其全部收入

財經(jīng)要聞

沈明高提共富建議 百姓持科技股國家兜底

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

健康
家居
旅游
親子
房產(chǎn)

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

家居要聞

素色肌理 品意式格調(diào)

旅游要聞

賞花燈、玩非遺、逛市集崇明特色元宵活動邀您來打卡

親子要聞

萌娃一句話,爸爸當(dāng)場臉紅到耳根

房產(chǎn)要聞

重磅!海南“十五五”規(guī)劃出爐!未來五年,方向定了!

無障礙瀏覽 進入關(guān)懷版