国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Vibe Coding過時了?谷歌開始卷Vibe Searching

0
分享至



AI能根據(jù)你的文字生成圖片,也能生成視頻。

可當我們?nèi)祟愊胍臇|西是一段畫面、一種氛圍、一個模糊的印象,機器就沒啥辦法了。

你沒法在搜索框里輸入“那種很孤獨的感覺”然后得到一張完美的劇照,也沒法對著監(jiān)控系統(tǒng)說“幫我找打架的片段”。

文字是文字,圖片是圖片,視頻是視頻,音頻是音頻,它們各自封閉,互不相通。

2026年一季度,當其他大模型廠商還在卷agent、卷內(nèi)容生成的時候,谷歌悄悄發(fā)布了Gemini Embedding 2模型。

它把文本、圖片、視頻、音頻和文檔,全部拉進了同一個語義空間。

這意味著你可以用一句話找到一張圖,用一張圖找到一段視頻,用一段音頻找到一份文檔。

五種模態(tài)之間的壁壘被打通了,機器第一次擁有了類似人類“通感”的能力。

它不再把世界看成割裂的文件格式,而是像你一樣,把一段旋律、一個畫面、一句話理解為同一件事的不同表達。

有網(wǎng)友評論道:“人工智能不再把世界看得支離破碎,它和你一樣看待它?!?/p>

01

谷歌的戰(zhàn)略深意:不在應用層肉搏,而是去定標準

谷歌選擇在這個時間點發(fā)布這個模型可以說是耐人尋味。

在OpenClaw狂熱的當下,大家都在比誰的大腦更聰明,誰的手腳更靈活。

而谷歌卻退后一步,去打磨一種更底層的能力——感知力。

要理解這步棋的分量,需要先看清一個事實。在Gemini Embedding 2出現(xiàn)之前,多模態(tài)嵌入其實不是什么新鮮玩意,甚至于可以說它有點“土”。



Nomic、Jina、CLIP 的衍生模型都做過嘗試,但它們要么只覆蓋兩三種模態(tài),要么精度不夠,總結來說就是能用但不好用。

更關鍵的是,市面上絕大多數(shù)嵌入模型,本質上仍然是“文本優(yōu)先”的。

想搜索一段視頻?先把視頻轉錄成文字,再對文字做嵌入。這個中間步驟不僅拖慢速度,還不可避免地損耗語義。

畫面的構圖、音樂的情緒、說話人的語氣,這些只存在于原始模態(tài)中的微妙信號,在轉錄為文字的那一刻就已經(jīng)不存在了。

Gemini Embedding 2的做法則完全不同。

它原生理解聲波和動態(tài)畫面,直接將五種模態(tài)映射到同一個3072維的語義空間里,不需要任何中間轉譯。

法律科技公司Everlaw在使用embedding 2模型處理訴訟發(fā)現(xiàn)(litigation discovery)流程時,跨數(shù)百萬條記錄的檢索召回率提升了20%;另一家企業(yè)Sparkonomy則發(fā)現(xiàn),相比此前的多管道方案,延遲降低了70%,語義相似度得分直接翻倍。

聰明的大腦固然重要,但如果這個大腦看不見、聽不到、摸不著真實世界里那些紛繁復雜的多模態(tài)信息,它就像一個被關在漆黑房間里的天才,再聰明也無處施展。
所以谷歌的策略是:與其在上層應用上和對手肉搏,不如直接去修路、定標準。

標準從何定起?前提在于,每一家大模型廠商的嵌入標準是完全不兼容的。

同一張照片,在谷歌的語義空間里坐標可能是 (1, 2),到了 OpenAI 的體系里就變成了 (9, 8)。谷歌自己的文檔也明確指出,從上一代gemini-embedding-001升級到Embedding 2,所有已有數(shù)據(jù)都必須重新嵌入,兩代模型生成的向量之間無法直接比較。

一旦企業(yè)用了谷歌的模型為積攢多年的圖片、音頻、視頻建立了索引,想要遷移到其他平臺,就意味著把全部數(shù)據(jù)重新投喂、重新計算。這種耗費巨大算力和時間的索引重建工程,會讓企業(yè)在不知不覺中被深度綁定到谷歌的生態(tài)里。

谷歌深諳此道,并且在加速這種綁定。

Embedding 2發(fā)布當天就已經(jīng)集成了LangChain、LlamaIndex、Haystack、Weaviate、Qdrant、ChromaDB、Pinecone 等幾乎所有主流AI開發(fā)框架和向量數(shù)據(jù)庫,官方Colab示例代碼以Apache 2.0許可證開源,文本嵌入定價僅0.20美元/百萬token,批量調(diào)用再打五折。

這套動作的意圖非常清晰:讓開發(fā)者和企業(yè)以低門檻的方式涌入,等到數(shù)據(jù)沉淀到一定規(guī)模,遷移成本就會像滾雪球一樣越滾越大。

“我們開發(fā)和利用人工智能潛力的方法根植于我們的創(chuàng)始使命——組織世界信息,使其普遍可訪問且實用。”這是2023年谷歌官網(wǎng)發(fā)布的《我們?yōu)槭裁搓P注人工智能以及目的是什么》中的一句話。

從幫助科學家探索蛋白質折疊的 AlphaFold,到針對數(shù)學和物理頂級難題推出的Gemini DeepThink模式,再到這次的跨模態(tài)檢索,谷歌確實在一步步兌現(xiàn)這個承諾。

02

一個里程碑式的技術突破

Gemini Embedding 2支持超過100種語言,擁有8192個token的上下文窗口(大約對應4000到5000個中文字符),每次請求最多可以處理6張圖片、120秒的視頻以及6頁的PDF。

在基準測試中,它的多語言檢索、代碼檢索和圖文檢索得分全面超越了Amazon Nova 2和Voyage 3.5。



但真正讓這件事具有里程碑意義的,不只是跑分數(shù)字,而是它所瞄準的那片無人深海。

根據(jù)IDC 2023年的報告,視頻、音頻、圖片等非結構化數(shù)據(jù)占到了全球數(shù)據(jù)總量的92.9%,即便到2028年,這個比例預計也只會降到82.3%。



換句話說,人類產(chǎn)生的絕大多數(shù)信息——會議錄音、產(chǎn)品視頻、設計圖稿、監(jiān)控畫面由于其非結構化特征,長久沉寂在茫茫的互聯(lián)網(wǎng)世界中無法被按需打撈,就像一個個封閉的黑盒。

以前要對這些黑盒數(shù)據(jù)進行語義比對、建立索引,主流所采用的是“雙編碼器”架構,OpenAI的CLIP就是如此。

一個視覺編碼器處理圖片,一個文本編碼器處理文字,兩個編碼器各自獨立運行,最后再通過對比學習把它們的輸出對齊到同一個空間里。

谷歌Cloud團隊在技術博客中寫到:因為兩個編碼器是分開的,它們只在最后階段才見面,所以錯過了在網(wǎng)絡中間層形成深層跨模態(tài)連接的機會。

就好比兩個翻譯各自把一本書翻成了不同的語言,然后試圖在目錄層面對齊。它們的字面意思或許能對上,但原文中那些微妙的語境、情緒,在這個過程中已經(jīng)丟失了。

到了Gemini Embedding 2這里,當模型處理一張配有文字說明的產(chǎn)品圖時,它不是分別理解圖片和文字再拼接結果,而是像人類一樣,把視覺信息和語言信息當作一個整體來感知。

這也造就了檢索的一種新玩法:交錯輸入(interleaved input)。

開發(fā)者可以在一次API調(diào)用中同時傳入一段文字、三張圖片和一段音頻,模型會返回一個捕捉了所有跨模態(tài)關系的統(tǒng)一向量。

說得再直觀一點。比如一家電商平臺想做“以圖搜物”功能,但用戶的需求比較復雜:他拍了一張朋友穿的外套照片,同時輸入文本:“和這個款式類似但顏色要偏暖”。

在傳統(tǒng)方案下,系統(tǒng)只能要么理解圖片、要么理解文字,總是顧此失彼,兩條線索無法合流。

而交錯輸入允許模型生成一個同時編碼了“外套版型”和“暖色調(diào)”的統(tǒng)一向量,再用這個向量去商品庫里做檢索。

兩種模態(tài)的信息在向量層面真正交匯成了一個完整的意圖。

03

Vibe Searching時代來了

如果說用自然語言編程標志著我們進入了Vibe Coding時代,那么拿著一段描述、一張圖、一段音頻就能找到高度匹配的多模態(tài)內(nèi)容,標志著我們正在進入Vibe Searching時代。

當新embedding模型接入谷歌Workspace以后,Gemini可以準確分析那些混合了圖片和表格的金融文檔;在Gmail里,你記不清楚郵件的關鍵詞,你只需要給個模糊信息就能找到那封郵件。接入YouTube,用戶即便忘了視頻標題和博主名字,只要描述視頻的內(nèi)容和風格,就能精準找到對應的視頻。

模型不再是對關鍵詞做匹配,而可以理解審美、風格和氛圍。

搜索的本質也對應發(fā)生變化:從前要精確匹配關鍵詞,現(xiàn)在只需模糊表達意圖。

你不再需要知道你要找的東西叫什么,你只需要告訴它,這個東西給你的感覺是什么。

這個轉變對內(nèi)容行業(yè)的沖擊尤其值得關注。如今的內(nèi)容推薦極度依賴人工打標簽,沒被標注的好內(nèi)容往往石沉大海。

模型理解不了一個作品的好,因為它只能孤立地看畫面、聽音樂、讀文案。

現(xiàn)在的AI無法像人類一樣對美感有意會。

而Gemini Embedding 2卻能從綜合視角去“意會”一個作品,仿佛擁有了人類審美。

它可以聽出這首歌的旋律氣質和某類用戶的聽歌偏好之間的語義距離,然后把它推到對的人面前。好內(nèi)容不再需要會自我營銷,它只需要是好內(nèi)容。

企業(yè)的知識管理也是同理。

比如說一家運營了十年的制造企業(yè),它的網(wǎng)盤里躺著上萬份技術手冊、產(chǎn)品圖紙、質檢報告和會議錄音。

某天一個新入職的工程師遇到了一個良品率異常的問題,他隱約記得老師傅提過類似的案例,但不知道記錄在哪里。

可能某個PDF里的一張圖表中提到過類似的事情,也可能是某次會議錄音里的一段討論。以前他只能挨個問人、翻文件夾碰運氣。

而在跨模態(tài)檢索的加持下,他可以直接描述問題的特征,系統(tǒng)就能從圖表、錄音、文檔中同時檢索,把三年前一位已經(jīng)離職的老哥在某次會議上提到的解決方案精準地調(diào)出來。



企業(yè)最寶貴的經(jīng)驗不再系于某個人的記憶,知識庫從一個堆放雜物的倉庫,變成了一個隨時響應、迅速調(diào)用的實時大腦。

更遠一些看,在具身智能領域,跨模態(tài)嵌入可能成為機器人理解物理世界的基礎設施。當一個倉儲機器人聽到“把那個紅色的、摸起來比較軟的東西拿過來”時,它可以同時處理語言指令、視覺識別和觸覺記憶,并在語義空間中找到這三者的交匯點。

在統(tǒng)一的向量空間里建立視覺、聽覺與邏輯的通感,這恰恰是Gemini Embedding 2所擅長的事情,讓機器人不再機械地執(zhí)行預設指令,而是像人一樣在真實的物理空間中感知、判斷、行動。

谷歌已經(jīng)出手了。留給對手的時間窗口,正在關閉。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
媽耶!就一首代表作也能開演唱會,票價賣到1180,到底誰給的自信

媽耶!就一首代表作也能開演唱會,票價賣到1180,到底誰給的自信

八卦南風
2026-04-14 12:21:59
許家印趕在兩高新出司法解釋生效前認罪悔罪!距離死刑一步之差?

許家印趕在兩高新出司法解釋生效前認罪悔罪!距離死刑一步之差?

一支破筆半支煙
2026-04-14 20:40:06
歐冠綜述:大巴黎雙殺利物浦 總分4-0進4強 馬競3-2淘汰十人巴薩

歐冠綜述:大巴黎雙殺利物浦 總分4-0進4強 馬競3-2淘汰十人巴薩

我愛英超
2026-04-15 05:04:46
瘋狂!種馬男星沃倫睡過12775名女友,性欲成癮纏著女友不讓下床

瘋狂!種馬男星沃倫睡過12775名女友,性欲成癮纏著女友不讓下床

錢小刀娛樂
2026-04-14 10:39:13
向華強自曝與向太分房睡十多年,“她凌晨刷短劇,我剛醒她正要睡”,網(wǎng)友:相愛和尊重不矛盾

向華強自曝與向太分房睡十多年,“她凌晨刷短劇,我剛醒她正要睡”,網(wǎng)友:相愛和尊重不矛盾

臺州交通廣播
2026-04-14 19:33:51
2-1!紅牌!巴薩慘遭淘汰:歐冠出局,馬競挺進4強,亞馬爾進球

2-1!紅牌!巴薩慘遭淘汰:歐冠出局,馬競挺進4強,亞馬爾進球

足球狗說
2026-04-15 05:01:30
曾志偉壽宴,葉子楣搶盡風頭,邱淑貞顏值崩塌,和溫碧霞像兩代人

曾志偉壽宴,葉子楣搶盡風頭,邱淑貞顏值崩塌,和溫碧霞像兩代人

有范又有料
2026-04-14 15:43:41
安達曼海發(fā)生船只傾覆事故約250人失蹤

安達曼海發(fā)生船只傾覆事故約250人失蹤

財聯(lián)社
2026-04-14 23:20:07
金正恩表態(tài)了!

金正恩表態(tài)了!

西樓飲月
2026-04-14 21:36:14
臉沒恢復就別出來拍劇了,頂著腫脹臉、笨重假發(fā)套,太讓人出戲了

臉沒恢復就別出來拍劇了,頂著腫脹臉、笨重假發(fā)套,太讓人出戲了

白面書誏
2026-04-14 18:34:11
伊朗總統(tǒng)贊揚中國等6國反戰(zhàn)立場

伊朗總統(tǒng)贊揚中國等6國反戰(zhàn)立場

國際在線
2026-04-15 06:55:12
斯諾克大冷門!頭號種子翻車,2冠軍陪跑,3大00后進正賽創(chuàng)紀錄!

斯諾克大冷門!頭號種子翻車,2冠軍陪跑,3大00后進正賽創(chuàng)紀錄!

劉姚堯的文字城堡
2026-04-15 06:12:28
司馬南的綠卡和胡錫進的沃爾沃

司馬南的綠卡和胡錫進的沃爾沃

關爾東
2026-04-14 19:15:14
46天損失2700億,伊朗扛不?。恐袞|5國收通知,必須賠償戰(zhàn)爭損失

46天損失2700億,伊朗扛不???中東5國收通知,必須賠償戰(zhàn)爭損失

頭條爆料007
2026-04-14 19:06:45
“祭品”許家印

“祭品”許家印

海濤評論
2026-04-14 21:54:33
黃燦燦自曝為了防止《浪姐》惡意剪輯,每天都會梳不一樣的頭發(fā)

黃燦燦自曝為了防止《浪姐》惡意剪輯,每天都會梳不一樣的頭發(fā)

韓小娛
2026-04-13 16:42:00
多個省級政府領導班子調(diào)整

多個省級政府領導班子調(diào)整

上觀新聞
2026-04-14 17:04:07
法西等17國外長聯(lián)合聲明呼吁黎以把握談判機遇

法西等17國外長聯(lián)合聲明呼吁黎以把握談判機遇

財聯(lián)社
2026-04-15 00:16:09
3萬就立案!民企老板挪用自己公司資金,也要按貪官標準判刑了?

3萬就立案!民企老板挪用自己公司資金,也要按貪官標準判刑了?

今朝牛馬
2026-04-14 22:27:13
奉賢海灣“鳳凰菲尼仕杯”自行車公開賽臨時交通管制通告

奉賢海灣“鳳凰菲尼仕杯”自行車公開賽臨時交通管制通告

上海交警
2026-04-14 15:14:24
2026-04-15 08:16:49
字母榜 incentive-icons
字母榜
讓未來不止于大。
2374文章數(shù) 8058關注度
往期回顧 全部

科技要聞

離職同事"煉化"成AI?這屆公司不需要活人了

頭條要聞

與伊朗談判破裂后 特朗普最新表態(tài)

頭條要聞

與伊朗談判破裂后 特朗普最新表態(tài)

體育要聞

帶出中超最大黑馬!他讓球迷們“排隊道歉”

娛樂要聞

網(wǎng)曝鐘麗緹代孕要了個男孩 備孕近10年

財經(jīng)要聞

許家印認罪,他和恒大還有多少欠債?

汽車要聞

售12.99萬起/續(xù)航2000km 風云T9L上市

態(tài)度原創(chuàng)

親子
房產(chǎn)
教育
藝術
軍事航空

親子要聞

盤點人類幼崽的狠人行為

房產(chǎn)要聞

改善標桿,1.5w+起橫掃國興!海口樓市,打出最猛一張牌!

教育要聞

武昌工學院牽手澳大利亞皇家墨爾本理工大學共筑國際化育人平臺

藝術要聞

江青康生絕密信曝光,草書筆跡生硬引發(fā)熱議!

軍事要聞

萬斯:對當前美伊局勢進展“感到樂觀”

無障礙瀏覽 進入關懷版