国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌Gemini 3,擴展才是AI硬道理

0
分享至

谷歌Gemini 3的發(fā)布,炸裂了籠罩AI的陰霾,讓。有泡沫現(xiàn)象,但AGI并沒有止步,預(yù)訓(xùn)練的擴展定律也沒有死,谷歌正在大步朝這個方向前進,并且用TPU而不是GPU首次訓(xùn)練出了公認最好的前沿大模型。OpenAI的奧特曼與xAI的馬斯克,都為此點了贊。

谷歌非常自信,稱Gemini 3擁有最先進的推理能力,領(lǐng)先的多模態(tài)理解能力,帶來了全新的智能體編碼體驗。這將支持Gemini應(yīng)用從當前6.5億月活成為10億用戶以上的超級應(yīng)用,并深度重塑搜索、Gmail、地圖等7個擁有20億用戶的產(chǎn)品體驗。谷歌還擁有機器人、游戲、藥物發(fā)現(xiàn)、材料科學等長期萬億級新賽道。

桑達爾·皮查伊已經(jīng)看到,當前的AI熱潮中存在一些“非理性”,但谷歌能夠經(jīng)受住這場潛在的風暴。也許,全棧AI能力的反脆弱性。谷歌正在建立起token經(jīng)濟學,算力需求將越來越大,真正的價值錨點在于任務(wù)執(zhí)行與體驗重構(gòu)。

預(yù)訓(xùn)練擴展復(fù)活

相比曾備受期待的GPT-5,第一時間用上Gemini 3的人要幸福得多。它不僅打破了半年多來行業(yè)小步迭代的沉悶,更以全面而大幅度的躍升,重新驗證了預(yù)訓(xùn)練擴展定律的關(guān)鍵路徑。這對提升每一枚token所蘊含的價值影響巨大。

基準測試已然成為噪音,但谷歌成功地用它傳遞出更大的信息量來。這主要是因為現(xiàn)存基準趨于飽和,個別的小幅的進步,已經(jīng)不足以反映它在現(xiàn)實任務(wù)中的實際能力,也就無法準確衡量其token價值。但是,全面領(lǐng)先且遙遙領(lǐng)先,意義就不一樣了。

在行業(yè)主流的20個基準測試中,Gemini 3 Pro在其中的19個項目上獲得了最高分,超越了Gemini 2.5 Pro、Claude Sonnet 4.5和GPT-5.1。尤其是在ARC-AGI-2上,Gemini 3和Gemini 3 Deep Think,更是將成本與精度的帕累托前沿,向有利方向推得更遠了一些。該測試基準旨在衡量模型對從未見過的任務(wù)的推理能力,難以死記硬背。


很長一段時間以來,其他旗艦?zāi)P投紵o法在ARC-AGI 2上取得跨越式的進步,都擠在0%到15%的狹窄區(qū)間里內(nèi)卷。這次,相對此前的標桿模型GPT-5.1 Thinking(High),Gemini 3 Pro不僅在得分上遙遙領(lǐng)先,超過13個百分點,每個任務(wù)還僅花費了0.81美元,便宜了0.36美元。Gemini 3 Deep Think更是瘋狂,達到45%,證實了如果需要,可以用更多的token,去解決原本即使花再多的token也沒辦法解決的難題。

谷歌沒有解釋它是如何成功的,但有兩個細節(jié)值得注意。第一,谷歌Gemini Deep Think上一次那么亮眼,是取得了(IMO)的金牌。當時,谷歌介紹這是一個尚未發(fā)布的能“并行思考”的進階模型。第二,這次,谷歌DeepMind研究副總裁兼深度學習負責人Oriol Vinyals揭秘,團隊在預(yù)訓(xùn)練擴展定律上取得了巨大的飛躍,而后訓(xùn)練同樣仍然是一片全新的領(lǐng)域。

有人推測,Gemini 3的總參數(shù)規(guī);蛟5萬億(T)以上。此前,蘋果就傳出明年將用1.2萬億參數(shù)的Gemini模型徹底改造自己的Siri。

預(yù)訓(xùn)練擴展定理的復(fù)蘇,對整個行業(yè)來說都是好消息。在Gemini 3發(fā)布后,哈薩比斯等人接受《紐約時報》采訪稱,AI的進步完全符合過去兩年的軌跡,他維持AGI仍需5至10年以及若干重大突破的判斷。在此之前,通過擴展基礎(chǔ)模型規(guī)模持續(xù)推動性能,仍然是最有效的策略。

此外,在多模態(tài)與智能體相關(guān)的多項基準測試上,Gemini 3也大幅領(lǐng)先。據(jù)其模型卡,這個MOE模型原生支持文本、圖像、音頻和視頻輸入。它在幻覺相關(guān)基準上(SimpleQA Verified)的得分,也要比GPT-5高得多,當時,正是后者的重點營銷方向。

一個小彩蛋是,在Gemini 3 Pro的模型評估官方文檔中,它對圖像測試基準OmniDocBench 1.5的方法論,嚴格遵循10月DeepSeek-OCR。

反重力的超級應(yīng)用

不過,真正決定 token 經(jīng)濟學成立的,不是基準,而是能否為用戶解決真實問題,以及解決這些問題創(chuàng)造的價值超過消耗的成本。市場對基準的詬病,在于它與實際用戶體驗之間的背離。這也是目前引發(fā)“AI泡沫”質(zhì)疑的關(guān)鍵因素之一。

在前述采訪中,Gemini 團隊負責人沃德伍德(Josh Woodward)稱,谷歌更關(guān)注的指標是,今天幫用戶完成了多少項任務(wù)。他還對“情色伴侶”病毒式增長機會表示不屑。

同期發(fā)布的Google AntiGravity,其命名本身就是對當前AI應(yīng)用困境的隱喻式的回應(yīng)!胺粗亓Α彼獟昝摰模悄切┳層脩趔w驗“墜地”的束縛。為了實現(xiàn)真正的“體驗飛升”(liftoff),這款新一代IDE(集成開發(fā)環(huán)境)產(chǎn)品并非僅為人類開發(fā)者優(yōu)化,更是智能體優(yōu)先(Agent-First),支持多智能體在長周期內(nèi)主動規(guī)劃、并行執(zhí)行、自主驗證。顯然,在提升token價值的同時,也帶來了更多的token消耗。

Gemini 3 現(xiàn)已能在百萬行代碼規(guī)模的系統(tǒng)中,深度穩(wěn)定地多步推理與調(diào)試。一個智能體可在前臺專注復(fù)雜編碼,另一個則在后臺同步調(diào)研資料;它們交付的“產(chǎn)物”(Artifacts),更易于用戶驗證。用戶可在任意界面異步反饋(如圈注截圖、評論文本),這些輸入將自動融入智能體的執(zhí)行流;而智能體的歷史行動也會沉淀為知識資產(chǎn),既包括可復(fù)用的顯性知識(如代碼片段),也涵蓋完成子任務(wù)的隱性經(jīng)驗(如一系列步驟)!叭嗽诨芈分小保℉ITL)正從 “人類修復(fù)AI錯誤” 演變?yōu)椤叭祟愔笓]AI工作”。

同樣的邏輯也延伸至AI原生的搜索體驗。這次,谷歌提出Generative UI,讓搜索不再只是“回答問題”,呈現(xiàn)鏈接、文本或已有的視頻,而是實時動態(tài)地生成一個為用戶搜索量身定制的可視化或者可交互的界面。這涉及到大量的工具調(diào)用(Tool Access)與后處理(Post-processing)。


谷歌抵御在“AI 泡沫”中下墜的邏輯,在于讓token在不斷生成的過程中,就迅速得以消納,源源不斷地轉(zhuǎn)化為現(xiàn)金流,以及用戶黏性與使用時長。谷歌目前擁有7個20億用戶的超級應(yīng)用,AI原生的超級應(yīng)用Gemini的月活躍用戶數(shù)量也從3月的3.5億提升至目前的6.5 億,并繼續(xù)向著10億用戶成長。

在接受BBC采訪時,皮查伊稱,當前的AI熱潮中存在一些“非理性”,沒有哪家公司能夠幸免,但谷歌能夠經(jīng)受住這場潛在的風暴。哈薩比斯也稱,得益于谷歌同時擁有短期變現(xiàn)與長期萬億級新賽道,無論短期泡沫是否存在,谷歌都將勝出,“我們從未失去研究領(lǐng)先地位,現(xiàn)在只是產(chǎn)品落地終于跟上”。

TPU、Token與Talent

谷歌的研究地位與產(chǎn)品地位,日趨鞏固。在定制化TPU芯片上的全棧優(yōu)勢,使谷歌的訓(xùn)練成本和推理效率超過依賴外部GPU資源的競爭者;龐大用戶生態(tài)的終端數(shù)據(jù)反饋,也是其他競爭者無法逾越的護城河。如果AI進入短暫的泡沫破滅期,谷歌護城河的相對優(yōu)勢,反而會因此進一步放大。

在模型卡上,谷歌明確承認,Gemini 3的預(yù)訓(xùn)練建立在谷歌自己的TPU之上。除了公開可下載的數(shù)據(jù)集、通過爬蟲獲取的數(shù)據(jù)、AI生成的合成數(shù)據(jù)、通過商業(yè)許可協(xié)議獲得的授權(quán)數(shù)據(jù),它的預(yù)訓(xùn)練數(shù)據(jù)集還來自在“適當情況下尊重用戶控制權(quán)”的用戶數(shù)據(jù),以及谷歌在其業(yè)務(wù)運營中獲取或生成的其他數(shù)據(jù)。

谷歌的TPU保證了它擁有更低的總擁有成本,也就降低了單位token成本。這有助于它繼續(xù)低成本地將用戶與數(shù)據(jù)吸納到自己的創(chuàng)新閉環(huán)中來。而谷歌Gemini 3對外的API價格,相對Gemini 2.5有所提價,部分也得益于它的模型競爭力的溢價,也就提高了單位token的利潤率。Gemini 3比OpenAI標準款的GPT-5.1要貴一點,但又比Pro款便宜。

更重要的是,既然擴展定律仍然有效,AGI 仍需多年和更多突破,頂尖人才與研究投入就變得至關(guān)重要。激勵與吸引人才的不僅是金錢,還包括不受限制的算力。據(jù)EpochAI對OpenAI去年開支的推斷,它在推理上只消耗了約29%的token,剩下的絕大多數(shù)都用于研發(fā),其中,旗艦?zāi)P虶PT-4.5僅花費了不到6%,其他模型約1%,剩下的64%都用在了實驗性探索或未發(fā)布模型的基礎(chǔ)研究上。谷歌也不會例外,只是強大的算力支撐了它在AI研究方面的“貝爾實驗室”地位。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
U23國足20分鐘丟2球!小倉幸成遠射世界波,王鈺棟低級失誤

U23國足20分鐘丟2球!小倉幸成遠射世界波,王鈺棟低級失誤

奧拜爾
2026-01-24 23:27:54
民進黨準備下死手,黃國昌攜美密令向大陸遞投名狀,統(tǒng)一已成定局

民進黨準備下死手,黃國昌攜美密令向大陸遞投名狀,統(tǒng)一已成定局

小俎娛樂
2026-01-25 14:34:15
布呂尼:從妻子變兒媳,同時和父子談戀愛,最終成為法國第一夫人

布呂尼:從妻子變兒媳,同時和父子談戀愛,最終成為法國第一夫人

青途歷史
2026-01-23 20:12:55
明確規(guī)定來了!機關(guān)事業(yè)單位職工下班后打牌打麻將,算違紀嗎?

明確規(guī)定來了!機關(guān)事業(yè)單位職工下班后打牌打麻將,算違紀嗎?

阿纂看事
2026-01-24 09:56:48
78年王近山病逝,鄧小平看過訃告上的軍級之后,坦言:確實不合適

78年王近山病逝,鄧小平看過訃告上的軍級之后,坦言:確實不合適

元哥說歷史
2026-01-25 14:45:03
打臉黑子,湖人逆轉(zhuǎn)獨行俠,賽后還有5個好消息,東契奇喜笑顏開

打臉黑子,湖人逆轉(zhuǎn)獨行俠,賽后還有5個好消息,東契奇喜笑顏開

鄒維體育
2026-01-25 12:17:55
此人叛變新四軍,1949年李先念主動宴請他,他舉報:有人要叛變

此人叛變新四軍,1949年李先念主動宴請他,他舉報:有人要叛變

大運河時空
2026-01-25 17:05:03
越共中央政治局,“新面孔”接近一半

越共中央政治局,“新面孔”接近一半

中國新聞周刊
2026-01-24 19:46:04
2026年養(yǎng)老金繼續(xù)漲?人社部部長表態(tài)了!取消掛鉤調(diào)整可行嗎?

2026年養(yǎng)老金繼續(xù)漲?人社部部長表態(tài)了!取消掛鉤調(diào)整可行嗎?

李健政觀察
2026-01-25 13:08:19
49年,裝滿50箱大洋的飛機墜毀,當?shù)厝四寐榇鼡專瑓s付出慘痛代價

49年,裝滿50箱大洋的飛機墜毀,當?shù)厝四寐榇鼡專瑓s付出慘痛代價

雍親王府
2026-01-25 08:20:03
白宮發(fā)布“特朗普和企鵝漫步格陵蘭島”圖,遭群嘲

白宮發(fā)布“特朗普和企鵝漫步格陵蘭島”圖,遭群嘲

新華社
2026-01-25 16:55:04
井柏然曬北京千萬豪宅!水泥地換成木板土氣,陽臺和劉雯合照搶鏡

井柏然曬北京千萬豪宅!水泥地換成木板土氣,陽臺和劉雯合照搶鏡

曉徙娛樂
2026-01-25 04:21:24
肯德基,被迫改名PFK

肯德基,被迫改名PFK

設(shè)計癖
2026-01-24 12:13:41
丈夫項英犧牲后,李又蘭改嫁張愛萍,生下三個兒子都是牛人

丈夫項英犧牲后,李又蘭改嫁張愛萍,生下三個兒子都是牛人

史韻流轉(zhuǎn)
2026-01-25 06:25:03
“臘八3不吃,福氣進家門”,指哪3不吃?臘八節(jié)來臨,莫忘老傳統(tǒng)

“臘八3不吃,福氣進家門”,指哪3不吃?臘八節(jié)來臨,莫忘老傳統(tǒng)

神牛
2026-01-24 15:00:25
陪睡陪玩只是冰山一角!萬達蒸發(fā)800億后,王思聰再次傳出大丑聞

陪睡陪玩只是冰山一角!萬達蒸發(fā)800億后,王思聰再次傳出大丑聞

阿器談史
2025-12-26 15:26:05
快報調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

快報調(diào)查|嫣然醫(yī)院與嫣然基金的賬本迷局

現(xiàn)代快報
2026-01-24 18:53:06
14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個好老婆有多重要

14年后,再看“京城四少”的現(xiàn)狀,才明白娶一個好老婆有多重要

豐譚筆錄
2026-01-13 07:20:11
“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

“秦嵐”也太凡爾賽了吧!穿一身瑜伽服凹凸有致,巴掌腰太搶鏡

巧手曉廚娘
2025-12-30 18:59:18
從草根到頂流,趙麗穎能“輸?shù)闷稹钡牡着疲旱艿懿攀钦嬲氖刈o者

從草根到頂流,趙麗穎能“輸?shù)闷稹钡牡着疲旱艿懿攀钦嬲氖刈o者

夢在深巷qw
2026-01-25 10:22:47
2026-01-25 17:27:00
未盡研究 incentive-icons
未盡研究
新能源、人工智能、合成生物、地緣X
292文章數(shù) 61關(guān)注度
往期回顧 全部

科技要聞

黃仁勛在上海逛菜市場,可能惦記著三件事

頭條要聞

獲黃仁勛簽名紅包商戶:我開始不認識他 紅包里有600元

頭條要聞

獲黃仁勛簽名紅包商戶:我開始不認識他 紅包里有600元

體育要聞

中國足球不會一夜變強,但他們已經(jīng)創(chuàng)造歷史

娛樂要聞

王玉雯方嚴正聲明 劇方回應(yīng):涉事人員已被開除

財經(jīng)要聞

隋廣義等80人被公訴 千億騙局進入末路

汽車要聞

別克至境E7內(nèi)飾圖曝光 新車將于一季度正式發(fā)布

態(tài)度原創(chuàng)

本地
藝術(shù)
旅游
家居
公開課

本地新聞

云游中國|格爾木的四季朋友圈,張張值得你點贊

藝術(shù)要聞

全認識這13個字的人,能否復(fù)印王羲之的作品?

旅游要聞

迎寒盛開!貴州梅園正式開園

家居要聞

在家度假 160平南洋混搭宅

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版