国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

GPT-5之后,奧特曼向左,梁文鋒向右

0
分享至

  

  GPT-5正式發(fā)布,雖然在測(cè)試集上登頂,但用戶反饋卻褒貶不一,不少用戶希望能保留GPT-4o。OpenAI希望通過(guò)增加模型路由功能,以不同模型,不同算力成本滿足不同用戶需求的目標(biāo)。

  就目前的體驗(yàn)來(lái)看,OpenAI想要的“統(tǒng)一模型”的努力還任重道遠(yuǎn)。而GPT-5沒(méi)有出現(xiàn)模型能力的顯著突破和技術(shù)范式的更新,OpenAI做的更多是產(chǎn)品化創(chuàng)新——GPT-5是一個(gè)幻覺(jué)更少,更易用,能幫用戶解決更多具體問(wèn)題的模型,但是沒(méi)有新能力,也沒(méi)有徹底解決大模型的某個(gè)結(jié)構(gòu)性缺陷。

  而近日,有外媒報(bào)道DeepSeek正在用國(guó)產(chǎn)芯片訓(xùn)練最新的模型,但是新模型的發(fā)布日期依然不定。

  GPT-5的發(fā)布似乎表明,大模型能力上限疑似撞墻。在這堵“Transformer能力邊界之墻”面前,OpenAI選擇了將現(xiàn)有能力產(chǎn)品化到極致,將“超級(jí)APP”的敘事進(jìn)行到底。而DeepSeek在追求模型上限的競(jìng)爭(zhēng)壓力變緩時(shí),正在開(kāi)啟“自給自足”的支線任務(wù)。

  一心要用AGI將人類(lèi)社會(huì)帶入“極度富足”狀態(tài)的OpenAI在做超級(jí)APP的路上漸行漸遠(yuǎn),營(yíng)收和估值一路飆升;而希望探索AI能力上限,搭建開(kāi)源生態(tài)推進(jìn)技術(shù)普惠的DeepSeek,需要解的可能是不同的題目。

  也許多年后,當(dāng)人們回顧大模型行業(yè)發(fā)展的時(shí)間線時(shí)會(huì)發(fā)現(xiàn),多條線路相交于DeepSeek R1和GPT-4o發(fā)布,分化于GPT-5之后。

  01

  性能霸榜卻未達(dá)預(yù)期的GPT-5,加速產(chǎn)品化

  市場(chǎng)期待的是一次范式轉(zhuǎn)移,一次足以重新定義人機(jī)交互的時(shí)刻。但最終的結(jié)果,更像是一次常規(guī)的升級(jí)。它的模型參數(shù)更多,訓(xùn)練數(shù)據(jù)更廣,在一些基準(zhǔn)測(cè)試中得分更高,但它在核心的智能層面,并未展現(xiàn)出革命性的進(jìn)步。紐約大學(xué)名譽(yù)教授加里·馬庫(kù)斯曾用三個(gè)詞來(lái)概括GPT-5的表現(xiàn):“姍姍來(lái)遲、過(guò)度炒作、平庸無(wú)奇”。

  他的分析指出,GPT-5未能根除大型語(yǔ)言模型固有的缺陷。它仍然會(huì)在某些時(shí)候編造事實(shí),即所謂的“幻覺(jué)”問(wèn)題。在面對(duì)需要多步邏輯推理的任務(wù)時(shí),它仍然會(huì)犯錯(cuò)。在提供現(xiàn)實(shí)世界的理解的多模態(tài)性能上,也沒(méi)有什么質(zhì)的提升。

  這些問(wèn)題在GPT-4時(shí)代就存在,業(yè)界曾希望GPT-5能提供解決方案,但現(xiàn)實(shí)是OpenAI選擇了對(duì)現(xiàn)有框架進(jìn)行修補(bǔ)和優(yōu)化。然后在此能力基礎(chǔ)之上提供一個(gè)產(chǎn)品化更好,更加易用的模型工具。

  

  如果說(shuō)核心智能的停滯是技術(shù)專(zhuān)家和深度用戶的感受,那么其在多模態(tài)能力上有限的進(jìn)步,則讓技術(shù)愛(ài)好者感到失望。在GPT-5發(fā)布之前,一個(gè)普遍的共識(shí)是,下一代人工智能的決勝場(chǎng)將是多模態(tài)。人們想象中的GPT-5應(yīng)該能像人類(lèi)一樣,無(wú)縫地接收、理解和融合處理來(lái)自文本、圖像、音頻、視頻等多種渠道的信息。然而,現(xiàn)實(shí)中的GPT-5在多模態(tài)交互上的表現(xiàn),更像是一個(gè)經(jīng)過(guò)優(yōu)化的GPT-4V。它能精準(zhǔn)地完成描述性任務(wù),比如識(shí)別照片中的物體,但一旦任務(wù)轉(zhuǎn)向理解,它的能力邊界就顯現(xiàn)出來(lái)。

  作為將Transformer算法能力和語(yǔ)言最早進(jìn)行結(jié)合,用ChatGPT開(kāi)創(chuàng)了大模型時(shí)代,又將強(qiáng)化學(xué)習(xí)有機(jī)地融入大模型的訓(xùn)練過(guò)程中,捅破了大模型推理能力天花板的OpenAI,一直以來(lái)都是業(yè)界的標(biāo)桿。但是GPT-5發(fā)布之后,除去性能上的“未達(dá)預(yù)期”之外,獲得獲得外界關(guān)注的特性似乎都是產(chǎn)品級(jí)別的變化。

  OpenAI希望通過(guò)“模型路由”功能來(lái)讓用戶避免在眾多模型中進(jìn)行選擇,降低新用戶的使用門(mén)檻,同時(shí)也能合理化算力分配,使得OpenAI能夠在有限的算力資源下為更多的用戶提供更加高質(zhì)量的服務(wù)。

  按照OpenAI的說(shuō)法,雖然GPT-5大幅降低了模型的幻覺(jué),但是對(duì)于一些基礎(chǔ)的數(shù)理問(wèn)題和對(duì)現(xiàn)實(shí)世界的理解上,表現(xiàn)難以說(shuō)得上令人滿意,依然會(huì)出現(xiàn)很多明顯的錯(cuò)誤。相反,可能由于訓(xùn)練數(shù)據(jù)中用了更多的生產(chǎn)力相關(guān)內(nèi)容,在情商上還有很大的退步,引得普通聊天用戶用取關(guān)來(lái)威脅GPT-4o的“返場(chǎng)”。

  GPT-5表現(xiàn)出OpenAI在大模型能力突破的“躺平”,幾乎間接宣布了“大模型能力墻”已經(jīng)到來(lái),或者至少是大模型技術(shù)突破暫時(shí)進(jìn)入了平緩期。未來(lái)模型能力能否重新回到“GPT-3到GPT-4o”這樣的“蒙眼狂奔”的快車(chē)道,依賴于研究人員在底層技術(shù)上的突破和創(chuàng)新。

  OpenAI前首席科學(xué)家Ilya曾經(jīng)在2023年底的“Why next-token prediction is enough for AGI”訪談中對(duì)于AI技術(shù)發(fā)展趨勢(shì)的總結(jié)似乎某種程度上預(yù)言了這一刻的到來(lái)。

  

  “不同的研究人員和項(xiàng)目會(huì)在一個(gè)時(shí)間段內(nèi)有不同的方向,然后當(dāng)人們發(fā)現(xiàn)了一個(gè)技術(shù)有效之后,研究會(huì)向那個(gè)方向快速收斂,之后可能又會(huì)回歸到之前百花爭(zhēng)鳴的狀態(tài)”

  02

  梁文鋒能否抓住時(shí)機(jī),完成國(guó)產(chǎn)大模型的“自給自足”

  如果Transformer技術(shù)墻真的已經(jīng)到來(lái),我們對(duì)DeepSeek還能有什么合理的期待?縱觀DeepSeek的產(chǎn)品發(fā)布?xì)v史,每一個(gè)重量級(jí)的發(fā)布,都在它自己的時(shí)間線上解決了大模型技術(shù)上某個(gè)重要問(wèn)題。

  2024年5月的DeepSeek-V2系列則革命性地處理了長(zhǎng)上下文處理的效率問(wèn)題,首創(chuàng)多頭潛注意力(MLA)機(jī)制,支持高達(dá)128K token的處理,同時(shí)以極低的API定價(jià)(每百萬(wàn)token 2元人民幣)引發(fā)了中國(guó)AI巨頭的價(jià)格戰(zhàn),顯著提升了大模型的可負(fù)擔(dān)性和實(shí)際部署潛力。

  2024年12月的DeepSeek-V3以671B參數(shù)的MoE架構(gòu)登場(chǎng),針對(duì)推理速度的痛點(diǎn)實(shí)現(xiàn)了每秒60token的3倍加速,性能達(dá)到GPT-4o的同時(shí)保持資源高效,以一己之力幾乎拉平了開(kāi)源模型和閉源模型性能上的差距。

  2025年1月的DeepSeek-R1專(zhuān)注于推理能力的提升,在AIME和MATH任務(wù)上匹敵或超越OpenAI的o1模型,成本遠(yuǎn)遠(yuǎn)低于當(dāng)時(shí)的所有模型,通過(guò)App登頂美國(guó)App Store,解決了高端AI的訪問(wèn)壁壘問(wèn)題,加速了開(kāi)源AI的全球普及與民主化。

  而在V3和R1讓DeepSeek徹底出圈之后,它似乎也從一家發(fā)源于量化,成名于大模型,變成了一家肩負(fù)起了更多使命的科技公司。

  根據(jù)外媒報(bào)道,DeepSeek目前正在將最先進(jìn)大模型的訓(xùn)練轉(zhuǎn)移到國(guó)產(chǎn)芯片之上。大模型的國(guó)產(chǎn)化之路,遠(yuǎn)比普通人想象的要困難。但是在不穩(wěn)定的地緣政治等各種因素的影響之下,如果沒(méi)有辦法擺脫對(duì)英偉達(dá)GPU的依賴,所有中國(guó)AI公司的頭上,永遠(yuǎn)懸掛著一把達(dá)摩克里斯之劍。

  而此時(shí)OpenAI發(fā)布的GPT-5,暗示了以Transformer為核心的大模型技術(shù),發(fā)展曲線暫時(shí)變緩。這給了包括DeepSeek在內(nèi)的所有科技公司一個(gè)信號(hào)——可以在不斷穩(wěn)定提升模型性能的主線任務(wù)之外,放心地點(diǎn)開(kāi)其他支線了。

  而要實(shí)現(xiàn)前沿性能大模型從訓(xùn)練到推理的國(guó)產(chǎn)化,即便對(duì)于一家已經(jīng)將大模型研發(fā)從“原子彈變成茶葉蛋”的頂尖AI公司來(lái)說(shuō),難度不亞于再研發(fā)一種全新的原子彈。這個(gè)過(guò)程中需要解決的技術(shù)問(wèn)題,可能比訓(xùn)練DeepSeek之前發(fā)布的所有模型需要攻克的難題加起來(lái)還要多得多。

  首先是國(guó)產(chǎn)GPU本身性能和英偉達(dá)的GPU的單卡性能相比依然還有接近代際的差距。即便是國(guó)產(chǎn)GPU已經(jīng)能通過(guò)更密集的互聯(lián)技術(shù)將單卡的性能差距盡力彌補(bǔ)。但是要和硅谷大模型采用的英偉達(dá)“10萬(wàn)卡集群”競(jìng)爭(zhēng),采用國(guó)產(chǎn)GPU訓(xùn)練性能最頂尖的模型,需要面對(duì)難以想象的工程難題。

  
大模型研發(fā)離不開(kāi)像PyTorch或TensorFlow這樣的開(kāi)源框架,這些框架原本是為國(guó)際主流硬件優(yōu)化的。如果DeepSeek要國(guó)產(chǎn)化,就得把整個(gè)軟件棧遷移到本土硬件上,這意味著要重寫(xiě)或修改大量的代碼來(lái)兼容本土的計(jì)算架構(gòu)。和發(fā)展了多年的成熟主流開(kāi)源框架和CUDA生態(tài)相比,重構(gòu)的國(guó)產(chǎn)軟件棧要在性能和穩(wěn)定性上接近已經(jīng)發(fā)展近10年的主流解決方案,難度也相當(dāng)大。

  但如果DeepSeek能和國(guó)產(chǎn)硬件廠商持續(xù)密切配合,像DeepSeek將大模型的研發(fā)一樣,從零開(kāi)始一步步行至行業(yè)最前沿,才有希望徹底解下頭頂那柄達(dá)摩克里斯之劍。

  在持續(xù)改進(jìn)大模型訓(xùn)練和推理效率這個(gè)方向上,DeepSeek也依然在持續(xù)探索,取得了令人矚目的成績(jī)。

  今年7月底,由DeepSeek團(tuán)隊(duì)和北京大學(xué)等機(jī)構(gòu)發(fā)表,梁文鋒作為通訊作者的論文《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》獲得ACL 2025最佳論文獎(jiǎng)。

  

  https://arxiv.org/abs/2502.11089

  這篇論文首次將稀疏注意力從理論推理帶進(jìn)了完整訓(xùn)練流程,在保持模型性能,提高訓(xùn)練效率的同時(shí),還帶來(lái)了高達(dá) 11 倍的推理加速。在自然語(yǔ)言處理頂會(huì)ACL上獲得最佳論文獎(jiǎng),足以說(shuō)明業(yè)界對(duì)于這項(xiàng)技術(shù)含金量的認(rèn)可。

  愿意將這樣在商業(yè)競(jìng)爭(zhēng)中起到關(guān)鍵作用的創(chuàng)新公開(kāi),也體現(xiàn)了DeepSeek不斷推進(jìn)大模型技術(shù)普惠的決心和能力。

  讓我們拭目以待,融合了更多像“原生稀疏注意力”這樣的DeepSeek新模型將會(huì)在能力和效率上帶給業(yè)界多大驚喜,又能將大模型研發(fā)的國(guó)產(chǎn)化程度,推動(dòng)到哪里。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗為何廢除強(qiáng)制頭巾令?皆因以色列出手令強(qiáng)人殞落

伊朗為何廢除強(qiáng)制頭巾令?皆因以色列出手令強(qiáng)人殞落

清暉有墨
2025-10-12 09:02:36
小區(qū)樓上天天晚上都有女的大聲叫。。。

小區(qū)樓上天天晚上都有女的大聲叫。。。

微微熱評(píng)
2025-12-24 00:26:04
她曾任北京市委書(shū)記,上任3年后就被撤職,但是晚年依舊享受干部級(jí)待遇

她曾任北京市委書(shū)記,上任3年后就被撤職,但是晚年依舊享受干部級(jí)待遇

歷史回憶室
2026-01-08 21:53:12
中方下“逐客令”,直言:一粒大米也不要,直接叫停900萬(wàn)噸訂單

中方下“逐客令”,直言:一粒大米也不要,直接叫停900萬(wàn)噸訂單

愛(ài)吃醋的貓咪
2025-12-27 16:24:13
張本美和又哭了,她爸爸笑的很?chē)樔?,張本智和要奪冠,林昀儒回應(yīng)

張本美和又哭了,她爸爸笑的很?chē)樔耍瑥埍局呛鸵獖Z冠,林昀儒回應(yīng)

小七七體育解說(shuō)
2026-01-11 10:31:57
調(diào)整!1月11日央視直播WTT冠軍賽有變,CCTV5直播,附賽程!

調(diào)整!1月11日央視直播WTT冠軍賽有變,CCTV5直播,附賽程!

皮皮觀天下
2026-01-11 13:50:50
李克勤18歲長(zhǎng)子回香港探親,全家外出吃火鍋,盧淑儀搭肩倆子合照

李克勤18歲長(zhǎng)子回香港探親,全家外出吃火鍋,盧淑儀搭肩倆子合照

庸人自擾0607
2026-01-11 12:39:19
廣東洗碗機(jī)砸家后續(xù):女子被扒徹底,房東一語(yǔ)中的,具體原因流出

廣東洗碗機(jī)砸家后續(xù):女子被扒徹底,房東一語(yǔ)中的,具體原因流出

以茶帶書(shū)
2026-01-10 19:14:31
5-1、10-1!曼城藍(lán)軍殘暴狂勝,塞梅尼奧及羅塞尼爾完美首秀達(dá)成

5-1、10-1!曼城藍(lán)軍殘暴狂勝,塞梅尼奧及羅塞尼爾完美首秀達(dá)成

里芃芃體育
2026-01-11 12:50:06
申請(qǐng)超20萬(wàn)顆,衛(wèi)星通信再迎利好!商業(yè)航天最牛個(gè)股漲三倍,還能漲多少

申請(qǐng)超20萬(wàn)顆,衛(wèi)星通信再迎利好!商業(yè)航天最牛個(gè)股漲三倍,還能漲多少

金石隨筆
2026-01-11 00:10:47
突發(fā)公告炸場(chǎng)!7家A股上市公司發(fā)布重大利空消息,看看都有哪些?

突發(fā)公告炸場(chǎng)!7家A股上市公司發(fā)布重大利空消息,看看都有哪些?

股市皆大事
2026-01-11 12:11:35
相聲演員笑林:不抽煙,不喝酒,一天100個(gè)俯臥撐,59歲驟然離世

相聲演員笑林:不抽煙,不喝酒,一天100個(gè)俯臥撐,59歲驟然離世

小樾說(shuō)歷史
2026-01-10 11:57:46
閆學(xué)晶事件升級(jí)!多家官媒怒批后,又一壞消息傳來(lái),這下麻煩大了

閆學(xué)晶事件升級(jí)!多家官媒怒批后,又一壞消息傳來(lái),這下麻煩大了

天天熱點(diǎn)見(jiàn)聞
2026-01-11 08:37:35
中國(guó)向全世界曝光:美國(guó)4400顆衛(wèi)星,圍堵中國(guó)空間站,這是要干啥

中國(guó)向全世界曝光:美國(guó)4400顆衛(wèi)星,圍堵中國(guó)空間站,這是要干啥

青煙小先生
2026-01-11 11:40:11
官方:施羅德由于試圖在賽后毆打湖人球員,被禁賽三場(chǎng)

官方:施羅德由于試圖在賽后毆打湖人球員,被禁賽三場(chǎng)

懂球帝
2026-01-11 10:10:08
英警告5年內(nèi)恐與中國(guó)開(kāi)戰(zhàn),美自信:解放軍9成概率打不贏臺(tái)島

英警告5年內(nèi)恐與中國(guó)開(kāi)戰(zhàn),美自信:解放軍9成概率打不贏臺(tái)島

風(fēng)云人物看歷史
2026-01-11 13:50:08
渤海完全屬于中國(guó)!因當(dāng)年毛主席的一句話,如今沒(méi)有一艘外船敢進(jìn)

渤海完全屬于中國(guó)!因當(dāng)年毛主席的一句話,如今沒(méi)有一艘外船敢進(jìn)

抽象派大師
2025-12-11 17:05:41
11.98萬(wàn)!比亞迪宋Pro DM新增220km版本,支持54kW快速充電!

11.98萬(wàn)!比亞迪宋Pro DM新增220km版本,支持54kW快速充電!

科學(xué)技術(shù)宅
2026-01-11 14:07:58
女人偷情,跟老公和情人發(fā)生關(guān)系,哪個(gè)更重要?

女人偷情,跟老公和情人發(fā)生關(guān)系,哪個(gè)更重要?

思絮
2026-01-11 14:06:11
演都不演了,徐帆回應(yīng)離婚5個(gè)月后,馮小剛的小心思藏不住了

演都不演了,徐帆回應(yīng)離婚5個(gè)月后,馮小剛的小心思藏不住了

卷史
2026-01-10 06:07:44
2026-01-11 14:44:49
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
244文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

“我們與美國(guó)的差距也許還在拉大”

頭條要聞

日本知名女星結(jié)婚:酷似高圓圓 曾和林志玲老公交往

頭條要聞

日本知名女星結(jié)婚:酷似高圓圓 曾和林志玲老公交往

體育要聞

詹皇曬照不滿打手沒(méi)哨 裁判報(bào)告最后兩分鐘無(wú)誤判

娛樂(lè)要聞

網(wǎng)友偶遇賈玲張小斐崇禮滑雪

財(cái)經(jīng)要聞

外賣(mài)平臺(tái)"燒錢(qián)搶存量市場(chǎng)"迎來(lái)終局?

汽車(chē)要聞

2026款宋Pro DM-i長(zhǎng)續(xù)航補(bǔ)貼后9.98萬(wàn)起

態(tài)度原創(chuàng)

數(shù)碼
游戲
藝術(shù)
房產(chǎn)
軍事航空

數(shù)碼要聞

中國(guó)掃地機(jī)器人“掃”全球,2025年前三季度市場(chǎng)份額占比近70%

性感《女巨人》游戲遭吐槽:這目標(biāo)受眾到底是誰(shuí)

藝術(shù)要聞

福布斯最佳CEO榜單!馬化騰第一!東哥呢?

房產(chǎn)要聞

66萬(wàn)方!4755套!三亞巨量房源正瘋狂砸出!

軍事要聞

俄大使:馬杜羅夫婦被控制時(shí)身邊沒(méi)人

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版