国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

OpenAI的命門,決定了大模型公司的未來

0
分享至

如果Scaling Law是指導大模型能力提升最重要的標尺,那么“算力成本控制”就是大模型行業(yè)發(fā)展和商業(yè)化的基石。

年初DeepSeek在國外開源社區(qū)首先爆火,一個很重要的原因就是,DeepSeek幾乎將同性能模型的推理算力和訓練算力成本都降到了10%以內。MoE架構也在GPT-4發(fā)布之后,逐漸取代了稠密架構,成為了幾乎所有大模型開發(fā)商的默認選項,最核心的原因也是能夠有效降低模型推理的算力成本。

而OpenAI伴隨著GPT-5發(fā)布第一次與用戶見面的“路由(routing)”功能,設計本意也是代替用戶來把簡單問題匹配到低消耗模型,復雜問題匹配到能力和算力消耗高的推理模型,從而有效提升用戶體驗和算力效率,但卻變成AI圈最知名的“降本增笑”事件。

即便是GPT-5發(fā)布接近了一個月,OpenAI還是沒有能讓所有用戶滿意,網(wǎng)友依然還在吐槽,GPT-5沒有辦法解決一些很簡單的問題。雖然隨著OpenAI回滾了GPT-4o,還讓用戶能夠手動在推理模型和基本模型間切換,讓大多數(shù)用戶開始同意OpenAI宣稱的“GPT-5性能明顯強于之前的模型”,但是Sam Altman自己也沒有辦法否認,GPT-5的發(fā)布確實是漏洞百出。

而造成翻車最直接的原因,就是他們強推的路由功能沒有能夠將用戶的預期和相應的模型能力匹配好。

01

那么問題來了,為什么OpenAI要冒著GPT-5“發(fā)布即翻車”的風險,也要強推路由功能?

第一個最直接的原因就是,在GPT-5發(fā)布之前,OpenAI并行推出了5個以上的模型,讓用戶能夠根據(jù)自己需求來選擇合適的模型。隨著模型越來越多,別說普通用戶了,就是ChatGPT的重度用戶,有時候也很難決定使用哪個模型是最合適自己當前任務的。

對于立志于將ChatGPT打造成為AI時代超級APP的OpenAI,不可能允許這樣的情況持續(xù)存在。特別是對于大量沒有接觸過大模型的普通用戶,替他們針對不同的任務選擇合適的模型,是OpenAI在某一個時間點必須要做的事情。

而另一個更深層次的原因在于,從算力成本的角度出發(fā),自從推理模型出現(xiàn)之后,每一次對于大模型的詢問,都需要在推理模式和非推理模式之間進行一次選擇。而這種調配“深度思考”能力的效率,決定了大模型產品對于算力的使用效率。

根據(jù)學術界對于推理模型和非推理模型的研究結果,推理模型和飛推理模型的算力差異巨大,可能達到5-6倍。對于復雜問題,通過思維鏈等技術進行推理后內部消耗的推理token數(shù)可能高達上萬個。

而在延遲上,推理過程和非推理過程的差異就更加巨大了,根據(jù)OpenAI自己發(fā)布的數(shù)據(jù),使用推理模型回答復雜問題所需要的時間,可能是使用非推理模型的60倍以上。

而就算對于很多需要復雜推理的任務在消耗了巨大的算力以及大量的時間之后, 之后給出的結果和準確性差異往往就在5%左右。為了這5%的性能提升,消耗多大的算力合適呢?

做一個簡單的算術題,如果OpenAI將所有任務都默認使用推理模型來完成,路由功能能夠幫助OpenAI識別出10%的問題可以通過簡單的非推理模型完成,就可能將算力成本降低8%(推理非推理算力比值為5:1)。

如果將這個比例進一步提高,能夠降低的算力成本將更加可觀。對于OpenAI這樣一個需要服務數(shù)億用戶,而且算力供應依然非常緊張的公司來說,路由功能是否能發(fā)揮作用可以說關系到自身商業(yè)模式是否可持續(xù)的核心能力。

在行業(yè)層面,第三方平臺(如 OpenRouter)把“自動路由與回退(fallback)”做成基建能力:當主模型擁塞、限流或內容拒絕時,按策略自動切換到次優(yōu)模型,以穩(wěn)定用戶體驗。微軟的Azure這樣的AI算力云供應商,也將不同模型之間的路由能力作為AI云計算的一大賣點。

也許,GPT-5發(fā)布之后,對于OpenAI來說最重要的事情就是在“質量-延遲-成本”的三角中尋找每條請求的最優(yōu)平衡點。而目前官方對 GPT-5 的定位與“內置思考(built-in thinking)”敘事,實際上就是把“路由+推理強度”做成默認能力,并在 ChatGPT 端通過“Auto/Fast/Thinking”給了用戶一定程度的可見與可控性。

02

為大模型打造一個高效的路由功能到底有多難?

這個問題,外媒在一篇報道中向UIUC的一名計算機專業(yè)的助理教授求證,得到的回答是“可能是一個亞馬遜推薦系統(tǒng)級別的問題,需要大量專家努力工作數(shù)年時間才能獲得一個滿意的結果!蹦P拖到y(tǒng)層面的路由功能本質是“多目標+強約束”的工程問題。 路由不是只拼準確率,還要在質量、延遲、成本、配額/峰值容量、成功率之間做實時優(yōu)化。

而且從理論上來說,語義級別的路由功能在效率上來看,遠遠不是這問題的最優(yōu)解。DeepSeek在上周放出的DeepSeek V3.1就在嘗試將推理模型和非推理模型混合起來,在一個更深層次上打造出一個效率更高的路由系統(tǒng),從而從根本上提高大模型的“推理-非推理”的選擇效率。

根據(jù)網(wǎng)友體驗之后的感受,新的混合推理模型相比之前R1有著更快的思考速度:相較于 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短的時間內得出答案。

并且在回答性能相似的前提下,輸出長度有明顯的下降:新的推理模型在簡單問題上,推理過程有約10%以上的縮短。正式輸出的部分,新模型大幅精簡,平均僅有1000字,比R1 0528的平均2100字的水平提高了接近一倍。

但是另一方面,新的混合推理模型也爆出了一些不太穩(wěn)定的問:比如會不時的在很多輸出中出現(xiàn)莫名其妙的“極”bug:答案中出現(xiàn)很多完全不相關的“極”

而且在R1上就存在的中英夾雜的情況似乎變得更加嚴重了,就像一個剛回國不久的留學生,在很多中文任務中會顯得很出戲。

即使像DeepSeek這樣的國內最頂尖的大模型團隊,將“推理-非推理”選擇功能內置到模型內部,模型的穩(wěn)定性上也會出現(xiàn)一定程度的問題。而OpenAI和DeepSeek在自己各自首個推出的試圖高效調度“深度思考”能力的模型上都出現(xiàn)了不同程度的翻車,側面反應出要處理好這個問題的難度。

03

提高效率的另一面,是OpenAI依然處于對于算力的“極度渴求”的狀態(tài)中。

年初DeepSeekV3和R1的推出引發(fā)的全世界對于英偉達等算力供應商未來前景的擔憂,在短短幾個月之后就演變成了“AI成本悖論”——token單價下降但是模型的性能不斷成長,使得原本交由模型處理本來會顯得不經濟的任務也能交給大模型處理,模型能夠處理的任務將更多樣與復雜,從而會進一步推高token總量的需求。

OpenAI 正在推進代號Stargate的基礎設施擴張計劃:2025 年 7 月,OpenAI 與 Oracle 宣布在美國新增 4.5 GW 數(shù)據(jù)中心能力。

昨天,外媒也報道OpenAI 正物色印度當?shù)睾献骰锇椋⒂媱澰谛碌吕镌O立辦公室,把印度(其第二大用戶市場)的用戶增長與本地算力配置對接起來,在印度建設至少1Gw規(guī)模的數(shù)據(jù)中心。

“AI成本悖論”一方面不斷推高英偉達和AI云服務商的業(yè)績,同時也對像能夠有效降低模型算力需求的“路由”功能提出了更高的要求。

Sam Altman 反復強調“2025 年底上線的GPU 超過 100 萬片”的目標,且把長遠愿景瞄準“一億 GPU 量級”。這類表態(tài)從側面說明:即便推理單價在下降,更復雜的任務與更高的調用量讓大模型的“總賬單”并不會自動下降——必須靠路由把昂貴的推理時段“留給更需要的人”。

如果從大模型的第一性原理出發(fā),所有大模型公司追求的最終極標準,就是不斷提升“算力兌換智力”的效率。而高效調度“深度思考”的能力,在推理大模型時代某種程度決定了大模型公司能否在系統(tǒng)和商業(yè)效率以及用戶體驗上領先全行業(yè)。

歡迎在評論區(qū)留言~
如需開白請加小編微信:dongfangmark

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

東風導彈泄密案!間諜郭萬鈞一家三口,全部被處以死刑

番外行
2026-03-31 08:28:28
一斤等于10斤牛肉,建議一周3次,健脾利濕、增強記憶力!

一斤等于10斤牛肉,建議一周3次,健脾利濕、增強記憶力!

寶哥精彩賽事
2026-04-02 18:37:40
普京顏面盡失,在克宮被昔日盟友公開羞辱,宣告不再討好俄羅斯

普京顏面盡失,在克宮被昔日盟友公開羞辱,宣告不再討好俄羅斯

阿萔影視評論
2026-04-04 06:51:01
愛德華茲賽季報銷,森林狼反手選對手:打湖人總比碰掘金強

愛德華茲賽季報銷,森林狼反手選對手:打湖人總比碰掘金強

寶哥精彩賽事
2026-04-03 18:54:30
外媒曝伍茲私人飛機降落在蘇黎世 48歲女友瓦妮莎主導境外秘密治療

外媒曝伍茲私人飛機降落在蘇黎世 48歲女友瓦妮莎主導境外秘密治療

勁爆體壇
2026-04-04 06:50:04
女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

女生主動起來有多黏人?網(wǎng)友:這些女的太開放了

帶你感受人間冷暖
2026-01-27 00:20:06
中國拒接8500億美債,專家:救美救華時代已終結

中國拒接8500億美債,專家:救美救華時代已終結

孤酒老巷QA
2026-04-03 19:53:38
科學不夠,賭命來湊:美國今年,命犯馬桶?

科學不夠,賭命來湊:美國今年,命犯馬桶?

美第奇效應
2026-04-03 07:07:27
3月合資銷量啞火 除了“兩田”,沒人吱聲

3月合資銷量啞火 除了“兩田”,沒人吱聲

車市紅點
2026-04-02 15:49:23
石破茂公開評價特朗普:他好面子,喜歡被奉承,要是說他錯了,立刻就發(fā)飆

石破茂公開評價特朗普:他好面子,喜歡被奉承,要是說他錯了,立刻就發(fā)飆

大象新聞
2026-04-03 20:49:04
逼中國跳陷阱?伊朗索要“安全擔!,中國一眼看穿,根本不上當

逼中國跳陷阱?伊朗索要“安全擔!,中國一眼看穿,根本不上當

二大爺觀世界
2026-04-04 07:54:10
真敢說!39歲張雪:創(chuàng)業(yè)13年重慶從沒有支持過我 一個子兒都沒有

真敢說!39歲張雪:創(chuàng)業(yè)13年重慶從沒有支持過我 一個子兒都沒有

念洲
2026-04-01 09:39:30
韓國導演遭6人活活打死!目擊者:店內遭勒脖暈厥,幼子見證全程

韓國導演遭6人活活打死!目擊者:店內遭勒脖暈厥,幼子見證全程

法老不說教
2026-04-03 19:35:03
51歲何潤東直播《三角洲》火了!全程手柄操作引熱議

51歲何潤東直播《三角洲》火了!全程手柄操作引熱議

游民星空
2026-04-03 17:18:55
上海夫妻給干妹妹轉賬4900萬,結果慘變“接盤俠”……

上海夫妻給干妹妹轉賬4900萬,結果慘變“接盤俠”……

環(huán)球網(wǎng)資訊
2026-04-02 21:22:30
浙大名嘴揭開殘酷真相:當年恒大倒臺,壓根不是因為2萬億負債!

浙大名嘴揭開殘酷真相:當年恒大倒臺,壓根不是因為2萬億負債!

阿器談史
2026-04-02 13:31:44
目標以色列特拉維夫,伊朗、黎巴嫩真主黨、胡塞武裝聯(lián)合發(fā)動襲擊!以軍:打擊伊朗革命衛(wèi)隊資金管理總部;美國最先進的電子戰(zhàn)飛機飛抵希臘

目標以色列特拉維夫,伊朗、黎巴嫩真主黨、胡塞武裝聯(lián)合發(fā)動襲擊!以軍:打擊伊朗革命衛(wèi)隊資金管理總部;美國最先進的電子戰(zhàn)飛機飛抵希臘

每日經濟新聞
2026-04-03 07:34:06
庫存積壓嚴重!特斯拉最新銷量公布

庫存積壓嚴重!特斯拉最新銷量公布

新浪財經
2026-04-04 00:57:30
不甜不咸不油,卻偷偷傷害全身!很多人每天都在超量吃

不甜不咸不油,卻偷偷傷害全身!很多人每天都在超量吃

蝌蚪五線譜
2026-04-03 17:03:28
男人的生理需求能有多難忍?網(wǎng)友:我對我老公只有動物本能

男人的生理需求能有多難忍?網(wǎng)友:我對我老公只有動物本能

帶你感受人間冷暖
2026-02-07 03:58:56
2026-04-04 08:35:00
直面派 incentive-icons
直面派
講述值得講述的真實故事
257文章數(shù) 236關注度
往期回顧 全部

科技要聞

5萬輛庫存車,給了特斯拉一記重拳

頭條要聞

美國宣布:F-15E被擊落 1名飛行員被救還有1人下落不明

頭條要聞

美國宣布:F-15E被擊落 1名飛行員被救還有1人下落不明

體育要聞

被NBA選中20年后,他重新回到籃球場

娛樂要聞

夏克立官宣再婚當爸?否認婚內出軌

財經要聞

劉紀鵬:只盼長慢牛,鞏固4000點是關鍵

汽車要聞

你介意和遠房親戚長得很像嗎?

態(tài)度原創(chuàng)

旅游
教育
藝術
健康
親子

旅游要聞

二七藏春·春風有信 露營有期

教育要聞

以“鍛造”代“保護”:重塑青少年心理健康教育的底層邏輯

藝術要聞

石濤『山水小景冊』

干細胞抗衰4大誤區(qū),90%的人都中招

親子要聞

醫(yī)生說這娃一場感冒就可能沒命!一針250萬美元的藥打完,娃能跑能跳了...

無障礙瀏覽 進入關懷版