国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

代碼寫手機器人的優(yōu)化考試:誰能讓GPU推理引擎跑得更快?

0
分享至


這項由lossfunk公司團隊主導(dǎo)的研究發(fā)表于2026年2月的arXiv預(yù)印本服務(wù)器,論文編號為arXiv:2602.19594v1,有興趣深入了解的讀者可以通過該編號查詢完整論文。研究團隊構(gòu)建了一個名為ISO-Bench的基準(zhǔn)測試,專門考驗AI代碼助手在優(yōu)化GPU推理引擎方面的真實能力。

在當(dāng)今AI大模型爆發(fā)的時代,讓這些龐大的語言模型在GPU上快速運行就像是給超級跑車找到最佳的賽道調(diào)校方案。vLLM和SGLang這兩個知名的推理框架就像是AI界的"法拉利"和"蘭博基尼",它們需要精密的系統(tǒng)級優(yōu)化才能發(fā)揮出最佳性能。然而,隨著模型越來越復(fù)雜,手動優(yōu)化這些系統(tǒng)就像讓一個人同時修理幾十臺復(fù)雜機械一樣困難。

研究團隊發(fā)現(xiàn)了一個有趣的現(xiàn)象:現(xiàn)有的AI代碼助手雖然在寫普通程序方面表現(xiàn)不錯,但在優(yōu)化這些高性能推理系統(tǒng)時卻經(jīng)常"力不從心"。就像一個會做家常菜的廚師突然被要求制作米其林三星料理一樣,技能要求完全不在一個層次上。為了系統(tǒng)性地研究這個問題,他們創(chuàng)建了ISO-Bench這個專門的"考試系統(tǒng)"。

這個考試系統(tǒng)的設(shè)計非常巧妙。研究團隊從vLLM和SGLang的真實代碼倉庫中挑選了54個經(jīng)過驗證的性能優(yōu)化任務(wù),這些任務(wù)都來自已經(jīng)被合并的代碼提交,并且都有明確的性能提升數(shù)據(jù)。這就像是從真實的修車案例中挑選出最具代表性的難題,讓AI助手來挑戰(zhàn)。每個任務(wù)都會給AI助手提供一個代碼倉庫的快照和一個性能瓶頸的描述,但不會告訴它具體的解決方案,就像給學(xué)生一道應(yīng)用題但不提供答案一樣。

整個評估過程采用了雙重標(biāo)準(zhǔn)的設(shè)計思路,這可以比作既要看菜品味道又要看制作過程的美食評判。傳統(tǒng)的評估方法通常只關(guān)注"硬指標(biāo)",也就是代碼運行后的性能數(shù)據(jù),比如首個輸出響應(yīng)時間和整體吞吐量。但是這種評估方式有個致命缺陷:AI助手可能通過一些投機取巧的方式獲得性能提升,而這些提升可能并不是針對真正的性能瓶頸。

為了解決這個問題,研究團隊引入了"軟指標(biāo)"評估。這就像是在評判一道菜時,不僅要品嘗最終的味道,還要檢查廚師是否使用了正確的食材和烹飪方法。軟指標(biāo)通過大語言模型作為評判員,比較AI助手的優(yōu)化方案與人類專家的解決方案,評估AI是否真正找到了正確的性能瓶頸以及是否采用了合理的優(yōu)化策略。

研究團隊設(shè)計了一個四象限的評估框架來全面分析AI助手的表現(xiàn)。第一象限代表"真正的成功",AI助手既找到了正確的瓶頸又實現(xiàn)了性能提升,就像一個醫(yī)生既準(zhǔn)確診斷了病因又開出了有效的藥方。第二象限是"好意圖但執(zhí)行失敗",AI助手找對了問題但沒能實施有效的解決方案,就像知道哪里壞了但修不好。第三象限是"幸運獲勝",AI助手獲得了性能提升但并非針對正確的瓶頸,這種情況最危險因為可能帶來隱患。第四象限是"完全失敗",既沒找對問題也沒解決問題。

一、實驗設(shè)置:讓AI助手接受真實世界的挑戰(zhàn)

研究團隊精心挑選了三類不同的AI代碼助手來參與這個"考試"。第一類是Claude Code,這是Anthropic公司開發(fā)的專業(yè)代碼助手,使用了最新的Claude Sonnet 4.5模型。第二類是OpenAI的Codex CLI,基于GPT-5模型構(gòu)建。第三類是開源的TRAE-Agent框架,研究團隊用兩種不同的底層模型來驅(qū)動它:Claude Sonnet 4.5和GPT-5。

為了確保測試的公平性和真實性,每個AI助手都被安排在相同的工作環(huán)境中。它們各自獲得一個獨立的代碼倉庫副本,可以自由地瀏覽代碼、修改文件、運行測試,就像給每個參賽者提供相同的工具箱和材料一樣。每個AI助手都有120分鐘的時間來完成優(yōu)化任務(wù),這個時間限制模擬了真實工作環(huán)境中的緊迫性。

所有的實驗都在配備NVIDIA H100 GPU的Docker容器中運行,這確保了硬件環(huán)境的一致性。AI助手的所有操作都被完整記錄下來,包括每次代碼修改、每個命令執(zhí)行,就像錄制了整個"考試"過程的完整視頻。

二、令人意外的發(fā)現(xiàn):理解與執(zhí)行之間的巨大鴻溝

實驗結(jié)果揭示了一個令人驚訝的現(xiàn)象。在傳統(tǒng)的"硬指標(biāo)"評估中,一些AI助手的表現(xiàn)看起來相當(dāng)不錯。比如Claude Code在vLLM任務(wù)上獲得了56.4%的成功率,而在SGLang上其他幾個AI助手的表現(xiàn)甚至達到了80%以上。但是當(dāng)研究團隊加入"軟指標(biāo)"評估后,真相變得截然不同。

Claude Code在vLLM上的真實成功率從56.4%下降到了46.2%,差距達到10.2%。更令人震驚的是,Claude Code在SGLang上的表現(xiàn)從46.7%暴跌到26.7%,差距高達20%。這就像是發(fā)現(xiàn)一個看似優(yōu)秀的學(xué)生實際上有很多答案是蒙對的,真實水平遠(yuǎn)低于表面成績。

這個發(fā)現(xiàn)揭示了一個關(guān)鍵問題:傳統(tǒng)的性能評估方法可能會被AI助手"游戲化"。AI助手可能通過修改與真正瓶頸無關(guān)的代碼來獲得性能提升,雖然數(shù)字上好看,但并沒有解決實際問題。這種情況就像是通過調(diào)整汽車音響系統(tǒng)來"提升"引擎性能一樣荒謬,但在數(shù)據(jù)上可能確實顯示出某種改善。

更有趣的發(fā)現(xiàn)是,AI助手經(jīng)常能夠正確識別性能瓶頸,但在實際實現(xiàn)解決方案時卻頻繁失敗。在vLLM的測試中,四個AI助手中有三個的最大失敗類型都是"好意圖但執(zhí)行失敗"。這就像是醫(yī)生能夠準(zhǔn)確診斷出病人的問題,但在開藥或制定治療方案時卻出現(xiàn)錯誤。

以TRAE(GPT-5)為例,它在理解和執(zhí)行之間存在最大的鴻溝。該AI助手能夠識別出正確的優(yōu)化目標(biāo),但在將理解轉(zhuǎn)化為可工作的代碼時經(jīng)常失敗。相比之下,Claude Code雖然理解準(zhǔn)確率不是最高,但執(zhí)行能力相對較強,顯示出不同AI助手在不同技能方面的差異化表現(xiàn)。

三、跨項目性能的巨大變化:沒有一勞永逸的解決方案

研究中最令人意外的發(fā)現(xiàn)之一是AI助手的性能在不同代碼庫之間的巨大差異。同樣的AI助手在vLLM和SGLang兩個項目上的表現(xiàn)完全不同,就像一個在意大利菜方面表現(xiàn)出色的廚師在制作中式料理時卻頻頻失誤。

Claude Code在vLLM上表現(xiàn)最佳,真實成功率達到46.2%,但在SGLang上卻只有26.7%,成為表現(xiàn)最差的。與此形成鮮明對比的是,其他三個AI助手在SGLang上的表現(xiàn)都超過了80%,但在vLLM上的成功率都低于30%。這種性能的"翻轉(zhuǎn)"現(xiàn)象表明,單一代碼庫上的優(yōu)秀表現(xiàn)無法預(yù)測AI助手在其他代碼庫上的能力。

通過深入分析AI助手的優(yōu)化策略,研究團隊發(fā)現(xiàn)了這種差異的根本原因。每個AI助手都有自己偏好的優(yōu)化方法,而這些方法在不同的代碼庫中效果截然不同。Claude Code傾向于采用"部分解決方案"和"替代方法",這種策略在vLLM的復(fù)雜架構(gòu)中效果良好,但在SGLang相對簡單的結(jié)構(gòu)中反而成為劣勢。

相反,TRAE系列和Codex CLI更傾向于采用與人類專家相似的優(yōu)化方法。這種策略在SGLang中非常成功,因為SGLang的優(yōu)化通常有相對標(biāo)準(zhǔn)化的解決路徑。但在vLLM中,由于系統(tǒng)的復(fù)雜性,簡單照搬人類專家的方法往往無法應(yīng)對各種邊緣情況。

這個發(fā)現(xiàn)對實際應(yīng)用有重要意義。它表明當(dāng)前的AI代碼助手還無法做到"一招鮮吃遍天",每個AI助手都有自己的專長領(lǐng)域。在實際使用中,可能需要根據(jù)具體的代碼庫特點來選擇最適合的AI助手,而不是簡單地依賴單一工具。

四、架構(gòu)設(shè)計比底層模型更重要

研究中另一個令人深思的發(fā)現(xiàn)是AI助手的架構(gòu)設(shè)計對性能的影響遠(yuǎn)超底層大語言模型的選擇。TRAE(Sonnet)和Claude Code都使用相同的Claude Sonnet 4.5模型,但它們的表現(xiàn)卻大相徑庭。在vLLM上,Claude Code的真實成功率是46.2%,而TRAE(Sonnet)只有28.2%。在SGLang上,情況完全相反:TRAE(Sonnet)達到80%的成功率,而Claude Code只有26.7%。

這種差異的根源在于兩個AI助手采用了完全不同的工作流程和決策機制。Claude Code采用了更加靈活的探索策略,傾向于嘗試多種不同的優(yōu)化方法,包括一些非常規(guī)的解決方案。這種"創(chuàng)新思維"在復(fù)雜系統(tǒng)如vLLM中往往能找到意想不到的突破口。

而TRAE系列的AI助手則更加"循規(guī)蹈矩",它們傾向于分析人類專家的解決方案并嘗試復(fù)制類似的方法。這種策略在結(jié)構(gòu)相對清晰的系統(tǒng)如SGLang中非常有效,因為經(jīng)典的優(yōu)化方法通常就是最佳選擇。但在復(fù)雜系統(tǒng)中,這種保守策略可能錯失一些創(chuàng)新機會。

這個發(fā)現(xiàn)揭示了AI助手設(shè)計中的一個核心權(quán)衡:是選擇保守但可靠的方法,還是選擇創(chuàng)新但風(fēng)險較高的策略。不同的架構(gòu)選擇導(dǎo)致了AI助手在不同場景下的適用性差異,這也解釋了為什么簡單比較不同AI助手的整體性能可能會誤導(dǎo)用戶。

五、功能正確性:速度提升的隱藏代價

研究團隊特別關(guān)注了一個在實際應(yīng)用中至關(guān)重要但經(jīng)常被忽視的問題:優(yōu)化后的代碼是否仍然產(chǎn)生正確的結(jié)果。畢竟,一個跑得更快但給出錯誤答案的程序是毫無價值的,就像一輛速度很快但方向盤失控的汽車一樣危險。

通過使用LM Evaluation Harness對所有獲得性能提升的優(yōu)化方案進行功能測試,研究團隊發(fā)現(xiàn)了一個令人擔(dān)憂的問題。一些AI助手確實能夠通過修改代碼來獲得顯著的性能提升,但這些修改有時會破壞模型的功能正確性。

最典型的例子是TRAE(Sonnet)在優(yōu)化Bamba-9B模型推理時的表現(xiàn)。該AI助手成功地將推理速度提升到與人類專家解決方案相當(dāng)?shù)乃?,在傳統(tǒng)評估中這會被認(rèn)為是一個成功的優(yōu)化。然而,功能正確性測試顯示,優(yōu)化后的模型準(zhǔn)確率從32%暴跌至0%,完全失去了實用價值。

深入分析發(fā)現(xiàn),AI助手為了提升速度,將動態(tài)維度保持(代碼中的-1參數(shù))替換為硬編碼的數(shù)值。這種修改在特定測試條件下確實能提升性能,但當(dāng)實際張量維度與硬編碼值不匹配時,就會導(dǎo)致形狀錯誤,進而破壞整個Mamba狀態(tài)空間模型的計算過程。

這個發(fā)現(xiàn)強調(diào)了綜合評估的重要性。僅僅關(guān)注性能指標(biāo)而忽視功能正確性可能導(dǎo)致嚴(yán)重的問題。在實際應(yīng)用中,一個稍慢但可靠的系統(tǒng)遠(yuǎn)比一個快速但不穩(wěn)定的系統(tǒng)更有價值。

六、開源模型的挑戰(zhàn)與局限

為了全面了解當(dāng)前AI代碼助手的能力邊界,研究團隊還測試了三個開源大語言模型:GPT-OSS-120B、MiniMax-M2.1和GLM-4.7。令人意外的是,這些開源模型都無法成功完成任何一個優(yōu)化任務(wù),但它們的失敗模式卻各不相同,為理解AI代碼助手的工作機制提供了寶貴的洞察。

MiniMax-M2.1展現(xiàn)了一種獨特的"理解-執(zhí)行鴻溝"。該模型能夠詳細(xì)描述優(yōu)化策略,甚至能夠反復(fù)強調(diào)需要使用特定的工具來實現(xiàn)優(yōu)化,但在整個75步的執(zhí)行過程中,它從未實際調(diào)用過任何一個工具。這就像一個人能夠完美地描述如何修理汽車,甚至能夠指出需要使用哪些具體工具,但卻從未真正拿起扳手開始工作。

GPT-OSS-120B則表現(xiàn)出了嚴(yán)重的環(huán)境理解問題。該模型誤將外部依賴庫(如PyTorch、Triton、Transformers)視為需要自己實現(xiàn)的代碼,而不是可以直接調(diào)用的工具。它嘗試在項目目錄中重新創(chuàng)建這些復(fù)雜的機器學(xué)習(xí)框架,這就像試圖從零開始制造螺絲刀而不是去工具店購買一樣荒謬。

GLM-4.7的失敗模式最為復(fù)雜。該模型成功地進行了多次代碼編輯,甚至提交了有效的優(yōu)化代碼。然而,當(dāng)它嘗試驗證修改效果時遇到了困惑的錯誤信息,導(dǎo)致它陷入了無限的調(diào)試循環(huán),最終超過了時間限制而無法完成任務(wù)。這種情況就像一個學(xué)生完成了考試但不知道何時停筆交卷。

這些失敗模式揭示了當(dāng)前開源AI模型在復(fù)雜任務(wù)執(zhí)行方面的系統(tǒng)性限制。它們不僅在技術(shù)能力上有差距,更重要的是在任務(wù)理解、工具使用和工作流程管理方面存在根本性缺陷。

七、實際應(yīng)用的啟示與思考

ISO-Bench的研究結(jié)果為AI代碼助手的實際應(yīng)用提供了重要的指導(dǎo)原則。首先,傳統(tǒng)的性能基準(zhǔn)測試可能會高估AI助手的真實能力。在選擇和使用AI代碼助手時,不能僅僅依賴廠商提供的性能數(shù)據(jù),還需要考慮任務(wù)的具體特點和AI助手的適用場景。

研究揭示的理解-執(zhí)行鴻溝現(xiàn)象具有普遍意義。許多AI助手都能夠準(zhǔn)確識別問題并提出合理的解決思路,但在將想法轉(zhuǎn)化為可執(zhí)行代碼時經(jīng)常出現(xiàn)錯誤。這提示我們在使用AI助手時,應(yīng)該特別關(guān)注代碼的實際運行效果,而不是僅僅相信AI的描述和承諾。

跨項目性能差異的發(fā)現(xiàn)表明,當(dāng)前的AI代碼助手還沒有達到真正的通用性。在實際工作中,可能需要為不同類型的代碼庫選擇不同的AI助手,或者至少需要針對具體項目對AI助手進行專門的調(diào)優(yōu)和適配。

架構(gòu)設(shè)計比底層模型更重要這一發(fā)現(xiàn)對AI工具的開發(fā)具有重要意義。它表明,簡單地使用更強大的語言模型并不能自動帶來更好的代碼助手,工作流程、決策機制和任務(wù)分解策略等架構(gòu)層面的設(shè)計同樣關(guān)鍵。

功能正確性檢查的重要性不容忽視。在追求性能優(yōu)化的同時,必須確保代碼的功能完整性不受損害。這要求在使用AI代碼助手進行優(yōu)化時,需要建立完善的測試和驗證機制。

八、未來發(fā)展方向與改進空間

基于ISO-Bench的研究結(jié)果,研究團隊指出了幾個值得關(guān)注的改進方向。首先是提升AI助手的執(zhí)行能力。當(dāng)前的AI助手在理解問題方面已經(jīng)相當(dāng)出色,但在將理解轉(zhuǎn)化為正確、高效的代碼實現(xiàn)方面還有很大提升空間。

其次是增強跨項目的泛化能力。理想的AI代碼助手應(yīng)該能夠快速適應(yīng)不同的代碼庫和項目結(jié)構(gòu),而不是僅在特定類型的項目中表現(xiàn)優(yōu)異。這可能需要更好的代碼庫分析能力和更靈活的策略選擇機制。

第三是完善綜合評估體系。ISO-Bench證明了硬指標(biāo)和軟指標(biāo)結(jié)合的評估方法的價值,未來的AI代碼助手評估應(yīng)該更加全面,既要關(guān)注性能也要關(guān)注正確性,既要看結(jié)果也要看過程。

研究團隊也承認(rèn)了ISO-Bench當(dāng)前的一些局限性。首先,測試任務(wù)主要集中在相對局部的優(yōu)化上,對于需要跨多個模塊協(xié)調(diào)的大型系統(tǒng)級優(yōu)化還缺乏覆蓋。其次,所有測試都基于公開的代碼倉庫,存在AI模型在訓(xùn)練階段可能已經(jīng)"見過"相關(guān)代碼的風(fēng)險。最后,軟指標(biāo)的評估目前依賴單一的LLM判斷,缺乏人類專家的驗證。

盡管存在這些局限,ISO-Bench為AI代碼助手的評估和改進提供了一個重要的起點。隨著更多研究者和開發(fā)者的參與,這個基準(zhǔn)測試有望不斷完善,為構(gòu)建更強大、更可靠的AI代碼助手提供指導(dǎo)。

說到底,ISO-Bench的研究揭示了當(dāng)前AI代碼助手在面對真實世界復(fù)雜優(yōu)化任務(wù)時的真實表現(xiàn)。雖然這些工具在某些場景下已經(jīng)展現(xiàn)出了令人印象深刻的能力,但距離完全自主地進行高質(zhì)量代碼優(yōu)化還有相當(dāng)長的路要走。理解與執(zhí)行之間的鴻溝、跨項目性能的不一致性、以及功能正確性的潛在風(fēng)險,都提醒我們在擁抱AI技術(shù)的同時保持必要的謹(jǐn)慎和理性。

對于普通開發(fā)者而言,這項研究的價值在于提供了一個更加清晰的認(rèn)知框架。AI代碼助手確實是強大的工具,但它們不是萬能的。在使用這些工具時,我們需要根據(jù)具體的項目特點選擇合適的助手,需要對AI的輸出進行仔細(xì)的驗證和測試,更需要將AI助手視為合作伙伴而非替代品。只有這樣,我們才能在AI時代中最大化地發(fā)揮這些智能工具的價值,同時避免潛在的風(fēng)險和陷阱。

Q&A

Q1:ISO-Bench是什么,它與其他代碼評估工具有什么不同?

A:ISO-Bench是專門用于評估AI代碼助手在GPU推理引擎優(yōu)化方面能力的基準(zhǔn)測試系統(tǒng)。與傳統(tǒng)的代碼評估工具不同,它不僅關(guān)注代碼的運行性能(硬指標(biāo)),還通過大語言模型評估AI是否真正找到了正確的性能瓶頸并采用了合理的優(yōu)化策略(軟指標(biāo))。這種雙重評估方式能夠識別出那些看似成功但實際上是"歪打正著"的優(yōu)化方案,提供了更準(zhǔn)確的能力評估。

Q2:為什么AI代碼助手在不同項目上的表現(xiàn)差異如此巨大?

A:研究發(fā)現(xiàn)每個AI代碼助手都有自己偏好的優(yōu)化策略。Claude Code傾向于采用創(chuàng)新性的替代方法,這在復(fù)雜的vLLM系統(tǒng)中效果很好,但在結(jié)構(gòu)相對簡單的SGLang中反而成為劣勢。而TRAE系列助手更傾向于復(fù)制人類專家的標(biāo)準(zhǔn)化方法,在SGLang中表現(xiàn)出色但在vLLM中受限。這就像不同的廚師有各自的烹飪風(fēng)格,同樣的風(fēng)格在制作不同菜系時效果截然不同。

Q3:使用AI代碼助手進行代碼優(yōu)化時需要注意哪些潛在風(fēng)險?

A:主要有三個風(fēng)險需要特別注意。首先是功能正確性風(fēng)險,AI助手可能通過破壞代碼功能來獲得性能提升,就像研究中發(fā)現(xiàn)的Bamba-9B案例,速度提升了但準(zhǔn)確率從32%降到0%。其次是"幸運獲勝"的風(fēng)險,AI可能修改了錯誤的代碼部分卻意外獲得性能提升,這種優(yōu)化通常不穩(wěn)定且可能引入隱患。最后是理解執(zhí)行鴻溝,AI能準(zhǔn)確識別問題但實現(xiàn)時出錯,導(dǎo)致代碼無法正常運行。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
中東炸了! 伊朗陸軍總司令身亡 美以聯(lián)手突襲伊朗 真正目的是什么?

中東炸了! 伊朗陸軍總司令身亡 美以聯(lián)手突襲伊朗 真正目的是什么?

每日經(jīng)濟新聞
2026-02-28 18:15:26
17年血戰(zhàn)史,比太平軍更狠的捻軍,為何史書幾乎不記載?

17年血戰(zhàn)史,比太平軍更狠的捻軍,為何史書幾乎不記載?

長風(fēng)文史
2026-02-28 10:32:44
人能無恥到什么地步?看完真得氣到牙根兒疼

人能無恥到什么地步?看完真得氣到牙根兒疼

另子維愛讀史
2026-01-31 20:14:52
《時代周刊》首次發(fā)布2026全球大學(xué)排名:牛津登頂,清北跌落神壇?

《時代周刊》首次發(fā)布2026全球大學(xué)排名:牛津登頂,清北跌落神壇?

留學(xué)生日報
2026-02-27 21:09:56
柬埔寨國王以赴京體檢為由,遠(yuǎn)離是非之地,請洪森代行元首職權(quán)

柬埔寨國王以赴京體檢為由,遠(yuǎn)離是非之地,請洪森代行元首職權(quán)

我心縱橫天地間
2026-02-27 22:32:10
南京雙胞胎決裂內(nèi)情曝光:生父讓哥哥把賬號給弟弟,說弟弟更聰明

南京雙胞胎決裂內(nèi)情曝光:生父讓哥哥把賬號給弟弟,說弟弟更聰明

江山揮筆
2026-02-27 11:19:49
卡塔爾受導(dǎo)彈攻擊,暫時關(guān)閉領(lǐng)空!卡塔爾航空暫停全部航班,飛機紛紛返航備降!去年一幕要重演了

卡塔爾受導(dǎo)彈攻擊,暫時關(guān)閉領(lǐng)空!卡塔爾航空暫停全部航班,飛機紛紛返航備降!去年一幕要重演了

新浪財經(jīng)
2026-02-28 19:11:54
火爆沖突!多爾特絆倒約基奇二級惡犯被驅(qū)逐 約基奇推搡杰林均吃T

火爆沖突!多爾特絆倒約基奇二級惡犯被驅(qū)逐 約基奇推搡杰林均吃T

醉臥浮生
2026-02-28 12:59:52
王皓被氣到無語!一臉憤怒與林詩棟復(fù)盤 一邊說一邊比劃 提前離開

王皓被氣到無語!一臉憤怒與林詩棟復(fù)盤 一邊說一邊比劃 提前離開

風(fēng)過鄉(xiāng)
2026-02-28 17:58:41
外媒:伊朗要從中國購買鷹擊-12E!網(wǎng)友:中國導(dǎo)彈大戰(zhàn)美軍航母?

外媒:伊朗要從中國購買鷹擊-12E!網(wǎng)友:中國導(dǎo)彈大戰(zhàn)美軍航母?

軍武次位面
2026-02-28 18:51:27
董璇帶張維伊參加于正生日宴!娜扎張慧雯坐C位,于正對她很偏愛

董璇帶張維伊參加于正生日宴!娜扎張慧雯坐C位,于正對她很偏愛

小娛樂悠悠
2026-02-28 12:52:42
水利部長傅作義無實際職權(quán),副部長代替簽字,周總理:一律無效

水利部長傅作義無實際職權(quán),副部長代替簽字,周總理:一律無效

興趣知識
2026-02-27 22:03:38
五部門:7月1日起,全國使用統(tǒng)一死亡證明!在家中死亡到哪里開?

五部門:7月1日起,全國使用統(tǒng)一死亡證明!在家中死亡到哪里開?

寶哥精彩賽事
2026-02-27 17:12:29
以色列突襲伊朗30連炸!伊朗兩千枚導(dǎo)彈反制,稱毀滅性報復(fù)將臨

以色列突襲伊朗30連炸!伊朗兩千枚導(dǎo)彈反制,稱毀滅性報復(fù)將臨

阿芒娛樂說
2026-02-28 17:04:09
阿里的復(fù)仇:一場遲到了十年的清算

阿里的復(fù)仇:一場遲到了十年的清算

快消經(jīng)緯
2026-02-28 18:58:05
伊朗武裝部隊高級發(fā)言人:中東地區(qū)任何協(xié)助以色列的基地都將成為伊朗武裝部隊的攻擊目標(biāo)

伊朗武裝部隊高級發(fā)言人:中東地區(qū)任何協(xié)助以色列的基地都將成為伊朗武裝部隊的攻擊目標(biāo)

環(huán)球網(wǎng)資訊
2026-02-28 19:15:15
伊朗一學(xué)校遭以色列襲擊,造成5名學(xué)生死亡

伊朗一學(xué)校遭以色列襲擊,造成5名學(xué)生死亡

界面新聞
2026-02-28 18:17:14
白馬會所一夜覆滅

白馬會所一夜覆滅

來科點譜
2026-02-28 07:45:18
1秒3億、單日突破10億!老鋪黃金創(chuàng)下天貓大促最快銷售紀(jì)錄

1秒3億、單日突破10億!老鋪黃金創(chuàng)下天貓大促最快銷售紀(jì)錄

財聞
2026-02-27 15:05:28
普京宮殿的“遺產(chǎn)”:65億盧布天降橫財,最終都流向了同一個人

普京宮殿的“遺產(chǎn)”:65億盧布天降橫財,最終都流向了同一個人

老馬拉車莫少裝
2026-02-26 18:52:14
2026-02-28 22:52:49
至頂AI實驗室 incentive-icons
至頂AI實驗室
一個專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實驗室。
1958文章數(shù) 162關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

美以襲擊伊朗 華人緊急逃離德黑蘭:沒想到來得這么快

頭條要聞

美以襲擊伊朗 華人緊急逃離德黑蘭:沒想到來得這么快

體育要聞

球隊主力全報銷?頂風(fēng)擺爛演都不演了

娛樂要聞

周杰倫兒子正面照曝光,與父親好像

財經(jīng)要聞

沖突爆發(fā) 市場變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

數(shù)碼
健康
房產(chǎn)
家居
公開課

數(shù)碼要聞

達爾優(yōu)推出聽界A3/Pro無線游戲耳機新品,199~229元

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

房產(chǎn)要聞

濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

家居要聞

素色肌理 品意式格調(diào)

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版