国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

別問樹模型了!死磕結(jié)構(gòu)化數(shù)據(jù),清華團(tuán)隊把大模型表格理解推到極限

0
分享至




機器之心原創(chuàng)

作者:張倩、Panda

科幻作家劉慈欣在小說《超新星紀(jì)元》中描述了一個令人難忘的場景——幾個十幾歲的孩子被帶到一個小山環(huán)繞的地方,他們的面前是一條單軌鐵路,上面停著十一列載貨火車,每列車有二十節(jié)車皮。這些車首尾相接成一個巨大的弧形,根本看不到盡頭。這些車中,其中一列裝的是味精,另外十列裝的是鹽。

「這么多的味精和鹽夠我們國家所有的公民吃多長時間?」帶孩子們來的大人向他們提問?!敢荒辏俊埂肝迥??」「十年?」沒有一個孩子答對。最后的答案讓他們目瞪口呆:「只夠一天」。

這個場景之所以令人難忘,是因為它以一種非常具象的方式向我們展示了這個世界的運轉(zhuǎn)多么難以被普通人準(zhǔn)確感知。它的背后是海量的精確數(shù)字:負(fù)責(zé)供應(yīng)鹽和味精的部門需要算出每個周期要生產(chǎn)多少才能滿足需求;負(fù)責(zé)生產(chǎn)的工廠要監(jiān)控機器運轉(zhuǎn)情況,從一堆精確卻晦澀難懂的數(shù)字、代碼中讀出問題;而給機器供電的電力系統(tǒng)也要監(jiān)測和變壓器相關(guān)的一切數(shù)據(jù),避免非計劃停機帶來高昂的搶修成本和難以估量的用戶損失。

這個世界,就是以這樣一種精確的方式運轉(zhuǎn)著。那些數(shù)字就像我們每天呼吸的空氣,你可能感覺不到它們的存在,但一旦它們出了問題,你的感知將會非常強烈。

也正因如此,這些數(shù)據(jù)的處理至關(guān)重要。由于這些數(shù)據(jù)往往以固定的行列格式組織,數(shù)據(jù)之間的結(jié)構(gòu)關(guān)系是預(yù)先定義好的,因此也被稱為「結(jié)構(gòu)化數(shù)據(jù)」??梢哉f,我們在工業(yè)化社會體驗到的幾乎所有便利,背后都依賴著這些結(jié)構(gòu)化數(shù)據(jù)的理解、處理與預(yù)測。

然而,在 AI 席卷一切的今天,處理這些最基礎(chǔ)的數(shù)據(jù),卻成了最大的痛點。

我們寄希望于看似無所不能的 LLM 大模型。但現(xiàn)實很骨感:LLM 擅長寫詩與編程,但卻很難讀懂一張簡單的電子表格,因為 LLM 的建模方式(涉及到文本的模糊性)與結(jié)構(gòu)化數(shù)據(jù)所要求的精確性存在巨大 gap,一直達(dá)不到生產(chǎn)要求。

這一現(xiàn)狀也導(dǎo)致,整個行業(yè)都還在用已經(jīng)存在了十幾年的專用模型,每遇到一個新的數(shù)據(jù)集或者一個新任務(wù)可能就要重新訓(xùn)練一個。這就好比為了喝一杯新口味的咖啡,你必須重新造一臺咖啡機。這種低效的生產(chǎn)方式與始終追求高效率、強泛化能力的 LLM 領(lǐng)域形成了鮮明對比,也成了阻礙產(chǎn)業(yè)發(fā)展的一大瓶頸。

這也是為什么,前段時間清華大學(xué)與穩(wěn)準(zhǔn)智能聯(lián)合發(fā)布的LimiX 系列模型讓人眼前一亮。作為他們提出的「LDM(結(jié)構(gòu)化數(shù)據(jù)大模型)」的重要成員,LimiX 做到了 LLM 沒有做到的事情,把結(jié)構(gòu)化數(shù)據(jù)的處理帶入了大模型時代。這會改變整個工業(yè) AI 的游戲規(guī)則,成為 LLM、具身智能之外通往 AGI 的另一大關(guān)鍵路徑。





第一次,在結(jié)構(gòu)化數(shù)據(jù)上

做到了「通用」!

為什么說 LimiX 的出現(xiàn)有著劃時代的意義?

本質(zhì)是因為,它第一次在結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域把「通用」這件事做成了!



參加過 Kaggle 的同學(xué)都知道,結(jié)構(gòu)化數(shù)據(jù)領(lǐng)域有很多任務(wù),比如分類、回歸、缺失值填補、高維表征抽取、分布外泛化預(yù)測……比如根據(jù)年齡、艙位等級等乘客特征預(yù)測泰坦尼克號乘客是否幸存(分類),基于鉆石的克拉重量、切工、顏色、凈度等屬性預(yù)測鉆石售價的連續(xù)值(回歸)等。當(dāng)然,現(xiàn)實世界的問題遠(yuǎn)比這些復(fù)雜。

在過去的十幾年里,解決這些問題主要依靠梯度提升樹模型(比如 2014 年發(fā)布的 XGBoost、2017 年發(fā)布的 CatBoost 等)或 AutoML 集成模型(比如亞馬遜在 2020 年提出的 AutoGluon)。就像我們前面所說的,這些模型都是專有模型,每次遇到新任務(wù)或新數(shù)據(jù)集都要重新訓(xùn)練。這和早就實現(xiàn)一個模型通吃各種任務(wù)的NLP領(lǐng)域相比,簡直落后了不止一個版本!

當(dāng)然,這些年,有不少研究者嘗試將深度學(xué)習(xí)甚至基礎(chǔ)模型思想引入結(jié)構(gòu)化處理領(lǐng)域,像德國 Prior Labs 團(tuán)隊提出的 TabPFN、法國 INRIA 團(tuán)隊提出的 TabICL、加拿大 Layer 6 AI 團(tuán)隊提出的 TabDPT 等都是這一方向的代表。但這些工作都有個特點:它們本質(zhì)上還是針對不同的任務(wù)分別去做專門的預(yù)訓(xùn)練,并沒有做到真正的通用,而且對于高質(zhì)量的缺失值填補等任務(wù),很多方法還無法解決。

LimiX 模型(今年8月份發(fā)布的 LimiX-16M, LDM 系列的首款模型)是一個打破僵局的存在。它在性能上碾壓前述基礎(chǔ)模型,超越 XGBoost、CatBoost、AutoGluon 這樣的傳統(tǒng)專用模型更是不在話下



  • LimiX官網(wǎng):https://www.limix.ai/
  • 技術(shù)報告:https://arxiv.org/pdf/2509.03505
  • HuggingFace鏈接:https://huggingface.co/stableai-org

更重要的是,它第一次做到了真正的通用,也就是一個模型,在不進(jìn)行二次訓(xùn)練的情況下,就能用于分類、回歸、缺失值填補、高維表征抽取、因果推斷等多達(dá) 10 類任務(wù)。

簡單來說,LimiX 不再像傳統(tǒng)模型那樣死記硬背某個特定表格的規(guī)則,而是通過學(xué)習(xí)海量數(shù)據(jù),能夠自主發(fā)現(xiàn)樣本之間和變量之間的關(guān)系并適應(yīng)不同類型的任務(wù)。這使得 LimiX 擁有了類似 GPT 的能力:一個模型,通吃所有任務(wù)。對于LLM領(lǐng)域的研究者來說,這個劇情應(yīng)該很熟悉了,當(dāng)年語言模型的突破,就是從「橫掃xx項NLP記錄」開始的。

同時,LimiX 在 benchmark 上的一路領(lǐng)先,也讓我們看到了一些優(yōu)秀 LLM 的來時路。

比如在一場分類任務(wù)的對決中,LimiX-16M 在 58.6% 的數(shù)據(jù)集上都取得了最優(yōu)結(jié)果,斷崖式領(lǐng)先。如果再加上其輕量級版本 LimiX-2M 的成績,整個 LimiX 家族的勝率甚至可以達(dá)到 68.9%。



類似的情況也出現(xiàn)在回歸任務(wù)的 PK 中。同樣的,LimiX 的兩個模型包攬了前兩名,合在一起勝率能達(dá)到 62%。和其他模型相比,LimiX-16M 同樣是斷崖式領(lǐng)先。



此外,對于近期 Prior Labs 團(tuán)隊的挑戰(zhàn)者 TabPFN 2.5,LimiX 成功守擂??梢钥吹剑谏婕胺诸?、回歸的六項評測中,LimiX-16M 依然保持著絕對優(yōu)勢。



LimiX 還是一個數(shù)據(jù)填補神器:在現(xiàn)實數(shù)據(jù)中,經(jīng)常會有「缺胳膊少腿」的空值。其它預(yù)測模型無法直接解決這個任務(wù),而 LimiX 可以像填空一樣,精準(zhǔn)預(yù)測并補全這些缺失值,且無需額外訓(xùn)練。在所有缺失值插補算法中,LimiX 以絕對優(yōu)勢拿下了 SOTA。



不止是跑分王

現(xiàn)實也能打

有人可能說,跑分好看的模型多了,現(xiàn)實中不還是沒一個能打的。

LimiX 還真不是這種情況。它具備驚人的穩(wěn)健性,使其足以落地實際工業(yè)場景。我們了解到,LimiX 已經(jīng)在一些實際工廠中化身「打工人」了。工廠的任務(wù)可不像 Kaggle 賽題那樣經(jīng)過簡化處理,隨便拿出來一個都千頭萬緒。

就拿最容易理解的食品生產(chǎn)為例。我們知道,很多食品在出廠之前要經(jīng)過烘干,如果哪個參數(shù)沒調(diào)好,我們買到手的食品就會出現(xiàn)提前變質(zhì)等問題。以往,食品廠都是依賴事后檢測,也就是先烘干,再測含水量,不合格就返工或報廢。但如果能提前預(yù)測,成本不就打下來了?

這正是 LimiX 發(fā)揮作用的環(huán)節(jié),它可以精準(zhǔn)建模氣流流速、燃燒器溫度、設(shè)備蒸汽比例等工藝參數(shù)與產(chǎn)品含水量的復(fù)雜關(guān)系,使得預(yù)測值與真實值平均偏差不到9%,而且模型能解釋92%的結(jié)果變化,可靠性極強。

類似的案例還有很多,比如在電力現(xiàn)貨市場預(yù)測電價時,LimiX 可以將企業(yè)內(nèi)部最優(yōu)模型的誤差從 46.93% MAPE 大幅降低到 25.27% MAPE;而在變壓器運行狀態(tài)診斷中,它能將運行狀態(tài)診斷錯誤率降低 93.5%(相較于傳統(tǒng)預(yù)測模型 XGBoost)。

所以,無論從跑分還是實際落地情況來看,LimiX 都是一個充滿變革意味的模型。而且,這個模型不僅企業(yè)能用,普通研究者也能上手,因為LimiX 團(tuán)隊最近開源了一個輕量級版本——LimiX-2M。

LimiX-2M

極小模型定義結(jié)構(gòu)化數(shù)據(jù)理解極限

2M模型就能做結(jié)構(gòu)化數(shù)據(jù)處理?

是的,LimiX-2M 雖然體積小,但性能卻著實驚人:力壓 TabPFN-v2 和 TabICL,超越集成學(xué)習(xí)框架 AutoGluon,僅次于其大哥 LimiX-16M



更重要的是,它很小,你甚至能在智能戒指上運行它

具體來說,它能通過分析戒指傳感器收集到的結(jié)構(gòu)化位置信息,識別出佩戴者的手勢。這種應(yīng)用具有非常巨大的想象空間。舉個例子,通過與智能家居系統(tǒng)連接,我們可以手勢控制家里的各式電器,比如像滅霸一樣打個響指,就能開關(guān)家里的所有電燈。

當(dāng)然,在比邊緣設(shè)備性能更強的設(shè)備上,這個小模型的速度也會快得多。

舉個例子,如果是處理 958 條、60 維特征的 IMU 數(shù)據(jù),在2 核 CPU、4G 內(nèi)存的低算力環(huán)境(差不多就是個樹莓派的配置)下,LimiX-2M 單樣本 375 毫秒, 總耗時為 359 秒。相較之下,TabPFN-2.5 的總耗時為 1830 秒,比 LimiX-2M 慢 5 倍。而如果你有一臺 RTX 5090,則單樣本平均耗時僅 0.206 毫秒,總耗時也只有 197 毫秒,真的可以說是眨眼之間就完成了!

LimiX-2M 不止性能與速度兼?zhèn)?,而且也能輕松地低成本微調(diào)——你只需家用顯卡就能有效微調(diào)它!推理快、門檻低的特點使 LimiX-2M 成為助力研究和應(yīng)用落地的不二之選:即使是只有一張 4090 顯卡的小型科研團(tuán)隊或創(chuàng)業(yè)公司,也可以在自己的場景中使用、微調(diào) LimiX-2M,從而開展此前根本無法進(jìn)行的前沿AI實驗。

在量子化學(xué)領(lǐng)域,如何去評估小有機分子的一組量子力學(xué)性質(zhì)(包括激發(fā)能、振子強度和躍遷概率等)對探索分子特性非常重要。但是目前,這些性質(zhì)只能通過高精度的量子化學(xué)方法(如 TDDFT 或 CC2)計算得出,量子力學(xué)性質(zhì)計算成本高昂且耗時。

通過使用 LimiX-2M 對各類量子力學(xué)性質(zhì)進(jìn)行預(yù)測,預(yù)測的擬合優(yōu)度最高可達(dá) 0.711,顯著超越 TabPfn-2.5(0.658),經(jīng)過微調(diào)后更是達(dá)到了 0.815。這節(jié)省了大量的實驗成本,允許相關(guān)研究人員快速進(jìn)行高通量分子發(fā)現(xiàn)。這再次證明了該模型非常適合邊緣設(shè)備應(yīng)用以及科研場景。你不必像 LLM 研究者一樣需要大量算力,只需一臺日常用來玩游戲的電腦,就能輕松高效地進(jìn)行實驗

11月 10 日正式發(fā)布后,LimiX-2M 在 ModelScope 上已經(jīng)有超過 1200 次下載,在網(wǎng)上也收獲了不少好評。



同時,LimiX 還發(fā)布了詳細(xì)的應(yīng)用指南(https://zhuanlan.zhihu.com/p/1973033408901964300),手把手教你如何將 LimiX 應(yīng)用到自己的數(shù)據(jù)上。無需復(fù)雜的格式處理,只要簡單的幾行代碼即可接入最前沿的結(jié)構(gòu)化數(shù)據(jù)大模型。無論是純 CPU 的簡單嘗鮮,還是單 GPU 的深度應(yīng)用,還是多機多卡的極限推理,LimiX 都能 Handle!此外,LimiX 的社區(qū)非?;钴S,GitHub 上的問題響應(yīng)速度極快。

一場范式遷移正在發(fā)生

從 LimiX 系列模型中,我們能明顯感覺到,一個新的時代真的來了。因為和以往不同,LimiX 所展現(xiàn)的絕對不是漸進(jìn)式的改進(jìn),而是一種新的范式遷移。在 LimiX 技術(shù)報告中,研究團(tuán)隊甚至報告了 LDM 的 scaling laws。這進(jìn)一步揭示了該領(lǐng)域正在邁入規(guī)?;?qū)動的新范式。想要更極致的性能?Just scale it



不同參數(shù)量模型的分類(左)、回歸(右)損失函數(shù)隨訓(xùn)練數(shù)據(jù)量的變化趨勢。數(shù)據(jù)量增大時,損失值先快速降低后緩慢下降。



在不受數(shù)據(jù)集規(guī)?;蛴嬎泐A(yù)算限制的情況下,下游任務(wù)損失與性能隨模型參數(shù)規(guī)模的變化。可以看到,多項性能指標(biāo)均與模型參數(shù)數(shù)量 N 呈現(xiàn)明顯的依賴關(guān)系。

對于大部分人來說,這場從傳統(tǒng)專用模型到「LDM」通用模型的遷移可能很難感知。但無論是日常生活中穩(wěn)定供應(yīng)的生活必需品,還是背后龐大的工業(yè)體系,幾乎所有決策都建立在結(jié)構(gòu)化數(shù)據(jù)的預(yù)測與調(diào)度之上。而 LDM 正是在這個隱蔽但關(guān)鍵的層面上,重新定義智能的邊界,其重要性完全不亞于現(xiàn)在被討論最多的語言智能和具身智能。更準(zhǔn)確地說,它和后兩者是互補關(guān)系,都是通往 AGI 的關(guān)鍵步驟。

而且,正如清華大學(xué)長聘副教授崔鵬所強調(diào)的那樣:將 AI 與工業(yè)場景深度結(jié)合,在我國具有格外突出的必要性。工業(yè)本身就是我國最具資源稟賦的領(lǐng)域,我們在工業(yè)數(shù)據(jù)的規(guī)模、覆蓋面、質(zhì)量,以及相關(guān)政策支持的力度上,都遠(yuǎn)遠(yuǎn)領(lǐng)先于其他國家。這意味著,一旦在這一領(lǐng)域形成新的技術(shù)范式,其落地深度與產(chǎn)業(yè)帶動力將是全球范圍內(nèi)少有的。

從這個角度來看,LimiX 所取得的成果更加令人欣慰,它力壓 Amazon AWS、INRIA 等一系列頂尖機構(gòu),在諸多性能測試上登頂。該模型的開源讓中國在非結(jié)構(gòu)化數(shù)據(jù)建模領(lǐng)域真正站到了世界前沿。

我們也期待國內(nèi)團(tuán)隊把這一方向的邊界推得更遠(yuǎn)。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
網(wǎng)傳阿塔最高領(lǐng)導(dǎo)人阿洪扎達(dá)在空襲中身亡

網(wǎng)傳阿塔最高領(lǐng)導(dǎo)人阿洪扎達(dá)在空襲中身亡

頭條爆料007
2026-02-28 06:29:13
中使館:請在以中國公民堅持非必要不外出 提前熟悉周邊避彈設(shè)施和避險路線,確保人身和財產(chǎn)安全

中使館:請在以中國公民堅持非必要不外出 提前熟悉周邊避彈設(shè)施和避險路線,確保人身和財產(chǎn)安全

每日經(jīng)濟(jì)新聞
2026-02-28 10:26:19
如今黃河已成懸河,為啥不讓挖泥船把泥沙清走,讓黃河整體下移?

如今黃河已成懸河,為啥不讓挖泥船把泥沙清走,讓黃河整體下移?

天下十三洲獵奇
2026-03-01 00:21:41
日本新晉女神!阿部夏樹,魔鬼般的身材比例,算得上是頂級天賦。

日本新晉女神!阿部夏樹,魔鬼般的身材比例,算得上是頂級天賦。

情感大頭說說
2026-02-28 15:21:28
伊朗正式封鎖霍爾木茲海峽,用高超音速導(dǎo)彈再打以色列!全面失控

伊朗正式封鎖霍爾木茲海峽,用高超音速導(dǎo)彈再打以色列!全面失控

丹妮觀
2026-03-01 00:45:58
向太向華強公開向佐向佑兒時視頻,向太顏值出眾被贊碾壓關(guān)之琳

向太向華強公開向佐向佑兒時視頻,向太顏值出眾被贊碾壓關(guān)之琳

韓小娛
2026-02-28 16:14:30
北歐大陸第一美女,五官精致,顏值絕美,確實好看

北歐大陸第一美女,五官精致,顏值絕美,確實好看

小椰的奶奶
2026-02-28 00:02:19
1-0!瓜迪奧拉率隊狂飆:豪取6連勝,冠軍爭奪白熱化,前2只差2分

1-0!瓜迪奧拉率隊狂飆:豪取6連勝,冠軍爭奪白熱化,前2只差2分

足球狗說
2026-03-01 03:26:20
陳麗君在臺灣被圍了,長得太好看,走都走不出,連人民日報都通告

陳麗君在臺灣被圍了,長得太好看,走都走不出,連人民日報都通告

殘夢斷憶
2026-03-01 00:17:08
詹?。郝勤A得驚險,塞門約和格伊兩名冬窗新援太重要了

詹俊:曼城贏得驚險,塞門約和格伊兩名冬窗新援太重要了

懂球帝
2026-03-01 05:00:15
中國開盤,世界崩潰!

中國開盤,世界崩潰!

米宅海外
2026-02-28 08:04:00
網(wǎng)傳新能源汽車開征“里程稅” 收費0.12元/公里 多地回應(yīng)

網(wǎng)傳新能源汽車開征“里程稅” 收費0.12元/公里 多地回應(yīng)

快科技
2026-02-27 21:58:15
“清華學(xué)霸”李一諾:27歲博士畢業(yè),4年生3個娃,替世界首富花錢

“清華學(xué)霸”李一諾:27歲博士畢業(yè),4年生3個娃,替世界首富花錢

北有南梔
2026-02-28 17:55:03
東詹翻臉三大鏡頭曝光!入場就鬧翻,隊友手足無措,艾頓成替罪羊

東詹翻臉三大鏡頭曝光!入場就鬧翻,隊友手足無措,艾頓成替罪羊

嘴炮體壇
2026-02-28 11:26:34
全球足球俱樂部年度吸金王:一年收入近百億,已連續(xù)25個季度盈利

全球足球俱樂部年度吸金王:一年收入近百億,已連續(xù)25個季度盈利

柳先說
2026-02-27 22:02:28
美以發(fā)動大規(guī)??找u,避險情緒下金價大漲,關(guān)注黃金ETF國泰(518800)、黃金股票ETF(517400)

美以發(fā)動大規(guī)??找u,避險情緒下金價大漲,關(guān)注黃金ETF國泰(518800)、黃金股票ETF(517400)

每日經(jīng)濟(jì)新聞
2026-02-28 18:13:04
章子怡也沒想到,2026春節(jié)才過不到11天,54歲汪峰再迎噩耗

章子怡也沒想到,2026春節(jié)才過不到11天,54歲汪峰再迎噩耗

林雁飛
2026-02-28 23:18:31
不被任何人拿捏的頂級思維:不要回答別人的問題,要回答別人的目的

不被任何人拿捏的頂級思維:不要回答別人的問題,要回答別人的目的

古代經(jīng)典
2026-02-25 15:40:12
少婦當(dāng)眾猥褻年輕男子:脫褲裸露下體,正面照流出,私密細(xì)節(jié)披露

少婦當(dāng)眾猥褻年輕男子:脫褲裸露下體,正面照流出,私密細(xì)節(jié)披露

博士觀察
2026-02-27 14:51:00
歷史重演?精準(zhǔn)預(yù)言2008年危機的老人說2026年將是“至暗時刻”

歷史重演?精準(zhǔn)預(yù)言2008年危機的老人說2026年將是“至暗時刻”

次元君情感
2026-02-17 23:50:31
2026-03-01 05:35:00
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
12382文章數(shù) 142573關(guān)注度
往期回顧 全部

科技要聞

狂攬1100億美元!OpenAI再創(chuàng)融資神話

頭條要聞

伊朗媒體公布反擊美軍軍事行動結(jié)果

頭條要聞

伊朗媒體公布反擊美軍軍事行動結(jié)果

體育要聞

球隊主力全報銷?頂風(fēng)擺爛演都不演了

娛樂要聞

周杰倫兒子正面照曝光,與父親好像

財經(jīng)要聞

沖突爆發(fā) 市場變天?

汽車要聞

嵐圖泰山黑武士版3月上市 搭載華為四激光智駕方案

態(tài)度原創(chuàng)

旅游
教育
游戲
本地
軍事航空

旅游要聞

忻州古城×元宵節(jié) | “夯”爆了!看非遺社火解鎖忻州古城的超長年味!

教育要聞

勸退:最不建議國內(nèi)留學(xué)生去讀的幾個專業(yè)

所有人保持嘴角不變!生化危機:安魂曲里昂騷話大盤點

本地新聞

津南好·四時總相宜

軍事要聞

美國以色列聯(lián)合襲擊伊朗 實時戰(zhàn)況

無障礙瀏覽 進(jìn)入關(guān)懷版