国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

數(shù)說(shuō)故事 ×IDEA 共創(chuàng)成果再登 ACL!「PARSQL 推理」直擊應(yīng)用痛點(diǎn)

0
分享至

近日,數(shù)說(shuō)故事×IDEA數(shù)說(shuō)故事實(shí)驗(yàn)室(以下簡(jiǎn)稱IDEA實(shí)驗(yàn)室)聯(lián)合研究團(tuán)隊(duì)共創(chuàng)的學(xué)術(shù)論文《PARSQL: Enhancing Text-to-SQL through SQL Parsing and Reasoning》被國(guó)際學(xué)術(shù)頂會(huì)ACL 2025收錄,繼此前雙方合力研究的「細(xì)粒度情感四元組識(shí)別 (ASQP) 任務(wù)」成果被收錄后,再度躋身 ACL 國(guó)際學(xué)術(shù)舞臺(tái)。

ACL大會(huì)由國(guó)際計(jì)算語(yǔ)言學(xué)協(xié)會(huì)主辦,是自然語(yǔ)言處理與計(jì)算語(yǔ)言學(xué)領(lǐng)域最高級(jí)別的學(xué)術(shù)會(huì)議。ACL 2025是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的唯一A類的自然語(yǔ)言領(lǐng)域國(guó)際學(xué)術(shù)會(huì)議。

本次研究成果入選 ACL國(guó)際頂會(huì),不僅是對(duì)「PARSQL」技術(shù)在輕量模型語(yǔ)義解析領(lǐng)域創(chuàng)新突破的國(guó)際認(rèn)可,更是對(duì)數(shù)說(shuō)故事與IDEA實(shí)驗(yàn)室產(chǎn)學(xué)研深度融合技術(shù)創(chuàng)新的肯定。

在企業(yè)數(shù)據(jù)量呈爆炸式增長(zhǎng)的當(dāng)下,數(shù)據(jù)洞察早已從「加分項(xiàng)」變成核心剛需。品牌投放反饋、大促期間流量瞬變、跨境市場(chǎng)&政策波動(dòng)等場(chǎng)景,要求數(shù)據(jù)查詢分析具備「秒級(jí)反饋」能力,如何讓數(shù)據(jù)流動(dòng)起來(lái)并創(chuàng)造價(jià)值?以往的Text?to?SQL(NL2SQL)技術(shù),通過(guò)聊天的方式就能查詢數(shù)據(jù)庫(kù),但實(shí)際使用時(shí)經(jīng)常遇到尷尬問(wèn)題:

  • 常常漏掉關(guān)鍵約束。例如運(yùn)營(yíng)人員查詢「近 30 天微博投放中互動(dòng)率超 10% 且金額超 5 萬(wàn)」的內(nèi)容時(shí),模型因漏識(shí) 「金額」 條件致結(jié)果含大量低預(yù)算數(shù)據(jù)。
  • 查詢邏輯「翻車」。例如市場(chǎng)團(tuán)隊(duì)想獲取「每個(gè)品牌在小紅書(shū)平臺(tái)的平均點(diǎn)贊數(shù),并篩選出平均值大于1000的品牌」。模型誤將篩選條件放到SELECT子句中,導(dǎo)致查詢返回全量品牌數(shù)據(jù)而非目標(biāo)品牌。
  • 越復(fù)雜的業(yè)務(wù)需求,越「答非所問(wèn)」。例如數(shù)據(jù)分析師查詢 2024 年 Q1 連續(xù)三周產(chǎn)生爆文(點(diǎn)贊 > 1 萬(wàn))的品牌并分析其投放頻率周變化時(shí),模型因未理解「連續(xù)三周」「爆文定義」「頻率變化」復(fù)合邏輯僅返回所有爆文筆記,偏離分析目標(biāo)。

本次論文中,雙方合力研究的PARSQL(SQL解析與推理增強(qiáng)框架),直擊 Text-to-SQL 技術(shù)在實(shí)際應(yīng)用中的核心痛點(diǎn),當(dāng)面對(duì)復(fù)雜查詢時(shí),不是直接「硬闖」,而是先分析、再推理、最后生成,大大提升了準(zhǔn)確性。本次研究中,我們將「PARSQL」技術(shù)的創(chuàng)新應(yīng)用錨定在「輕量模型」上,讓輕量級(jí)模型在資源受限環(huán)境下實(shí)現(xiàn)復(fù)雜語(yǔ)義解析、多條件關(guān)聯(lián)查詢的效率提升,開(kāi)創(chuàng)低算力消耗的數(shù)據(jù)智能新路徑。

01「PARSQL」

讓輕量模型也能應(yīng)對(duì)復(fù)雜查詢

相較于傳統(tǒng)的 Text-to-SQL 「一步到位」轉(zhuǎn)換模式,「PARSQL」創(chuàng)新性地拆解為「解析→增強(qiáng)→推理→校對(duì)」的四步策略,讓輕量模型也能像資深數(shù)據(jù)分析師一樣,系統(tǒng)化地理解和處理復(fù)雜的查詢需求。

PARSQL的重要技術(shù)創(chuàng)新:解析+推理+選擇

  1. 智能SQL解析
    「PARSQL 」里的SQL解析器PARSer,能夠先把 SQL 拆解成抽象語(yǔ)法樹(shù)(AST),逐一提煉出用戶在查詢過(guò)程中的每個(gè)約束條件、子查詢片段和關(guān)鍵節(jié)點(diǎn)。接著,「PARSQL 」會(huì)依照 SQL 的執(zhí)行順序來(lái)「講故事」,從 FROM、WHERE 到 GROUP BY、HAVING,再到 ORDER BY,最后到SELECT,系統(tǒng)化地生成每一步的自然語(yǔ)言解釋,為數(shù)據(jù)增強(qiáng)提供高質(zhì)量訓(xùn)練樣本。
  2. 數(shù)據(jù)增強(qiáng)和多任務(wù)學(xué)習(xí)策略

「New Pairs」訓(xùn)練:將原始問(wèn)題和 SQL 拆成只帶部分約束的子對(duì),從細(xì)節(jié)開(kāi)始練起,讓輕量模型在輕量級(jí)練習(xí)中敏銳捕捉細(xì)節(jié);

「Reason Pairs」訓(xùn)練:讓模型輸出從問(wèn)題到推理步驟的完整鏈路,學(xué)會(huì)寫(xiě)出「為什么這么查」,提升邏輯連貫性;

并行優(yōu)化:同一次訓(xùn)練中,并行優(yōu)化Text-to-SQL和Text-to-Reason兩個(gè)任務(wù),讓模型既會(huì)寫(xiě)SQL,也會(huì)「說(shuō)理由」。

3.高效選擇策略
在推理階段,PARSQL會(huì)生成多組候選SQL和對(duì)應(yīng)的「推理腳本」,通過(guò)N-gram相似度計(jì)算,一秒鐘內(nèi)挑出最契合邏輯的那條。這種自我校正機(jī)制,把原本容易跑偏的「認(rèn)知坑」填平。

「PARSQL」技術(shù)已成功落地到數(shù)說(shuō)故事旗下產(chǎn)品矩陣,以數(shù)說(shuō)聲吶產(chǎn)品的「智能問(wèn)數(shù)」功能為例,業(yè)務(wù)人員可通過(guò)簡(jiǎn)答對(duì)話的形式便能實(shí)現(xiàn)自主數(shù)據(jù)探索。從業(yè)務(wù)的視角提出數(shù)據(jù)需求,「智能問(wèn)數(shù)」能基于業(yè)務(wù)問(wèn)題進(jìn)行分析和解讀,從數(shù)據(jù)中篩選準(zhǔn)確的數(shù)據(jù),進(jìn)行合理的統(tǒng)計(jì)與總結(jié),給用戶明確的回答。

02 性能突破:「PARSQL」

讓輕量模型追平7B大模型

實(shí)驗(yàn)表明,與其他Text-to-SQL方法相比,「PARSQL」這樣一套「解析→增強(qiáng)→校對(duì)」的組合拳,在多個(gè)基準(zhǔn)數(shù)據(jù)集上展示了更高的準(zhǔn)確性和更強(qiáng)的魯棒性。

  • 同等模型規(guī)模下表現(xiàn)更優(yōu):在 BIRD 數(shù)據(jù)集上,PARSQL rule 和 PARSQL llm 相較于 1B 和 3B參數(shù)規(guī)模下均優(yōu)于 SFT CodeS。其中,PARSQL-3Bllm 比 SFT CodeS-3B 的 EX 分?jǐn)?shù)提高了 1.96%,表現(xiàn)接近SFT CodeS-7B,意味著用更少的參數(shù)實(shí)現(xiàn)了相當(dāng)?shù)男阅鼙憩F(xiàn)。
  • 在通用數(shù)據(jù)集上更具競(jìng)爭(zhēng)力:在Spider基準(zhǔn)上,PARSQL-1B?rule 相比 SFT CodeS?1B 在執(zhí)行準(zhǔn)確率和語(yǔ)法正確性上分別提升 2.8% 和 2.6%,顯著減少了小錯(cuò)誤的產(chǎn)生,體現(xiàn)出其在基礎(chǔ)任務(wù)中的穩(wěn)定性和細(xì)節(jié)處理能力。
  • 在復(fù)雜任務(wù)中更有潛力:在 BIRD 數(shù)據(jù)集上,PARSQL?3B 相較于依賴 GPT?4 的閉源方案,展現(xiàn)出相近的性能,說(shuō)明在資源受限場(chǎng)景下,輕量模型仍具備良好的拓展?jié)摿Α?/li>

這意味著企業(yè)可以通過(guò)「PARSQL」技術(shù),用更少的計(jì)算資源獲得更高的查詢準(zhǔn)確性,大幅降低AI部署和運(yùn)維成本,同時(shí)保證業(yè)務(wù)查詢的精確性。當(dāng) AI 技術(shù)不再是「猛砸算力」,而是通過(guò)解析+推理+自我校正的多維度設(shè)計(jì),就能讓「小而美」的模型在千變?nèi)f化的業(yè)務(wù)需求中游刃有余。

03 產(chǎn)業(yè)價(jià)值:重新定義

數(shù)據(jù)查詢的「經(jīng)濟(jì)」模型

對(duì)于數(shù)據(jù)服務(wù)提供商和企業(yè)客戶而言,「PARSQL」的技術(shù)突破具有重要的商業(yè)價(jià)值:

1、成本優(yōu)化:輕量模型的資源消耗僅為大模型的幾分之一,顯著降低算力成本和部署門(mén)檻;

2、精度保證:通過(guò)SQL解析和推理機(jī)制,確保查詢結(jié)果的準(zhǔn)確性,避免業(yè)務(wù)決策偏;

3、本地部署:輕量模型更適合私有化部署,滿足數(shù)據(jù)安全和隱私保護(hù)需求;

4、實(shí)時(shí)響應(yīng):更高的推理效率,支持高并發(fā)、低延時(shí)的查詢場(chǎng)景;

隨著「PARSQL」技術(shù)的產(chǎn)業(yè)化應(yīng)用,將進(jìn)一步降低企業(yè)數(shù)字化轉(zhuǎn)型的技術(shù)門(mén)檻,讓更多企業(yè)能夠以更低成本、更高效率地利用數(shù)據(jù)價(jià)值,實(shí)現(xiàn)智能化決策。

未來(lái),數(shù)說(shuō)故事將繼續(xù)秉承「用數(shù)據(jù)講好商業(yè)故事」的使命,攜手更多合作伙伴持續(xù)推動(dòng)AI技術(shù)在數(shù)據(jù)服務(wù)領(lǐng)域的創(chuàng)新應(yīng)用,為企業(yè)數(shù)字化轉(zhuǎn)型提供更加智能、高效、經(jīng)濟(jì)的解決方案。

關(guān)于IDEA數(shù)說(shuō)故事實(shí)驗(yàn)室

IDEA實(shí)驗(yàn)室 DataStory AI Lab由數(shù)說(shuō)故事攜手 IDEA實(shí)驗(yàn)室共建,基于數(shù)說(shuō)故事“大數(shù)據(jù)+AI”豐富的技術(shù)棧積累和平臺(tái)化能力,結(jié)合 IDEA實(shí)驗(yàn)室國(guó)際TOP50的超級(jí)計(jì)算集群優(yōu)勢(shì),將聯(lián)合國(guó)內(nèi)外頂尖高校和科研院所,圍繞AI知識(shí)圖譜、下一代動(dòng)態(tài)海量事理圖譜技術(shù)等領(lǐng)域展開(kāi)國(guó)際一流的研究和產(chǎn)業(yè)化落地。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
大爆冷!湖人117-135黃蜂,本場(chǎng)誰(shuí)是罪魁禍?zhǔn)祝瑪?shù)據(jù)不會(huì)說(shuō)謊!

大爆冷!湖人117-135黃蜂,本場(chǎng)誰(shuí)是罪魁禍?zhǔn)祝瑪?shù)據(jù)不會(huì)說(shuō)謊!

劉哥談體育
2026-01-16 14:32:46
賈國(guó)龍開(kāi)撕羅永浩的真相

賈國(guó)龍開(kāi)撕羅永浩的真相

首席品牌評(píng)論
2026-01-16 23:47:37
幫手全到齊,伊朗導(dǎo)彈庫(kù)存暴增,中方及時(shí)聲援,美英連夜通告撤軍

幫手全到齊,伊朗導(dǎo)彈庫(kù)存暴增,中方及時(shí)聲援,美英連夜通告撤軍

回京歷史夢(mèng)
2026-01-15 18:33:08
農(nóng)村香煙突然賣(mài)不動(dòng)了,這4個(gè)原因普遍存在,看看有沒(méi)有你?

農(nóng)村香煙突然賣(mài)不動(dòng)了,這4個(gè)原因普遍存在,看看有沒(méi)有你?

文雅筆墨
2026-01-16 12:41:40
羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

瓜汁橘長(zhǎng)Dr
2025-12-29 11:29:56
活到60歲我才懂:如果女人沒(méi)有給過(guò)你這三樣?xùn)|西,說(shuō)明她并不愛(ài)你

活到60歲我才懂:如果女人沒(méi)有給過(guò)你這三樣?xùn)|西,說(shuō)明她并不愛(ài)你

林林故事揭秘
2025-09-03 14:08:02
”經(jīng)濟(jì)學(xué)家吳曉求教授說(shuō):“老百姓都沒(méi)收入了,還在刺激消費(fèi)!這種做法是錯(cuò)誤的!

”經(jīng)濟(jì)學(xué)家吳曉求教授說(shuō):“老百姓都沒(méi)收入了,還在刺激消費(fèi)!這種做法是錯(cuò)誤的!

張曉磊
2025-11-07 11:34:05
“兩岸統(tǒng)一”突破點(diǎn)不在馬英九,也不在國(guó)民黨,可能在這個(gè)人身上

“兩岸統(tǒng)一”突破點(diǎn)不在馬英九,也不在國(guó)民黨,可能在這個(gè)人身上

趣文說(shuō)娛
2026-01-12 17:36:51
油煙直排造成大氣污染 北京烤肉劉被罰7000元

油煙直排造成大氣污染 北京烤肉劉被罰7000元

信網(wǎng)
2026-01-16 07:16:44
湖北某光伏公司快倒閉了!

湖北某光伏公司快倒閉了!

黯泉
2026-01-16 22:16:46
美媒嘆息:中國(guó)幾百萬(wàn)“剽竊”美國(guó)熔鹽堆技術(shù),如今技術(shù)反超10年

美媒嘆息:中國(guó)幾百萬(wàn)“剽竊”美國(guó)熔鹽堆技術(shù),如今技術(shù)反超10年

牛牛叨史
2026-01-15 02:48:46
北京多場(chǎng)“京味”活動(dòng)鼓勵(lì)市民到京郊過(guò)年

北京多場(chǎng)“京味”活動(dòng)鼓勵(lì)市民到京郊過(guò)年

新京報(bào)
2026-01-15 18:28:05
重慶一死者被定為三人惡勢(shì)力成員引爭(zhēng)議,曾被檢方認(rèn)定為微罪不訴,發(fā)回重審后成黑社會(huì)骨干

重慶一死者被定為三人惡勢(shì)力成員引爭(zhēng)議,曾被檢方認(rèn)定為微罪不訴,發(fā)回重審后成黑社會(huì)骨干

大風(fēng)新聞
2026-01-16 17:00:04
優(yōu)質(zhì)“蛋白質(zhì)”排行榜!大豆排倒數(shù)第1,蝦肉才排第4,第一名很多人都不知道

優(yōu)質(zhì)“蛋白質(zhì)”排行榜!大豆排倒數(shù)第1,蝦肉才排第4,第一名很多人都不知道

美食格物
2025-12-29 16:58:15
上海崇明區(qū)政協(xié)原黨組副書(shū)記張榮,被開(kāi)除黨籍!沉迷賭博,大搞權(quán)錢(qián)交易

上海崇明區(qū)政協(xié)原黨組副書(shū)記張榮,被開(kāi)除黨籍!沉迷賭博,大搞權(quán)錢(qián)交易

上觀新聞
2026-01-15 18:24:11
A股:剛剛,中央一部門(mén)發(fā)聲,釋放一信號(hào),下周兩個(gè)關(guān)鍵位定生死

A股:剛剛,中央一部門(mén)發(fā)聲,釋放一信號(hào),下周兩個(gè)關(guān)鍵位定生死

云鵬敘事
2026-01-17 00:00:06
有男生愿意嗎?湖南一獨(dú)生女招上門(mén)女婿,給10萬(wàn)彩禮孩子跟女方姓

有男生愿意嗎?湖南一獨(dú)生女招上門(mén)女婿,給10萬(wàn)彩禮孩子跟女方姓

唐小糖說(shuō)情感
2026-01-15 19:32:55
河南省離退休人員超600萬(wàn),人均養(yǎng)老金能有3000元嗎?一起算一下

河南省離退休人員超600萬(wàn),人均養(yǎng)老金能有3000元嗎?一起算一下

暖心人社
2026-01-16 20:41:43
向太太敢說(shuō)了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

向太太敢說(shuō)了!向華強(qiáng)今年已經(jīng)78了,但是她和向華強(qiáng)還有X生活!

心靜物娛
2025-12-24 11:02:28
臺(tái)媒指大S離世一年,汪小菲與徐家重開(kāi)協(xié)商,撫養(yǎng)費(fèi)之爭(zhēng)出現(xiàn)轉(zhuǎn)機(jī)

臺(tái)媒指大S離世一年,汪小菲與徐家重開(kāi)協(xié)商,撫養(yǎng)費(fèi)之爭(zhēng)出現(xiàn)轉(zhuǎn)機(jī)

手工制作阿殲
2026-01-17 04:56:32
2026-01-17 06:00:49
數(shù)說(shuō)故事
數(shù)說(shuō)故事
數(shù)據(jù)智能與AI營(yíng)銷科技公司
791文章數(shù) 63關(guān)注度
往期回顧 全部

科技要聞

賈國(guó)龍與羅永浩被禁言,微博CEO回應(yīng)

頭條要聞

羅永浩、賈國(guó)龍微博賬號(hào)均被禁言

頭條要聞

羅永浩、賈國(guó)龍微博賬號(hào)均被禁言

體育要聞

全隊(duì)身價(jià)=登貝萊,他們憑什么領(lǐng)跑法甲?

娛樂(lè)要聞

李湘翻車,早就有跡可循!

財(cái)經(jīng)要聞

清流|酒店商家在攜程和美團(tuán)之間淪為炮灰

汽車要聞

方程豹品牌銷量突破30萬(wàn)輛 2026年還將推出轎跑系列

態(tài)度原創(chuàng)

房產(chǎn)
時(shí)尚
親子
游戲
教育

房產(chǎn)要聞

喜封金頂 臻境初呈丨中糧·鉑悅壹號(hào)3#樓封頂大吉!

今年冬天最時(shí)髦保暖的4組搭配,照著穿美出新高度!

親子要聞

精神科醫(yī)生:家長(zhǎng)的“為你好”也可能對(duì)孩子造成創(chuàng)傷

十三年后,《逆戰(zhàn):未來(lái)》想為所有逆行者們找回青春"/> 主站 商城 論壇 自運(yùn)營(yíng) 登錄 注冊(cè) 十三年后,《逆戰(zhàn):未來(lái)》想為所有逆行者們找回青春 廉頗 2...

教育要聞

初中三年,最怕“掉隊(duì)式沉默”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版