国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

拿了30個(gè)冠軍的騰訊翻譯模型,實(shí)際表現(xiàn)又如何?

0
分享至

騰訊在Hugging Face上發(fā)布了一個(gè)專門用來(lái)翻譯的模型,叫做Hunyuan-MT-7B。根據(jù)它的官方介紹,這個(gè)翻譯模型在WMT25競(jìng)賽中,該模型在參與的31個(gè)語(yǔ)言類別中有30個(gè)獲得了第一名。并且在同等規(guī)模模型中實(shí)現(xiàn)了行業(yè)領(lǐng)先的性能。

而Hunyuan-MT-7B的集成模型Hunyuan-MT-Chimera-7B,是業(yè)界首個(gè)開(kāi)源翻譯集成模型,將翻譯質(zhì)量提升至新高度。所謂集成模型,是指一種機(jī)器學(xué)習(xí)方法。它的核心思想是,不依賴單個(gè)模型進(jìn)行預(yù)測(cè)或判斷,而是將多個(gè)模型的預(yù)測(cè)結(jié)果結(jié)合起來(lái),從而獲得比任何一個(gè)單一模型都更好、更穩(wěn)定的最終結(jié)果。

那么回到翻譯這個(gè)事上來(lái),Chimera的邏輯就是讓MT-7B翻譯系統(tǒng)生成多個(gè)不同的翻譯候選版本,會(huì)分析這些候選版本,將它們各自的優(yōu)點(diǎn)整合起來(lái)。最后,生成一個(gè)質(zhì)量超越了任何一個(gè)單一候選版本的、更優(yōu)的最終譯文。

但是由于官網(wǎng)目前只有MT-7B這一種版本,因此本文只對(duì)該版本進(jìn)行了測(cè)試。

01

這里我使用的都是很常見(jiàn)的英語(yǔ)臺(tái)詞,出自各種經(jīng)典讀物。

出自《羅密歐與朱麗葉》,原文通常被翻譯為“姓名算得了什么?我們所稱的玫瑰,換個(gè)名字還是一樣芳香”

出自《雙城記》,這個(gè)翻譯的非常精準(zhǔn)。

出自《了不起的蓋茨比》,同樣也翻譯得非常精準(zhǔn)。

接下來(lái),提高難度,我開(kāi)始用一些現(xiàn)代英語(yǔ)臺(tái)詞來(lái)測(cè)試模型的翻譯效果。

這句話是《英雄聯(lián)盟》戲命師 燼的選定語(yǔ)音,我于殺戮之中盛放,亦如黎明中的花朵。

這句話來(lái)自電影《蜘蛛俠》,通常我們翻譯成“能力越大,責(zé)任越大”。

既然英語(yǔ)差不多沒(méi)問(wèn)題,就來(lái)試試日語(yǔ)和韓語(yǔ)。

這是《游戲王5D'S》紅蓮魔龍召喚臺(tái)詞,王者的鼓動(dòng),現(xiàn)在于此列成陣勢(shì)!看著這天地鳴動(dòng)的力量吧!同調(diào)召喚,吾之魂,紅蓮魔龍!日語(yǔ)中的鼓動(dòng)(こどう)并非全部都是心跳的意思,也可以指脈動(dòng)、律動(dòng)、震動(dòng)等等。

今ここに列をなす,要拆分出來(lái)理解。其中“今”代表此時(shí)此刻,“ここに”是在這里,指的是地點(diǎn),“列をなす”是組成一列,而混元將其簡(jiǎn)單譯作“此刻在此匯聚”并不是很合適。

在韓語(yǔ)方面,Hunyuan-MT-7B也表現(xiàn)得不錯(cuò)。

這是K/DA歌曲《POP STAR》中阿卡麗(田小娟)的第一句歌詞,即便是英語(yǔ)和韓語(yǔ)混雜,MT-7B翻譯得依然非常準(zhǔn)確。

如果帶著Emoji一起翻譯,那么混元MT可能會(huì)出現(xiàn)吞字的情況。比如圖中的許秀虧桑提圣經(jīng),混元沒(méi)有翻譯出??201。?? 是 ?? ???的縮寫,??是魔法,???是抵抗力,因此 ??201 的意思是魔法抗性是201。

02

從官方發(fā)布的技術(shù)報(bào)告來(lái)看,騰訊混元MT設(shè)計(jì)的目標(biāo)是提供高質(zhì)量的多語(yǔ)言互譯能力,現(xiàn)階段支持包括中文、英文、日文以及哈薩克語(yǔ)、維吾爾語(yǔ)、蒙古語(yǔ)、藏語(yǔ)等5種中國(guó)少數(shù)民族語(yǔ)言在內(nèi)的33種語(yǔ)言之間的雙向翻譯。

混元MT的構(gòu)建采用了一套完整的、系統(tǒng)化的訓(xùn)練框架,這個(gè)框架將模型的訓(xùn)練過(guò)程分解為幾個(gè)前后銜接的階段,旨在逐步提升模型的翻譯能力。整個(gè)流程從未經(jīng)特定任務(wù)訓(xùn)練的基礎(chǔ)模型開(kāi)始,通過(guò)一系列專門針對(duì)機(jī)器翻譯的優(yōu)化步驟,最終產(chǎn)出具備專業(yè)翻譯能力的模型。

訓(xùn)練流程的第一個(gè)環(huán)節(jié)是通用預(yù)訓(xùn)練。這個(gè)階段的目標(biāo)是構(gòu)建一個(gè)具備廣泛知識(shí)和多語(yǔ)言基礎(chǔ)理解能力的基座模型,即Hunyuan-7B-Base。在訓(xùn)練過(guò)程中,模型學(xué)習(xí)了包含中文、英文以及其他多種語(yǔ)言在內(nèi)的數(shù)據(jù),其中非中英文的多語(yǔ)言數(shù)據(jù)量達(dá)到了1.3萬(wàn)億個(gè)tokens。

為了確保訓(xùn)練數(shù)據(jù)的質(zhì)量和多樣性,研發(fā)團(tuán)隊(duì)建立了一套數(shù)據(jù)質(zhì)量評(píng)估體系。該體系從知識(shí)價(jià)值、真實(shí)性和寫作風(fēng)格三個(gè)維度對(duì)文本進(jìn)行打分,并根據(jù)數(shù)據(jù)來(lái)源的特性,對(duì)不同維度的權(quán)重進(jìn)行調(diào)整。比如翻譯專業(yè)知識(shí)的網(wǎng)站,就會(huì)優(yōu)先選擇知識(shí)價(jià)值得分高的數(shù)據(jù)。

同時(shí),為了保證內(nèi)容覆蓋面的均衡,還建立了學(xué)科、行業(yè)和內(nèi)容主題三個(gè)層面的標(biāo)簽系統(tǒng),用以調(diào)整不同領(lǐng)域數(shù)據(jù)的比例,并過(guò)濾掉低質(zhì)量或不相關(guān)的內(nèi)容。通過(guò)這一階段的訓(xùn)練,Hunyuan-7B-Base模型在通用知識(shí)、邏輯推理、數(shù)學(xué)、編程和多語(yǔ)言能力上奠定了基礎(chǔ)。

接下來(lái)的第二個(gè)環(huán)節(jié)是面向機(jī)器翻譯的預(yù)訓(xùn)練。這個(gè)階段在通用基座模型的基礎(chǔ)上,加入了大量為翻譯任務(wù)篩選的單語(yǔ)和雙語(yǔ)語(yǔ)料,目的是使模型的能力向翻譯領(lǐng)域傾斜和深化。單語(yǔ)數(shù)據(jù)主要來(lái)源于mC4和OSCAR等公開(kāi)數(shù)據(jù)集,并經(jīng)過(guò)了嚴(yán)格的清洗流程,包括語(yǔ)言識(shí)別、文檔級(jí)別去重以及使用語(yǔ)言模型過(guò)濾掉高困惑度的低質(zhì)量文本。

雙語(yǔ)平行語(yǔ)料則來(lái)自O(shè)PUS和ParaCrawl等公開(kāi)數(shù)據(jù)集,團(tuán)隊(duì)使用CometKiwi等無(wú)需參考譯文的質(zhì)量評(píng)估工具進(jìn)行篩選,以保證句對(duì)的質(zhì)量。為了確定不同來(lái)源數(shù)據(jù)的最佳混合比例,團(tuán)隊(duì)采用了一種名為RegMix的策略,通過(guò)在小規(guī)模模型上進(jìn)行實(shí)驗(yàn),找到能夠使訓(xùn)練損失最小化的數(shù)據(jù)配比,并將其應(yīng)用于正式的訓(xùn)練中。

此外,為了防止模型在學(xué)習(xí)新知識(shí)時(shí)遺忘通用預(yù)訓(xùn)練階段學(xué)到的能力,訓(xùn)練數(shù)據(jù)中還包含了20%的原始預(yù)訓(xùn)練語(yǔ)料作為重放數(shù)據(jù)。

完成兩個(gè)預(yù)訓(xùn)練階段后,模型進(jìn)入第三個(gè)環(huán)節(jié),即后訓(xùn)練階段。這一階段通過(guò)監(jiān)督微調(diào)(SFT)和強(qiáng)化學(xué)習(xí)(RL)等技術(shù),將模型的翻譯能力進(jìn)行精細(xì)化調(diào)優(yōu)和對(duì)齊。監(jiān)督微調(diào)分為兩個(gè)步驟。第一步使用約300萬(wàn)句對(duì)的平行語(yǔ)料,旨在增強(qiáng)模型的基礎(chǔ)翻譯能力和遵循指令的能力。

這些數(shù)據(jù)來(lái)自多個(gè)來(lái)源,包括Flores-200開(kāi)發(fā)集、往年的WMT評(píng)測(cè)測(cè)試集、人工標(biāo)注的中文與少數(shù)民族語(yǔ)言互譯數(shù)據(jù)集,以及使用DeepSeek-V3-0324模型生成的合成數(shù)據(jù)。數(shù)據(jù)同樣經(jīng)過(guò)CometKiwi和GEMBA等質(zhì)量評(píng)估指標(biāo)的篩選。第二步則使用一個(gè)規(guī)模更小但質(zhì)量更高的數(shù)據(jù)集(約26.8萬(wàn)句對(duì))對(duì)模型進(jìn)行進(jìn)一步的精煉。這些數(shù)據(jù)經(jīng)過(guò)了更嚴(yán)格的篩選過(guò)程,并對(duì)多輪評(píng)估中得分一致性較差的樣本進(jìn)行了人工校驗(yàn)。

監(jiān)督微調(diào)之后是強(qiáng)化學(xué)習(xí)階段。機(jī)器翻譯任務(wù)的輸出具有語(yǔ)義多樣性,難以用簡(jiǎn)單的規(guī)則進(jìn)行評(píng)估,這為強(qiáng)化學(xué)習(xí)的應(yīng)用帶來(lái)了挑戰(zhàn)。為解決此問(wèn)題,混元MT采用了GRPO算法,并設(shè)計(jì)了一個(gè)復(fù)合獎(jiǎng)勵(lì)函數(shù)。

該獎(jiǎng)勵(lì)函數(shù)包含三個(gè)部分:第一部分是質(zhì)量感知獎(jiǎng)勵(lì),使用與人類譯員判斷高度相關(guān)的XCOMET-XXL評(píng)分和基于DeepSeek-V3-0324模型的GEMBA框架評(píng)分,共同評(píng)估翻譯的整體質(zhì)量;第二部分是術(shù)語(yǔ)感知獎(jiǎng)勵(lì),它利用詞對(duì)齊工具提取源文和譯文中的術(shù)語(yǔ)等關(guān)鍵信息,通過(guò)計(jì)算二者的重合率來(lái)獎(jiǎng)勵(lì)模型,促使模型更關(guān)注專業(yè)術(shù)語(yǔ)的準(zhǔn)確翻譯;第三部分是重復(fù)懲罰,用于檢測(cè)和懲罰模型在訓(xùn)練后期可能出現(xiàn)的重復(fù)輸出,以維持生成內(nèi)容的多樣性和訓(xùn)練的穩(wěn)定性。

經(jīng)過(guò)這一系列后訓(xùn)練流程,最終產(chǎn)出的模型即為Hunyuan-MT-7B。

03

在Hunyuan-MT-7B的基礎(chǔ)上,系統(tǒng)還構(gòu)建了Hunyuan-MT-Chimera-7B模型。該模型采用了一種弱到強(qiáng)的強(qiáng)化學(xué)習(xí)方法。正如前文所述,其核心思想是在推理時(shí),首先生成多個(gè)不同的翻譯候選結(jié)果,然后利用一個(gè)基于Hunyuan-MT-7B訓(xùn)練的融合模型,將這些候選結(jié)果的優(yōu)點(diǎn)整合起來(lái),生成一個(gè)質(zhì)量超越任何單一候選結(jié)果的最終譯文。

這個(gè)融合模型的訓(xùn)練同樣使用強(qiáng)化學(xué)習(xí),其獎(jiǎng)勵(lì)函數(shù)由XCOMET-XXL評(píng)分、DeepSeek-V3-0324評(píng)分和重復(fù)懲罰項(xiàng)構(gòu)成。這種方法有效地利用了集成學(xué)習(xí)的優(yōu)勢(shì),在不增加基礎(chǔ)模型參數(shù)量的情況下,進(jìn)一步提升了翻譯的上限。

在性能表現(xiàn)上,混元MT系統(tǒng)在多個(gè)公開(kāi)評(píng)測(cè)基準(zhǔn)上進(jìn)行了測(cè)試。結(jié)果顯示,無(wú)論是在WMT24pp還是FLORES-200等通用翻譯測(cè)試集上,7B參數(shù)規(guī)模的Hunyuan-MT-7B和Hunyuan-MT-Chimera-7B,其翻譯質(zhì)量均超過(guò)了現(xiàn)有的同等規(guī)模開(kāi)源模型,也優(yōu)于一些知名的商業(yè)翻譯系統(tǒng)和參數(shù)量遠(yuǎn)大于它的通用大模型。

特別是在中文與少數(shù)民族語(yǔ)言互譯這個(gè)方向上,混元MT的表現(xiàn)顯著優(yōu)于所有其他對(duì)比模型,這體現(xiàn)了其在低資源語(yǔ)言翻譯方向上的針對(duì)性優(yōu)化取得了成效。人工評(píng)測(cè)的結(jié)果也證實(shí)了這一點(diǎn),在包含社交、郵件、購(gòu)物、導(dǎo)航等多個(gè)生活場(chǎng)景的中英互譯測(cè)試中,Hunyuan-MT-7B的翻譯質(zhì)量與Gemini-2.5-Pro、DeepSeek-V3-0324等頂尖的大型模型處于同一水平,表明通過(guò)面向翻譯任務(wù)的系統(tǒng)性優(yōu)化,中等規(guī)模的模型同樣可以達(dá)到很高的翻譯水準(zhǔn)。

歡迎在評(píng)論區(qū)留言~
如需開(kāi)白請(qǐng)加小編微信:dongfangmark

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一個(gè)知縣的四十五萬(wàn)兩

一個(gè)知縣的四十五萬(wàn)兩

老鷹哥
2026-03-21 11:28:13
連鎖反應(yīng),意大利足協(xié)主席格拉維納、國(guó)家隊(duì)領(lǐng)隊(duì)布馮和主帥加圖索一天內(nèi)相繼離任

連鎖反應(yīng),意大利足協(xié)主席格拉維納、國(guó)家隊(duì)領(lǐng)隊(duì)布馮和主帥加圖索一天內(nèi)相繼離任

懂球帝
2026-04-03 20:33:34
湖人官宣東契奇賽季報(bào)銷!二級(jí)拉傷!臥虎無(wú)了!

湖人官宣東契奇賽季報(bào)銷!二級(jí)拉傷!臥虎無(wú)了!

貴圈真亂
2026-04-04 10:11:31
再見(jiàn)!麻豆傳媒突然官宣,永久關(guān)停

再見(jiàn)!麻豆傳媒突然官宣,永久關(guān)停

我不叫阿哏
2026-04-03 15:25:28
禁止所有中國(guó)外交官入境,不讓兩岸統(tǒng)一,這個(gè)國(guó)家比美國(guó)還要囂張

禁止所有中國(guó)外交官入境,不讓兩岸統(tǒng)一,這個(gè)國(guó)家比美國(guó)還要囂張

羽逸地之光
2026-03-19 14:02:05
特朗普通報(bào)全球,目標(biāo)接近完成?不到24小時(shí),伊朗宣布再擊落F35

特朗普通報(bào)全球,目標(biāo)接近完成?不到24小時(shí),伊朗宣布再擊落F35

薦史
2026-04-04 10:28:55
上海發(fā)布市管干部任職前公示:徐寅之、劉斌擬任市級(jí)機(jī)關(guān)正職

上海發(fā)布市管干部任職前公示:徐寅之、劉斌擬任市級(jí)機(jī)關(guān)正職

澎湃新聞
2026-04-03 19:26:05
5登春晚的央視寵兒平安,如今在縣城舞臺(tái)唱歌:創(chuàng)業(yè)敗光千萬(wàn)家產(chǎn)

5登春晚的央視寵兒平安,如今在縣城舞臺(tái)唱歌:創(chuàng)業(yè)敗光千萬(wàn)家產(chǎn)

川川八卦說(shuō)
2026-04-04 10:50:58
伊朗大橋被毀,領(lǐng)導(dǎo)人的鐵頭功;
美軍戰(zhàn)機(jī)墜落,飛行員生死時(shí)速

伊朗大橋被毀,領(lǐng)導(dǎo)人的鐵頭功; 美軍戰(zhàn)機(jī)墜落,飛行員生死時(shí)速

跟著老李看世界
2026-04-04 09:45:40
上海市中心這幢樓,深陷“群租困局”!物業(yè)稱“管不了”,相關(guān)部門回應(yīng)

上海市中心這幢樓,深陷“群租困局”!物業(yè)稱“管不了”,相關(guān)部門回應(yīng)

新民晚報(bào)
2026-04-03 19:45:55
4月3日俄烏最新:俄軍中將斃命

4月3日俄烏最新:俄軍中將斃命

西樓飲月
2026-04-03 16:05:24
短線拉升!美聯(lián)儲(chǔ),降息大消息!美國(guó)發(fā)布重磅數(shù)據(jù)

短線拉升!美聯(lián)儲(chǔ),降息大消息!美國(guó)發(fā)布重磅數(shù)據(jù)

數(shù)據(jù)寶
2026-04-04 07:45:38
最新!江蘇誕生一位千萬(wàn)富翁!

最新!江蘇誕生一位千萬(wàn)富翁!

江南晚報(bào)
2026-04-03 13:15:38
壹點(diǎn)幫辦|準(zhǔn)新娘診所輸液后休克昏迷!泰安這家診所“人間蒸發(fā)”

壹點(diǎn)幫辦|準(zhǔn)新娘診所輸液后休克昏迷!泰安這家診所“人間蒸發(fā)”

齊魯壹點(diǎn)
2026-04-03 19:28:42
王晶再揭關(guān)之琳秘史!高爾夫球只是冰山一角,劉鑾雄自爆真相太扎心

王晶再揭關(guān)之琳秘史!高爾夫球只是冰山一角,劉鑾雄自爆真相太扎心

動(dòng)物奇奇怪怪
2026-04-01 18:50:33
一場(chǎng)103-115讓火箭很無(wú)奈,森林狼死守第六,完美避開(kāi)雷霆、掘金

一場(chǎng)103-115讓火箭很無(wú)奈,森林狼死守第六,完美避開(kāi)雷霆、掘金

毒舌NBA
2026-04-04 10:35:58
百大媒體人票選MVP:第一選票亞歷山大88比8文班

百大媒體人票選MVP:第一選票亞歷山大88比8文班

體壇周報(bào)
2026-04-04 06:49:13
倫納德和嬌妻近照,34歲還是超巨,賺了4.3億,妻子旺夫相

倫納德和嬌妻近照,34歲還是超巨,賺了4.3億,妻子旺夫相

大西體育
2026-04-03 22:36:13
CBA現(xiàn)役本土第一人!不是張鎮(zhèn)麟和郭昊文,而是中國(guó)男籃定海神針

CBA現(xiàn)役本土第一人!不是張鎮(zhèn)麟和郭昊文,而是中國(guó)男籃定海神針

蛋疼體育
2026-04-02 17:36:24
以色列駐法大使稱“法國(guó)不把以方當(dāng)朋友”,法國(guó)外交部回應(yīng)

以色列駐法大使稱“法國(guó)不把以方當(dāng)朋友”,法國(guó)外交部回應(yīng)

鳳凰衛(wèi)視
2026-04-03 11:53:31
2026-04-04 12:08:49
直面派 incentive-icons
直面派
講述值得講述的真實(shí)故事
258文章數(shù) 236關(guān)注度
往期回顧 全部

科技要聞

內(nèi)存一年漲四倍!國(guó)產(chǎn)手機(jī)廠商集體漲價(jià)

頭條要聞

男子建了18個(gè)"5G基站"被政府叫停 發(fā)現(xiàn)紅頭文件為偽造

頭條要聞

男子建了18個(gè)"5G基站"被政府叫停 發(fā)現(xiàn)紅頭文件為偽造

體育要聞

剎不住的泰格·伍茲,口袋里的兩粒藥丸

娛樂(lè)要聞

闞清子口碑贏了!全開(kāi)麥跑調(diào)拒絕重唱

財(cái)經(jīng)要聞

劉紀(jì)鵬:只盼長(zhǎng)慢牛,鞏固4000點(diǎn)是關(guān)鍵

汽車要聞

17萬(wàn)級(jí)海豹07EV 不僅續(xù)航長(zhǎng)還有9分鐘滿電的快樂(lè)

態(tài)度原創(chuàng)

本地
時(shí)尚
數(shù)碼
手機(jī)
公開(kāi)課

本地新聞

跟著歌聲游安徽,聽(tīng)古村回響

Softfit穿搭火了,穿出春日松弛感和氛圍美

數(shù)碼要聞

烤箱修顯卡大法再現(xiàn)!報(bào)廢RX 6700 XT 188°C烘烤:12分鐘復(fù)活

手機(jī)要聞

三月4K以上性價(jià)比榜,vivo成最大贏家

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版