国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Meta開源史上最強語音“基座模型”:一口氣支持1600+種語言

0
分享至


剛剛,Meta AI FAIR團隊發(fā)布了其在自動語音識別(ASR)領(lǐng)域的最新成果:Omnilingual ASR

這是一個模型套件,能為超過1600種語言提供自動語音識別能力,其規(guī)模和質(zhì)量都達到了新的水平。

值得關(guān)注的是,該框架被設(shè)計為社區(qū)驅(qū)動,世界各地的人們只需提供少量自己的樣本,就能將Omnilingual ASR擴展到新的語言

同時開源的,還有一系列相關(guān):

Omnilingual ASR Corpus:一個包含350種服務(wù)欠缺語言的轉(zhuǎn)錄語音的大型數(shù)據(jù)集

Omnilingual wav2vec 2.0:一個擴展到70億參數(shù)的、大規(guī)模多語言語音表征模型

語言探索Demo:一個可供人們探索模型所覆蓋語言的演示

目前,大多數(shù)ASR系統(tǒng)都集中在互聯(lián)網(wǎng)上資源豐富的一小部分語言上,這加劇了低資源語言使用者面臨的數(shù)字鴻溝

Meta FAIR團隊推出的Omnilingual ASR,旨在通過一個通用轉(zhuǎn)錄系統(tǒng),讓高質(zhì)量的語音轉(zhuǎn)文本技術(shù)能夠惠及代表性最不足的語言社區(qū)。其最終目標是打破語言障礙,實現(xiàn)跨語言和文化背景的交流

下載:

https://github.com/facebookresearch/omnilingual-asr

語言探索demo:

https://aidemos.atmeta.com/omnilingualasr/language-globe


轉(zhuǎn)錄工具:

https://huggingface.co/spaces/facebook/omniasr-transcriptions

paper:

https://ai.meta.com/research/publications/omnilingual-asr-open-source-multilingual-speech-recognition-for-1600-languages/

前所未有的語言覆蓋范圍與性能

盡管ASR技術(shù)近年來在許多高資源語言上已接近完美,但擴大語言覆蓋范圍一直是一項資源密集型任務(wù),現(xiàn)有AI架構(gòu)對數(shù)據(jù)的需求過高,難以實現(xiàn)通用擴展。

Omnilingual ASR通過引入兩種架構(gòu)變體來解決這一研究瓶頸。

首先,團隊首次將其wav2vec 2.0語音編碼器擴展到70億參數(shù),從原始、未轉(zhuǎn)錄的語音數(shù)據(jù)中生成了豐富的、大規(guī)模多語言語義表征。

接著,團隊構(gòu)建了兩種解碼器變體,將這些表征映射到字符序列:

1.一種依賴傳統(tǒng)的連接主義時間分類(CTC)目標。
2.另一種利用了在LLM中常見的傳統(tǒng)Transformer解碼器。

這種被稱為LLM-ASR的方法,在ASR性能上實現(xiàn)了階段性提升,尤其是在長尾語言上。

結(jié)果顯示,其7B-LLM-ASR系統(tǒng)在超過1600種語言上達到了SOTA性能,其中78%的語言字符錯誤率(CER)低于10


自帶語言(Bring Your Own Language)

除了擴展到1600多種語言外,Omnilingual ASR還改變了引入新語言的范式。

在大多數(shù)現(xiàn)有系統(tǒng)中,添加新語言需要專家驅(qū)動的微調(diào)。而Omnilingual ASR引入了首個能夠僅憑少量上下文示例就擴展到全新語言的大規(guī)模ASR框架

這得益于其受LLM啟發(fā)的系統(tǒng),該系統(tǒng)從大語言模型領(lǐng)域引入了上下文學習能力

在實踐中,這意味著一個使用不支持語言的用戶,只需提供少數(shù)幾個成對的音頻-文本樣本,就能獲得可用的轉(zhuǎn)錄質(zhì)量——無需大規(guī)模訓練數(shù)據(jù)、專業(yè)知識或高端計算資源


一套面向不同用例的模型

此次,Meta發(fā)布了一整套模型和一個數(shù)據(jù)集,為利益相關(guān)者擴展和改進任何語言的語音技術(shù)提供了所需的一切。

模型家族:提供兩種解碼器變體,從專為低功耗設(shè)備設(shè)計的輕量級300M版本,到為各種用例提供頂級精度的強大7B模型

基礎(chǔ)模型:通用語音基礎(chǔ)模型wav2vec 2.0也提供多種尺寸,可用于ASR之外的其他語音相關(guān)任務(wù)。

所有模型均在許可寬松的Apache 2.0許可下發(fā)布,數(shù)據(jù)則在CC-BY許可下提供。這些資產(chǎn)基于FAIR的開源fairseq2框架構(gòu)建

與全球合作伙伴共建

Omnilingual ASR的訓練語料庫在數(shù)量和語言多樣性上都是為ASR組建的最大語料庫之一,整合了公開可用的數(shù)據(jù)集和通過多個合作伙伴關(guān)系收集的社區(qū)來源語音記錄。

為了覆蓋那些幾乎沒有數(shù)字足跡的語言,團隊與當?shù)亟M織合作,招募并補償母語者,通常是在偏遠或記錄不足的地區(qū)。這部分委托收集的訓練語料庫作為Omnilingual ASR Corpus發(fā)布。迄今為止,這是有史以來最大的超低資源自然語音ASR數(shù)據(jù)集,覆蓋了數(shù)百種ASR系統(tǒng)前所未見的語言。

此外,通過語言技術(shù)合作伙伴計劃,團隊與Mozilla基金會的Common Voice和Lanfrica/NaijaVoices等組織合作,直接與當?shù)厣鐓^(qū)協(xié)作。這些合作關(guān)系為Omnilingual ASR注入了深厚的語言學知識和文化理解,確保技術(shù)能滿足當?shù)匦枨?/p>

參考:

https://ai.meta.com/blog/omnilingual-asr-advancing-automatic-speech-recognition/?utm_source=twitter&utm_medium=organic_social&utm_content=video&utm_campaign=omnilingual

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
26+8+4!登頂聯(lián)盟第一,無解的不是逆轉(zhuǎn),是科林斯賽后感謝哈登

26+8+4!登頂聯(lián)盟第一,無解的不是逆轉(zhuǎn),是科林斯賽后感謝哈登

金風說
2026-01-11 12:15:56
突發(fā),603359或終止重大資產(chǎn)重組!科技巨頭獲爆買超50億港元

突發(fā),603359或終止重大資產(chǎn)重組!科技巨頭獲爆買超50億港元

數(shù)據(jù)寶
2026-01-11 12:53:31
羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

羅晉攜任素汐去祈福后,唐嫣連發(fā)三文表態(tài),婚變傳聞終于真相大白

瓜汁橘長Dr
2025-12-29 11:29:56
李昊化身嘆息之墻,安東尼奧能確保下限!U23國足即將改寫歷史

李昊化身嘆息之墻,安東尼奧能確保下限!U23國足即將改寫歷史

中國足球的那些事兒
2026-01-11 22:01:58
維尼修斯手握兩家豪門邀約,與其留下不如換隊重啟

維尼修斯手握兩家豪門邀約,與其留下不如換隊重啟

K唐伯虎
2026-01-11 08:51:06
李連杰當年未在內(nèi)地上映的6部電影,理由個個奇葩,你看過幾部?

李連杰當年未在內(nèi)地上映的6部電影,理由個個奇葩,你看過幾部?

小Q侃電影
2026-01-11 21:50:49
18點30分!遼籃正式官宣,1米98鋒衛(wèi)搖擺人加盟,年薪曝光

18點30分!遼籃正式官宣,1米98鋒衛(wèi)搖擺人加盟,年薪曝光

王大發(fā)不懂球
2026-01-10 20:57:25
關(guān)曉彤工作室關(guān)于鹿晗關(guān)曉彤分手謠言作出了嚴正申明

關(guān)曉彤工作室關(guān)于鹿晗關(guān)曉彤分手謠言作出了嚴正申明

豆哥記錄
2026-01-11 17:41:48
如果3年內(nèi)沒有離開股市的打算,那就買這一種股票,賺到盆滿缽滿

如果3年內(nèi)沒有離開股市的打算,那就買這一種股票,賺到盆滿缽滿

股經(jīng)縱橫談
2026-01-09 17:42:31
安徽小伙在小國家創(chuàng)業(yè),“享受”一夫多妻、開放生活的他如今怎樣

安徽小伙在小國家創(chuàng)業(yè),“享受”一夫多妻、開放生活的他如今怎樣

牛牛叨史
2026-01-06 12:59:43
彭嘯破門U23國足1:0戰(zhàn)勝澳大利亞,距離出線只剩戰(zhàn)勝泰國

彭嘯破門U23國足1:0戰(zhàn)勝澳大利亞,距離出線只剩戰(zhàn)勝泰國

李廣專業(yè)體育評論
2026-01-11 21:28:59
2026,羽絨服不再“圍攻波司登”

2026,羽絨服不再“圍攻波司登”

螳螂觀察
2026-01-11 21:23:54
恭喜彭嘯!中足聯(lián)正式官宣,后防新星嶄露頭角,泰山未來10年希望

恭喜彭嘯!中足聯(lián)正式官宣,后防新星嶄露頭角,泰山未來10年希望

王大發(fā)不懂球
2026-01-11 19:47:10
張本美和又哭了,她爸爸笑的很嚇人,張本智和要奪冠,林昀儒回應(yīng)

張本美和又哭了,她爸爸笑的很嚇人,張本智和要奪冠,林昀儒回應(yīng)

小七七體育解說
2026-01-11 10:31:57
2026煙草新規(guī)實施在即!百萬店主改規(guī)矩,3億煙民買煙變樣了

2026煙草新規(guī)實施在即!百萬店主改規(guī)矩,3億煙民買煙變樣了

復轉(zhuǎn)這些年
2026-01-10 23:17:57
這家境怎么破局?女子失業(yè)后回到一貧如洗的家,自責無助很痛苦

這家境怎么破局?女子失業(yè)后回到一貧如洗的家,自責無助很痛苦

唐小糖說情感
2026-01-06 15:30:09
賈玲為張小斐慶生!本人沒復胖目測100斤,私下沒架子超級好相處

賈玲為張小斐慶生!本人沒復胖目測100斤,私下沒架子超級好相處

小咪侃娛圈
2026-01-11 09:28:45
35歲鄭爽近況曝光!相貌大變,臉部又僵又腫,住豪宅生活很安逸

35歲鄭爽近況曝光!相貌大變,臉部又僵又腫,住豪宅生活很安逸

代軍哥哥談娛樂
2026-01-09 10:29:05
突發(fā)!山東一地120調(diào)度員集中離職!4人已離職、2人提出辭職……

突發(fā)!山東一地120調(diào)度員集中離職!4人已離職、2人提出辭職……

醫(yī)脈圈
2026-01-11 12:16:08
在美國你買了房,房子是你的不假,房屋產(chǎn)權(quán)永久也不假

在美國你買了房,房子是你的不假,房屋產(chǎn)權(quán)永久也不假

忠于法紀
2026-01-10 19:43:35
2026-01-11 22:52:49
AI寒武紀 incentive-icons
AI寒武紀
專注于人工智能,科技領(lǐng)域
1027文章數(shù) 393關(guān)注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

4.5萬株草莓苗停止生長 果農(nóng)急求助1小時后獲專家回應(yīng)

頭條要聞

4.5萬株草莓苗停止生長 果農(nóng)急求助1小時后獲專家回應(yīng)

體育要聞

U23國足形勢:末輪不負泰國即確保晉級

娛樂要聞

留幾手為閆學晶叫屈?稱網(wǎng)友自卑敏感

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

游戲
房產(chǎn)
時尚
數(shù)碼
公開課

《堡壘之夜》聯(lián)動鬧誤會!老外竟不知VTuber老祖

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

當一個57歲的女人,決定從零開始

數(shù)碼要聞

科技有AI,連接全球:海信家電參展CES 2026,定義智慧生活新圖景

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版