国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

美團正式上線LongCat App,可體驗語音通話等新功能

0
分享至


11月3日消息,美團LongCat團隊今日宣布,LongCat-Flash 系列大模型再升級,正式發(fā)布全新家族成員——LongCat-Flash-Omni,并開源。

目前,新App已支持聯(lián)網(wǎng)搜索、語音通話等功能,視頻通話等功能會稍后上線;Web端則增加圖片、文件上傳和語音通話等功能。

iOS用戶可直接在APP Store中搜索“LongCat”獲取。

在此之前,LongCat僅通過官網(wǎng)(https://longcat.ai/)來為C端用戶提供大模型的相關(guān)能力。


網(wǎng)頁版

我們迅速下載該APP測試了一下,發(fā)現(xiàn)該模型最大的亮點,那就是“快”?。ㄌ煜挛涔?,唯快不破)

該模型總參數(shù)560B,激活參數(shù)僅27B,繼承了LongCat-Flash系列“快”的基因,使其在保持龐大知識容量的同時,實現(xiàn)了極高的推理效率。

我們發(fā)現(xiàn),從輸入指令到生成token的時間間隔非常短暫,整個過程相當絲滑,小編感覺比豆包通義及微信元寶的反應速度都更快一些。

據(jù)悉,在當前主流旗艦模型的性能標準和參數(shù)規(guī)模下,這是首個能夠?qū)崿F(xiàn)全模態(tài)實時交互的開源模型,它能同時處理文本、圖像、音頻、視頻,而且還能實時進行音視頻交互。

據(jù)官方介紹,LongCat-Flash-Omni以LongCat-Flash系列的高效架構(gòu)設計為基礎(chǔ)(Shortcut-Connected MoE,含零計算專家),集成了高效多模態(tài)感知模塊與語音重建模塊,在總參數(shù) 5600 億(激活參數(shù) 270 億)的龐大參數(shù)規(guī)模下,仍實現(xiàn)低延遲的實時音視頻交互能力,為開發(fā)者的多模態(tài)應用場景提供了更高效的技術(shù)選擇。

美團采用了 Shortcut-connected MoE 架構(gòu),配合零計算專家(zero-computation experts)設計,就像高速公路上的ETC通道,讓信息處理更高效,避免了“堵車”。


更重要的是,美團還提出了早期融合訓練范式(Early-Fusion Training),能確保模型在獲得多模態(tài)能力的同時,不會在單一模態(tài)上“偏科”。

并不是先語言訓練,然后再后加上視覺或音頻能力。這就像培養(yǎng)全能運動員,不能因為練游泳就忘了跑步,每天都要一起練,而不是先練兩年游泳,然后再去學跑步。

這樣的一體化架構(gòu),讓這只“龍貓”實現(xiàn)了完全端到端的設計:視覺與音頻編碼器作為多模態(tài)感知器,LLM 直接處理輸入并生成文本與語音 token,再通過輕量級音頻解碼器重建為自然語音波形。

此外,打開LongCat APP,從首頁可以看到,它目前支持文字/語音兩種輸入方式,并能進行語音通話(視頻通話功能正在跑步入場中),Web端還支持上傳圖片和文件。


APP端

在綜合性的全模態(tài)基準測試(如Omni-Bench, WorldSense)上,超越Qwen3-Omni、Gemini-2.5-Flash,這款模型直接達到了開源SOTA水準(開源最先進水平),而且能和閉源的Gemini-2.5-Pro相媲美。 即使單拉出來文本、圖像、音頻、視頻等各項模態(tài)能力,它也依舊能打(單項能力均位居開源模型前列),真正實現(xiàn)了“全模態(tài)不降智”。


文本:LongCat-Flash-Omni 延續(xù)了該系列卓越的文本基礎(chǔ)能力,且在多領(lǐng)域均呈現(xiàn)領(lǐng)先性能。相較于 LongCat-Flash 系列早期版本,該模型不僅未出現(xiàn)文本能力的衰減,反而在部分領(lǐng)域?qū)崿F(xiàn)了性能提升。這一結(jié)果不僅印證了該團隊訓練策略的有效性,更凸顯出全模態(tài)模型訓練中不同模態(tài)間的潛在協(xié)同價值。

圖像理解:LongCat-Flash-Omni 的性能(RealWorldQA 74.8分)與閉源全模態(tài)模型 Gemini-2.5-Pro 相當,且優(yōu)于開源模型 Qwen3-Omni;多圖像任務優(yōu)勢尤為顯著,核心得益于高質(zhì)量交織圖文、多圖像及視頻數(shù)據(jù)集上的訓練成果。

音頻能力:從自動語音識別(ASR)、文本到語音(TTS)、語音續(xù)寫維度進行評估,Instruct Model 層面表現(xiàn)突出:ASR 在 LibriSpeech、AISHELL-1 等數(shù)據(jù)集上優(yōu)于 Gemini-2.5-Pro;語音到文本翻譯(S2TT)在 CoVost2 表現(xiàn)強勁;音頻理解在 TUT2017、Nonspeech7k 等任務達當前最優(yōu);音頻到文本對話在 OpenAudioBench、VoiceBench 表現(xiàn)優(yōu)異,實時音視頻交互評分接近閉源模型,類人性指標優(yōu)于 GPT-4o,實現(xiàn)基礎(chǔ)能力到實用交互的高效轉(zhuǎn)化。

視頻理解:LongCat-Flash-Omni 視頻到文本任務性能達當前最優(yōu),短視頻理解大幅優(yōu)于現(xiàn)有參評模型,長視頻理解比肩 Gemini-2.5-Pro 與 Qwen3-VL,這得益于動態(tài)幀采樣、分層令牌聚合的視頻處理策略,及高效骨干網(wǎng)絡對長上下文的支持。

跨模態(tài)理解:性能優(yōu)于 Gemini-2.5-Flash(非思考模式),比肩 Gemini-2.5-Pro(非思考模式);尤其在真實世界音視頻理解WorldSense 基準測試上,相較其他開源全模態(tài)模型展現(xiàn)出顯著的性能優(yōu)勢,印證其高效的多模態(tài)融合能力,是當前綜合能力領(lǐng)先的開源全模態(tài)模型。

端到端交互:由于目前行業(yè)內(nèi)尚未有成熟的實時多模態(tài)交互評估體系,LongCat團隊構(gòu)建了一套專屬的端到端評測方案,該方案由定量用戶評分(250 名用戶評分)與定性專家分析(10 名專家,200 個對話樣本)組成。


定量結(jié)果顯示:圍繞端到端交互的自然度與流暢度,LongCat-Flash-Omni 在開源模型中展現(xiàn)出顯著優(yōu)勢 —— 其評分比當前最優(yōu)開源模型 Qwen3-Omni 高出 0.56 分;定性結(jié)果顯示:LongCat-Flash-Omni 在副語言理解、相關(guān)性與記憶能力三個維度與頂級模型持平,但是在實時性、類人性與準確性三個維度仍存在差距,也將在未來工作中進一步優(yōu)化。

美團這款新發(fā)布模型也引發(fā)了外國網(wǎng)友的熱議。其中有網(wǎng)友表示:“這家中國外賣公司可是大有來路,年營收高達數(shù)百億美元,員工人數(shù)也超過 Meta,是那種可以把前沿模型開發(fā)當成副業(yè)來搞的巨頭公司?!鄙踔咙c名扎克伯格:快來學著抄作業(yè)。



特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
媒體人:北京新外援小維克多-貝利已經(jīng)到隊,將身穿2號球衣

媒體人:北京新外援小維克多-貝利已經(jīng)到隊,將身穿2號球衣

懂球帝
2026-01-07 12:14:30
美司令曾警告:若大陸武力收臺,美軍將摧毀中方火箭軍和核武庫!

美司令曾警告:若大陸武力收臺,美軍將摧毀中方火箭軍和核武庫!

壹知眠羊
2025-12-21 07:15:19
老馬?。夯鸺龖灰踪Z巴里和謝潑德,并用換回的選秀權(quán)換特雷-楊

老馬?。夯鸺龖灰踪Z巴里和謝潑德,并用換回的選秀權(quán)換特雷-楊

懂球帝
2026-01-07 12:14:29
詹姆斯打出賽季最佳一戰(zhàn),看看賽后媒體人怎么說,前隊友點出關(guān)鍵

詹姆斯打出賽季最佳一戰(zhàn),看看賽后媒體人怎么說,前隊友點出關(guān)鍵

行舟問茶
2026-01-07 14:05:37
呼吁美軍抓普京,澤連斯基話音剛落就失聯(lián)了?后方基地被炸成火海

呼吁美軍抓普京,澤連斯基話音剛落就失聯(lián)了?后方基地被炸成火海

鐵錘簡科
2026-01-07 13:34:51
三士兵殺害多名戰(zhàn)友后叛逃金門馬祖,中央嚴令空軍:堅決截殺!

三士兵殺害多名戰(zhàn)友后叛逃金門馬祖,中央嚴令空軍:堅決截殺!

阿胡
2024-03-06 13:44:40
全世界要小心了

全世界要小心了

牛彈琴
2026-01-07 07:58:04
北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

北京連下六道指令,陜西硬抗整整四年,最高指示:讓749局來

小哥很OK
2025-12-12 14:33:01
飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時間吃藥才最好

飯后吃藥,等于白吃?醫(yī)生多次提醒:一天中這些時間吃藥才最好

路醫(yī)生健康科普
2025-12-16 12:45:03
閆學晶奢侈風波升級!官媒出手銳評,韓紅因一特殊舉動口碑暴增

閆學晶奢侈風波升級!官媒出手銳評,韓紅因一特殊舉動口碑暴增

何蕥室內(nèi)設計
2026-01-06 10:15:08
特朗普進一步施壓,要逼委內(nèi)瑞拉做出一個艱難選擇?中方有言在先

特朗普進一步施壓,要逼委內(nèi)瑞拉做出一個艱難選擇?中方有言在先

劍道萬古似長夜
2026-01-07 14:04:15
黃油歐美賣爆,頓頓都離不開,為啥中國人卻不愛,超市也很少賣?

黃油歐美賣爆,頓頓都離不開,為啥中國人卻不愛,超市也很少賣?

攬星河的筆記
2025-12-08 13:30:38
醫(yī)學的盡頭真是玄學嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

醫(yī)學的盡頭真是玄學嗎?網(wǎng)友:國家不讓你迷信,沒說讓你不信

帶你感受人間冷暖
2025-12-31 00:20:05
曝阿莫林突然掀桌原因,曼聯(lián)巨頭一要求引爆矛盾!拉爵也干預戰(zhàn)術(shù)

曝阿莫林突然掀桌原因,曼聯(lián)巨頭一要求引爆矛盾!拉爵也干預戰(zhàn)術(shù)

羅米的曼聯(lián)博客
2026-01-07 09:18:32
1992年,鄧公指著陪同的老總問:你是葉老二?對方擺擺手:我是老四

1992年,鄧公指著陪同的老總問:你是葉老二?對方擺擺手:我是老四

清風鑒史
2026-01-05 20:51:20
樓市可能要下猛藥了

樓市可能要下猛藥了

格隆匯樓市V
2026-01-04 19:48:13
浙江兩海島掛牌出讓使用權(quán),底價3.8萬元?官方回應:不向公眾開放,僅解決歷史遺留問題

浙江兩海島掛牌出讓使用權(quán),底價3.8萬元?官方回應:不向公眾開放,僅解決歷史遺留問題

封面新聞
2026-01-06 20:13:06
3個生肖擋不住好運!1月天降財源,正偏財齊發(fā),富到讓人眼紅

3個生肖擋不住好運!1月天降財源,正偏財齊發(fā),富到讓人眼紅

毅談生肖
2026-01-07 12:54:11
巴媒:巴西攻擊手阿爾貝托即將與一家中國俱樂部達成協(xié)議

巴媒:巴西攻擊手阿爾貝托即將與一家中國俱樂部達成協(xié)議

懂球帝
2026-01-06 19:05:13
48歲保潔阿姨睡在公司1個月,老板打開了監(jiān)控,第2天送給她20萬

48歲保潔阿姨睡在公司1個月,老板打開了監(jiān)控,第2天送給她20萬

秀秀情感課堂
2025-12-12 14:20:05
2026-01-07 15:35:00
科工力量 incentive-icons
科工力量
觀察者網(wǎng)工業(yè)科技專欄
184文章數(shù) 533關(guān)注度
往期回顧 全部

科技要聞

豪擲世界第一"球" 楊元慶亮出聯(lián)想AI護城河

頭條要聞

古巴公布32名陣亡軍人姓名和照片 年齡介于26歲至67歲

頭條要聞

古巴公布32名陣亡軍人姓名和照片 年齡介于26歲至67歲

體育要聞

賣水果、搬磚的小伙,與哈蘭德爭英超金靴

娛樂要聞

2026年央視春晚彩排:沈騰確定回歸

財經(jīng)要聞

農(nóng)大教授科普:無需過度擔憂蔬菜農(nóng)殘

汽車要聞

蔚來2025百萬臺收官 一場遲到的自我修復

態(tài)度原創(chuàng)

教育
健康
藝術(shù)
旅游
家居

教育要聞

初二這一年,差不多就能看出孩子將來上什么大學了

這些新療法,讓化療不再那么痛苦

藝術(shù)要聞

David Grossmann:不一樣的風景畫

旅游要聞

屬馬、姓馬、名字帶馬的朋友朋友有福了 多地景區(qū)花式免門票

家居要聞

寧靜不單調(diào) 恰到好處的美

無障礙瀏覽 進入關(guān)懷版