国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

美團悄悄開源重度推理模型!8個腦子并行思考,有點東西。

0
分享至

大家好,我是袋鼠帝。

2026年剛開年,AI圈子終于開始稍微安靜一點了,不過各家似乎都在憋大招。

前兩天我刷X的時候,發(fā)現(xiàn)美團居然悄悄咪咪又開源了一個新模型:LongCat-Flash-Thinking-2601。


不得不說,美團這個更新節(jié)奏是真滴卷。

我回憶了下,從去年9月發(fā)布Chat版本,到后來的Thinking版本,再到Omni全能版,他們的模型路走得非常穩(wěn)。

這次的2601版本,更是全面提升了Agent和Thinking能力

不過真正吸引我去深入研究的,其實是 X 上的一條評論:它居然有8位思考者并行推理。


這一下子就勾起了我的好奇心,我們之前用的深度推理模式,大多是單線程的,就像一個人在走路,哪怕走得再快,也就是那一條路。

美團這個設計,像是直接開了一個AI專家團。

趁著上周末去北京參加AIGC開發(fā)者大會的間隙,我把這個新模型好好研究了一下。

這一試,我發(fā)現(xiàn)它還真有點東西。

先給大家總結一下這次新模型更新的核心亮點(省流版):

1.泛化能力極強,在那種混亂的真實環(huán)境里表現(xiàn)很穩(wěn),在復雜隨機任務中甚至優(yōu)于Claude。

2.自動構建多個高質量環(huán)境;密集依賴關系圖

3.多環(huán)境強化學習:擴展的DORA(我們的強化學習基礎設施),支持大規(guī)模多環(huán)境智能體訓練

4.核心創(chuàng)新叫Heavy Thinking Mode,也就是深度思考模式:

平行思維:通過多個獨立的推理路徑擴展思維廣度

迭代式摘要:通過使用摘要模型來綜合輸出,增強深度,支持迭代推理循環(huán)。

在這個模式下,模型會啟動并行思考,相當于你有多個不同領域的大腦在同時幫你琢磨同一件事。

另外,據(jù)說1M(100萬)token的上下文版本也快來了。


光看參數(shù)也沒意思,咱們直接上實測。

目前,深度推理模式可在LongCat AI平臺免費體驗

https://longcat.chat/

讓美團AI團隊解決問題

以后遇到問題不用焦慮了,可以試試美團這個AI團隊,團隊8人,效率極高,還有第9人是個小領導,總結發(fā)言,是個全方位思考的智囊團。



團建聚餐,專治眾口難調

來個美團的拿手好戲,點餐

不過有點刁鉆:

prompt:我們在深圳,有8個同事要聚餐,預算只有300元。小張不吃辣,小李對麩質過敏,小王必須喝冰美式,老板想吃地道的本地菜,剩下的4個人里有人在減肥,有人想吃重口味。請尋找最優(yōu)性價比方案,并給出具體的點單組合和湊單攻略。

這要是讓人來想,估計頭發(fā)都得掉一把。

當時打開深度思考后,嚇我一跳,原來這就是重度思考嗎

屏幕上直接冒出來8條并行的思維鏈!直接多出來8個腦子


有一種從單行道突然變成8車道的開闊感

來看看 LongCat 的 8 位 Thinker 是怎么應對的。


它們分別給出了不同的策略:有的建議分開點外賣,有的推薦了性價比極高的潮汕套餐,還有的另辟蹊徑建議去吃早茶。

這8個大腦并行工作完之后,還會有一個裁判角色的模型出來做總結,把各個方向的精華提煉出來,形成最終的答案。

俗話說三個臭皮匠頂個諸葛亮,美團這是直接給我安排了三個諸葛亮啊。

最后的綜合方案很不錯,模型經(jīng)過權衡后發(fā)現(xiàn),在深圳 300 塊錢滿足這么多人的堂食需求幾乎是不可能的,所以最優(yōu)解是點外賣,并且給出了具體的分店鋪湊滿減攻略。


最讓我驚訝的是細節(jié):它甚至提醒我,醬油里可能含有麩質,一定要給商家備注小李的過敏情況。

這種細致程度,單靠一條思維鏈是很容易遺漏的。這也體現(xiàn)了并行思考的優(yōu)勢:既有廣度,又有深度。

而且速度依然很快,這也是我一直比較喜歡美團模型的一點,干活講究效率


假如明天AGI到來?

前端時間,馬斯克的訪談提到,AGI可能很快就會實現(xiàn)

所以我又問了一個稍微宏大一點的問題:假如明天AGI突然到來,世界會變成什么樣?

這回的思維鏈就像是一場高質量的圓桌論壇,類似上周六我參與分享的圓桌會議

有的Thinker在分析對就業(yè)市場的沖擊,有的在預測經(jīng)濟結構的重組,還有的在探討人類認知的顛覆。


看著這 8 個大腦在屏幕上互搏,非常有意思。

它們各有各的觀點,但最后又能達成某種共識。這和我們人類社會其實很像,真理往往就是在不斷的辯論和碰撞中產(chǎn)生的。



法律智囊團:隨身攜帶的律師天團

這個場景非常實用,假設我不小心在商場碰碎了一個標價8.8萬的藝術品,商場態(tài)度強硬要我全額賠償,那不是完犢子了?

我把情況描述給LongCat,讓它做我的辯護律師。

prompt:我在商場行走時,背包不慎剮蹭到了擺放在轉角處的一個藝術品展架,導致一件標價 8.8 萬元的藝術瓷器摔碎。商場方目前態(tài)度強硬,拒絕任何調解,要求我按照標價全額賠償。作為被告,我的抗辯點在于:展架位于人流量大的轉角處,且沒有任何物理防護(如玻璃罩);展架底座極輕,明顯不符合擺放易碎重物的安全標準;我只是正常行走,并無跑跳等過激行為。請你作為我的專業(yè)辯護律師。

反應速度非???,幾個 Thinker 迅速從不同角度切入。

有的負責分析商場的過錯,有的提到一些案例參考,還有的側重風險評估和緊急措施。


它給出的一些答案,我怕是幻覺,還特地去核實了以下思維鏈中提到民法典1198條、1165條、1173條,也是正確的。


有點可惜的是重度思考暫時還沒接入聯(lián)網(wǎng)搜索,所以這塊大家還是要謹慎,出的條款最好都去印證一下,畢竟思考模型普遍都會有幻覺,有出錯的概率。把它當做輔助律師團即可。

最終回答:


不過對于我們普通人來說,遇到這種突發(fā)狀況,能有這么一個智囊團,可以第一時間快速了解一些信息,心里真的會踏實很多。


中西結合的身心健康指導

有一些朋友和我聊起最近莫名不太好入睡,想起來下個月就過年了,

是丙午馬年,丙火和午火雙火疊加,六十年一遇,

部分朋友可能會有水火交戰(zhàn)的情況,明明沒有什么心煩的事情,卻睡不著,趕緊來試試Longcat怎么說。

還有,我從小到大基本上午覺就沒睡著過,可能是過度焦慮的原因?

很好玩的是,居然得到了中西結合的回答,還是那句話,集百家之所長,取其精華,去其糟粕,很好用。

如果是其他大模型,被我引導提問,就只會從中醫(yī)的角度回答了。

下面豆包的回答,被我提問之后,只會從中醫(yī)角度回答問題:


但 LongCat的 8 個Thinker 里,有的Thinker提供中醫(yī)視角,有的提供現(xiàn)代醫(yī)學視角,有的提供改善睡眠建議,真的是面面俱到,中西結合,完美!


以下是正文回答,有需要的朋友可以參考一下,也可以點贊轉發(fā),說不定你就有朋友也遇到了。



風格化寫作,絕了

我讓它用最強烈的文學風格描寫一碗螺螄粉,并且讓它自己選擇流派。

prompt:我現(xiàn)在手里端著一碗熱騰騰的、聞起來臭吃起來香的螺螄粉。 我希望看到風格極度強烈的文學描寫。請選擇一個你認為最有趣的文學流派(例如:魯迅的冷峻諷刺、古龍的簡潔蕭殺、王家衛(wèi)的曖昧破碎、張愛玲的華麗蒼涼等等)。

8 位大作家開始吭哧吭哧寫作。最后的評判環(huán)節(jié)非常有意思。有 5 位 Thinker 選擇了張愛玲風格,2 位選了古龍,1 位選了王家衛(wèi)。


按理說,少數(shù)服從多數(shù),最后應該是張愛玲風格勝出。因為已經(jīng)有5位部下都選了張愛玲風格,

畢竟作為領導,最輕松最不用擔責的決策才是最經(jīng)濟的。

但那個負責總結的裁判模型展現(xiàn)出了驚人的批判性思維,它認為古龍那種簡潔蕭殺的風格,反而更能突出一碗螺螄粉的江湖氣,而且能避免答案的同質化。

最終輸出的古龍風描寫,文筆真的是一絕。


這也讓我突然意識到,這種多模型并行思考加裁判決策的機制,可能真的代表了未來AI決策的一種新方向。


代碼能力

Prompt:幫我設計一個貓貓狗狗掛飾網(wǎng)站的前端,要可愛風,寫在一個HTML文件里

迅速完成了代碼,購物車邏輯、結算功能都寫了,交互體驗也很流暢。

后來我又試著讓它寫一個大魚吃小魚的游戲。

它通過聯(lián)網(wǎng)搜索參考了最佳實踐,還自動給游戲里的魚加上了 AI 判定,大魚會追,小魚會跑,可玩性瞬間提升了一個檔次。

為什么美團這個模型值得關注?

美團這次的 Heavy Thinking Mode,本質上是在解決大模型思考深度不足的問題。

以前我們覺得大模型像個百科全書,問啥知道啥,但一遇到需要推理、規(guī)劃的復雜問題就容易掉鏈子。

LongCat的思路是:既然一個腦子不夠用,那就用八個。

通過并行推理(Parallel Thinking),先讓思維發(fā)散出去,覆蓋盡可能多的可能性;再通過迭代摘要(Iterative Summarization),把這些發(fā)散的思維收斂回來,提煉出最優(yōu)解。

這就像我們在公司開會解決難題,先大家頭腦風暴,各抒己見,這是廣度。然后項目經(jīng)理把大家的想法匯總、去重、優(yōu)化,形成方案,這是深度。

而且美團在訓練這個模型的時候,用了大量的合成環(huán)境和抗噪聲訓練,這意味著什么?

意味著這個模型不是溫室里的花朵,它是真的被扔到那種充滿了不確定性、信息不完整的真實環(huán)境里去摸爬滾打過的。

所以它在面對我們現(xiàn)實生活中那些亂七八糟的任務時,適應性會特別強。

美團雖然在這一波大模型浪潮里起步不算最早的,但他們追趕的速度真的讓人驚訝。

上周末我們幾個博主聊天還在感慨,像 Meta、微軟這些巨頭,有錢有卡,但在大模型上也逐漸沒啥聲音了。

這也側面反映,做大模型這事兒,門檻真的很高,不是誰都能一直在牌桌上的。

美團能堅持下來,并且不斷有這種高質量的產(chǎn)出,說明他們對 AI 是有自己獨立的思考和戰(zhàn)略定力的。

如果你也對AI Agent感興趣,或者在開發(fā)相關的應用,可以去試試這個LongCat-Flash-Thinking-2601。

可能會給你帶來一些意想不到的驚喜。

點擊關注下方賬號,你將感受到一個朋克的靈魂,且每篇文章都有驚喜。

能看到這里的都是鳳毛麟角的存在!

如果覺得不錯,隨手點個贊、在看、轉發(fā)三連吧~

如果想第一時間收到推送,也可以給我個星標?

謝謝你耐心看完我的文章~

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
伊朗一座可容納12000人的體育館被摧毀,曾舉辦世界排球聯(lián)賽

伊朗一座可容納12000人的體育館被摧毀,曾舉辦世界排球聯(lián)賽

懂球帝
2026-03-07 12:16:18
跟腱斷裂后的復出首戰(zhàn):為什么塔圖姆只用298天,而克萊等了941天

跟腱斷裂后的復出首戰(zhàn):為什么塔圖姆只用298天,而克萊等了941天

扣籃達人
2026-03-07 18:26:11
山東高中生被老師談話,15分鐘后離奇死亡,尸檢結果讓家人崩潰

山東高中生被老師談話,15分鐘后離奇死亡,尸檢結果讓家人崩潰

碎碎紀實
2026-03-06 18:59:33
3-1!12.9億豪門逆轉晉級8強 冤家路窄:7.1億新貴53天內慘遭四殺

3-1!12.9億豪門逆轉晉級8強 冤家路窄:7.1億新貴53天內慘遭四殺

狍子歪解體壇
2026-03-08 05:53:52
出兵朝鮮的前夜,政治局吵成一團,毛主席:你們都太小題大做

出兵朝鮮的前夜,政治局吵成一團,毛主席:你們都太小題大做

風飄飄而吹衣
2025-01-02 13:17:20
1606場之后,勒布朗的下一站,沒人說得清

1606場之后,勒布朗的下一站,沒人說得清

劉寶杰聊球
2026-03-08 10:46:19
219票反對212票贊成!美航母被炸,以總理或下臺?特朗普轉變態(tài)度

219票反對212票贊成!美航母被炸,以總理或下臺?特朗普轉變態(tài)度

深析古今
2026-03-07 15:29:44
一夜之間,伊朗的導彈長了眼睛,俄羅斯這步棋,下得太狠

一夜之間,伊朗的導彈長了眼睛,俄羅斯這步棋,下得太狠

華史談
2026-03-06 12:26:19
清朝滅亡時,仍欠列強7億多兩白銀,這筆爛賬最終是如何解決的?

清朝滅亡時,仍欠列強7億多兩白銀,這筆爛賬最終是如何解決的?

談古論今歷史有道
2026-03-07 12:40:03
沒來過大陸就敢罵幾十年?本想找黑料,結果成了大型“真香”現(xiàn)場

沒來過大陸就敢罵幾十年?本想找黑料,結果成了大型“真香”現(xiàn)場

番外行
2026-02-28 18:34:07
中央定調!15年最低繳費成歷史,2030年15年繳費還能正常退休嗎?

中央定調!15年最低繳費成歷史,2030年15年繳費還能正常退休嗎?

另子維愛讀史
2026-03-03 21:58:41
樊振東3天后火速回歸?王勵勤少見回應,國乒最強三巨頭新格局

樊振東3天后火速回歸?王勵勤少見回應,國乒最強三巨頭新格局

卿子書
2026-03-07 10:40:04
臺州街頭已大量出現(xiàn),有車的人尤其注意!

臺州街頭已大量出現(xiàn),有車的人尤其注意!

環(huán)球網(wǎng)資訊
2026-03-08 07:44:42
真敢提建議!全國人大代表卓長立呼吁:鼓勵大學生加入家政行業(yè)

真敢提建議!全國人大代表卓長立呼吁:鼓勵大學生加入家政行業(yè)

我心縱橫天地間
2026-03-05 16:39:56
新疆真是五十步一個迪麗熱巴,這美貌不爆紅沒天理

新疆真是五十步一個迪麗熱巴,這美貌不爆紅沒天理

飛娛日記
2026-03-07 08:08:03
美國在伊拉克打了7年,消耗了3萬億美元,從伊拉克獲得了什么?

美國在伊拉克打了7年,消耗了3萬億美元,從伊拉克獲得了什么?

流云隨風去遠方
2026-03-05 05:41:30
懸念不大了!NBA西部季后賽球隊,大概率這8支,勇士基本出局

懸念不大了!NBA西部季后賽球隊,大概率這8支,勇士基本出局

籃球掃地僧
2026-03-07 15:18:27
隨著海港1-2輸河南,海牛1-3,中超最新積分:榜首領先墊底隊12分

隨著海港1-2輸河南,海牛1-3,中超最新積分:榜首領先墊底隊12分

小火箭愛體育
2026-03-07 21:38:06
一乞丐進清華被門衛(wèi)攔下,校長見后卻淚流滿面,到底有何特殊身份

一乞丐進清華被門衛(wèi)攔下,校長見后卻淚流滿面,到底有何特殊身份

春秋硯
2026-03-02 09:20:09
410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

410次開房記錄流出:央企“女老虎”陶荔芳,背后還有多少同伙

深度報
2025-12-14 22:36:54
2026-03-08 11:04:49
袋鼠帝 incentive-icons
袋鼠帝
持續(xù)分享AI實踐干貨,走超級個體崛起之路
55文章數(shù) 65關注度
往期回顧 全部

科技要聞

OpenClaw最大的推手是閑魚和小紅書

頭條要聞

媒體:伊朗問題要注意普京的動向 其在向美以喊話

頭條要聞

媒體:伊朗問題要注意普京的動向 其在向美以喊話

體育要聞

塔圖姆298天走完這段路 只用27分鐘征服這座城

娛樂要聞

周迅新戀情曝光,李亞鵬等人已成過去

財經(jīng)要聞

油價要失控?

汽車要聞

華為乾崑全新激光雷達落地 鴻蒙智行同步技術升級

態(tài)度原創(chuàng)

藝術
教育
時尚
房產(chǎn)
手機

藝術要聞

他是二王書法的化身?米芾的秘密揭曉!

教育要聞

成長路上的心靈迷霧:青春期女生常見心理

2026春夏一定要擁有的6只包,好看又百搭

房產(chǎn)要聞

傳統(tǒng)學區(qū)房熄火?2月海口二手房爆火的板塊竟然是…

手機要聞

麒麟9030產(chǎn)能火力全開!華為Mate 80系列銷量激增:已突破400萬臺

無障礙瀏覽 進入關懷版