国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

2025年10月中國AI大模型平臺排行榜

0
分享至



作者|參商 西梅汁

編輯|星奈

媒體|AI大模型工場



國內(nèi)大模型發(fā)展趨勢|10月份解讀

To C 端成必爭之地

百度和阿里不約而同地將AI眼鏡作為雙十一切入消費市場的重要產(chǎn)品。

百度在10月下旬宣布,其首款消費級AI眼鏡將于11月1日開啟預售。這款眼鏡深度整合了百度自研的文心一言4.0視覺增強模型,使其能實現(xiàn)實時物體識別、AR導航和多模態(tài)信息交互。這意味著AI從后臺走向前臺,成為用戶日常生活中的實時智能助手,例如在博物館參觀時能自動講解展品。

而這邊,阿里的夸克AI眼鏡則在10月24日率先開啟預售。此次的亮點則結(jié)合了阿里生態(tài)的應用,例如支持通過支付寶的“看一看”功能進行生物識別支付,這為智能支付提供了新的交互想象。同時,與高德地圖結(jié)合的近眼導航、淘寶的商品識價等功能,都體現(xiàn)了其致力于將AI能力融入具體生活場景的思路。

與百度、阿里聚焦于開拓AI眼鏡這一新形態(tài)不同,科大訊飛在10月底的全球1024開發(fā)者節(jié)上,則進一步強化了其在AI軟硬一體化方面的路徑。

科大訊飛發(fā)布了星火AIPC,強調(diào)其并非簡單疊加AI芯片,而是大模型能力與本地算力的深度融合,以支持更復雜的端側(cè)實時交互。同時,訊飛也展示了其在智能辦公本、翻譯耳機等成熟硬件產(chǎn)品線上的技術迭代,重點提升了在嘈雜環(huán)境下的降噪和語音識別能力。這種基于自身技術長板,將AI能力持續(xù)注入特定辦公、學習、翻譯場景的策略,是科大訊飛布局To C市場的鮮明特點。

巨頭們集體行動清晰地表明,AI大模型+硬件終端的模式已被視為下一代個人計算平臺的重要方向。消費級AI硬件也在試圖擺脫過去“功能單一、實用性不足”的標簽,向集成了感知、理解和決策能力的個人AI助理上全面升級。

大模型戰(zhàn)場換帥謀局,

大廠組織架構(gòu)調(diào)整,押注 AGI長期主義

大模型戰(zhàn)場換帥,押注長遠。 十月,大廠通過人事調(diào)整聚焦AGI目標,創(chuàng)業(yè)公司加速商業(yè)化落地,以及資本市場對AI賽道持續(xù)看好但更加理性。

一個標志性事件是字節(jié)跳動Seed團隊的人事調(diào)整,原負責人朱文佳的匯報對象,從CEO梁汝波轉(zhuǎn)變?yōu)閺墓雀鐳eepMind引進的研發(fā)負責人吳永輝。這一變動意味著吳永輝在組織架構(gòu)上已成為字節(jié)大模型團隊的"一號位"。這背后,反映出字節(jié)對突破"智能上限"的迫切追求,團隊方向進一步向基礎研究集中。同時,全球電商巨頭亞馬遜也正式宣布裁減約1.4萬名公司職員,以精簡運營并加速人工智能部署。

與大廠強化基礎研究相呼應,頭部創(chuàng)業(yè)公司也在十月份明顯加快了商業(yè)化落地的步伐。李開復領導的零一萬物在10月宣布了新一輪高管任命,核心戰(zhàn)略是推動"一把手工程"。這意味著零一萬物將其ToB業(yè)務全面升級。為此,他們還任命了擁有深厚政企背景的沈鵬飛為聯(lián)合創(chuàng)始人,統(tǒng)籌國內(nèi)ToB與ToG業(yè)務,并提拔了兩位技術和管理骨干為副總裁,組建起覆蓋市場、技術與國際業(yè)務的完整管理閉環(huán)。

不難看出,在激烈的AI競賽中,大廠正通過優(yōu)化內(nèi)部結(jié)構(gòu)和人才策略,為AGI的長期競爭夯實基礎。

融資方面,資本向應用清晰的領域集中。曾憑借長文本能力引發(fā)關注的月之暗面,在10月被曝將完成新一輪數(shù)億美元的融資。而專注于AI視頻生成領域的愛詩科技,則更早地宣布完成了1億元人民幣的B+輪融資。其旗下的PixVerse等產(chǎn)品服務于C端大眾與專業(yè)創(chuàng)作者,用戶規(guī)模已突破一億,并在商業(yè)化上取得了年度經(jīng)常性收入超過4000萬美元的進展。

總體來看,國內(nèi)大模型領域的發(fā)展已經(jīng)進入了一個更加務實和深入的新階段。無論是大廠調(diào)整架構(gòu)押注未來,還是創(chuàng)業(yè)公司全力沖刺商業(yè)化,競爭的焦點正從"比拼模型參數(shù)"轉(zhuǎn)向"比拼場景落地與生態(tài)構(gòu)建"。

告別Sora2獨占,國內(nèi)AI視頻生成紛紛破局

OpenAI在9月底發(fā)布Sora2,這款被稱作"AI版抖音"的視頻生成模型僅兩天內(nèi)便斬獲16.4萬次下載,登頂美國App Store總榜第三時,全球AI視頻賽道再次被點燃。而國內(nèi)賽場并未出現(xiàn)單一的追隨者,反而迎來了一場以“破局”為主題的集體進擊。

長視頻生成能力成為這一輪技術競賽的核心戰(zhàn)場。與Sora2專注于25秒視頻生成不同,國內(nèi)廠商更注重解決實際應用場景中的時長需求。

美團LongCat-Video采用Diffusion Transformer + 3D RoPE的創(chuàng)新架構(gòu)設計,配合漸進式預訓練和強化學習策略,在保證視頻質(zhì)量的同時大幅提升了生成效率。 而像生數(shù)科技這樣的創(chuàng)新企業(yè),則通過「參考生」功能的全球上線,將AI視頻生成從單純的文本驅(qū)動拓展到多模態(tài)融合的新階段。

與此同時,AI視頻能力正加速融入現(xiàn)有生態(tài)。百度在搜索升級中,將文心助手的視頻生成功能無縫嵌入,用戶通過自然語言就能直接創(chuàng)作。這展現(xiàn)了巨頭將AI作為基礎設施賦能核心業(yè)務的戰(zhàn)略,推動技術從獨立工具變?yōu)槠栈莘铡?/p>

國內(nèi)AI視頻生成已走出單純對標國際模型的階段,正通過聚焦長視頻、優(yōu)化落地效率及深度融合應用,構(gòu)建差異化的競爭力。同時在Sora2依然保持封閉時,國內(nèi)廠商也在通過開源構(gòu)建生態(tài),或許正是實現(xiàn)彎道超車的關鍵策略。

國內(nèi)主要大模型進展

字節(jié)跳動

10月28日,字節(jié)跳動Seed團隊(大模型與基礎研究)匯報線調(diào)整,朱文佳改向吳永輝匯報,吳永輝成為團隊絕對一號位。組織進一步聚焦“探索智能上限”,取消部分員工季度OKR,加大AGI研究投入,推動Top Seed人才計劃。

10月23日,字節(jié)跳動Seed團隊推出3D生成大模型——Seed3D 1.0,實現(xiàn)從單張圖像到高質(zhì)量仿真級3D模型的端到端生成。Seed3D 1.0 基于創(chuàng)新的Diffusion Transformer架構(gòu),通過大規(guī)模數(shù)據(jù)訓練完成,可生成包括精細幾何、真實紋理和基于物理渲染(PBR)材質(zhì)的完整3D模型。

10月21日,豆包海外版Cici在墨西哥、英國、印尼、馬來西亞、菲律賓等國Google Play/Apple Store免費榜登頂,10月墨西哥連續(xù)多日霸榜。Cici主打“免費”“能解數(shù)學題”,產(chǎn)品功能較國內(nèi)豆包有所簡化,未開放音樂、視頻生成與內(nèi)容分享,核心技術調(diào)用OpenAI GPT與Google Gemini。

百度

最近,根據(jù)LMArena 的最新排名顯示,百度文心最新模型 ERNIE-5.0-Preview-1022(文心 5.0 Preview)在文本榜單上一舉躍居全球并列第二、國內(nèi)第一。

該模型取得了 1432 的高分,其與 OpenAI 的 gpt-4.5-preview-2025-02-27 以及 Anthropic 的 claude-opus-4-1-0805、claude-sonnet-4-5-20250929 三大國外頂級模型持平。

10月18日,百度健康在2025致敬醫(yī)者盛典上發(fā)布百度健康AI管家。這款產(chǎn)品首創(chuàng) “AI+真人”雙保障模式,在模型訓練階段加入真人醫(yī)生海量標注,AI生成健康建議后還會自主推送真人醫(yī)生進行二次實時核驗。

10月16日,百度搜索旗下AI短劇生成平臺宣布啟動公測。百度方面稱,百度搜索AI短劇生成平臺具備自動生成、人機協(xié)作等不同模式,可輔助創(chuàng)作者完成80%以上的內(nèi)容創(chuàng)作。創(chuàng)作者在AI創(chuàng)作的基礎上進行微調(diào)和優(yōu)化,并生成短劇作品。百度稱將通過億元創(chuàng)作基金、百億流量扶持、長期IP變現(xiàn)等方式給創(chuàng)作者提供支持。

10月15日,百度搜索宣布全面升級文心助手AIGC創(chuàng)作能力,支持AI圖片、AI視頻、AI音樂、AI播客等8種模態(tài)創(chuàng)作,且能夠一鍵調(diào)用多工具解決多場景問題。截至目前,百度搜索用戶日均生成AIGC內(nèi)容已破千萬。此外,百度搜索還發(fā)布行業(yè)首個開放式實時互動的數(shù)字人智能體。

阿里

10月30日,阿里媽媽“萬相臺AI無界”智能體助力雙11,百萬商品成交增長超30%,20萬商品成交翻5倍,推動電商經(jīng)營從“經(jīng)驗決策”邁向“智能經(jīng)營”。

作為阿里旗下的數(shù)智經(jīng)營平臺,阿里媽媽在今年3月宣布實現(xiàn)AI全鏈路經(jīng)營能力升級后,其技術成果在本屆雙11迎來全面大練兵。

10月24日,阿里巴巴旗下夸克正在推進一項名為“C計劃”的重磅AI業(yè)務,旨在布局對話式AI應用,并可能與字節(jié)跳動的“豆包”展開競爭。該計劃由夸克核心團隊主導,并有多位通義實驗室高級成員參與,顯示出阿里在AI應用領域的長期投入和決心。

10月23日,夸克AI眼鏡開啟預售,阿里巴巴宣布,夸克AI眼鏡S1將于10月24日零點在天貓、京東、抖音等平臺開啟預售,定價4699元,支持免提通話、實時翻譯、會議轉(zhuǎn)錄等功能,12月交付。

同時,夸克AI眼鏡S1預售首日11小時登頂天貓智能眼鏡品類銷冠,銷售額碾壓競品三日總和,成為AI硬件爆款。

10月16日,阿里全新AI編程工具Qoder CLI(命令行界面)正式上線。該工具具備代碼生成與理解能力,并大幅降低內(nèi)存消耗和命令響應時間,進一步提升開發(fā)效率。即日起,全球開發(fā)者可通過任意命令行終端使用Qoder CLI體驗代碼生成、調(diào)試和部署等任務。

Qoder CLI在全球頂尖的編程模型基礎之上進行了大量的工程設計,全面提升Agent能力:基于輕量級的Agent框架,可高效運行在普通筆記本電腦和云端沙箱實例,滿足不同場景的開發(fā)需求。測試顯示,Qoder CLI在空閑狀態(tài)下消耗的內(nèi)存比同類工具低70%。

10月15日,天貓雙11預售開啟,成為首個“AI全面落地”的雙11。淘寶天貓推出6款AI導購應用(如“AI萬能搜”“AI幫我挑”“AI試衣”等),賦能商家與消費者,提升購物體驗與運營效率。平臺算力提升40倍,用戶行為序列感知從半年提升至10年,購買效率提升25%。

阿里十月動態(tài),涵蓋電商、B2B、智能硬件、醫(yī)療健康、銀發(fā)經(jīng)濟等多維度。無論是AI全面賦能雙11,還是夸克AI眼鏡等硬件新品發(fā)布,均體現(xiàn)阿里AI技術向產(chǎn)業(yè)、消費、生態(tài)全鏈路深度滲透的趨勢。

騰訊

10月31日,IDC《中國游戲云市場跟蹤研究,2025H1》報告顯示,騰訊云在游戲云用量規(guī)模維度持續(xù)穩(wěn)居第一,并在整體收入維度增速領跑第一陣營。騰訊云依托混元大模型和AI實踐經(jīng)驗,構(gòu)建覆蓋游戲創(chuàng)意構(gòu)思、美術創(chuàng)作、研發(fā)測試、發(fā)行上線、運營增長的全流程技術支撐體系,AI成為游戲開發(fā)新引擎。

10月29日,騰訊混元宣布推出國內(nèi)首個交互式AI播客,用戶可在收聽時隨時打斷主持人和嘉賓發(fā)言,通過語音或打字提問?;诖竽P鸵鈭D識別、長上下文理解、多輪對話和外部聯(lián)網(wǎng)檢索能力,播客可結(jié)合上下文給出準確答案。支持自定義播客風格、主持人數(shù)、音色,適用于財研報解讀、新聞速遞、知識教育等場景。微信公眾號、騰訊新聞、ima、騰訊文檔PDF已接入該能力。

10月23日,騰訊ima open day在北京舉行,發(fā)布ima 2.0版本,并于24日啟動內(nèi)測。新版引入“任務模式”,支持報告、播客等內(nèi)容生成,用戶可通過自然語言提問,結(jié)合知識庫、文檔、圖片、音頻等附件,由大模型自主拆解、規(guī)劃任務步驟并調(diào)用工具完成。

知識庫新增“AI要點”功能,可自動生成結(jié)構(gòu)化摘要,支持多任務并行與協(xié)作共享。ima已深入科技、金融、教育、醫(yī)療、法律、政務等20+行業(yè),知識庫文件總量達2億。

10月22日,騰訊混元世界模型1.1(WorldMirror)正式發(fā)布并開源,新增支持多視圖及視頻輸入,單卡即可部署,秒級創(chuàng)造3D世界。該模型解決了1.0版本僅支持文本或單圖輸入的局限,首次支持多模態(tài)先驗注入和多任務統(tǒng)一輸出的端到端3D重建,支持點云、深度、相機、表面法線和新視角合成等多種3D幾何預測。

10月15日,QQ瀏覽器手機端上線“AI公考通”功能。這是一款面向公考考生的免費智能選崗工具,針對公考人群普遍面臨的信息差難題,主打公告全、推薦準。

據(jù)介紹,AI公考通依托騰訊云Kafka和TDSQL-C構(gòu)建的高性能數(shù)據(jù)管道,可以快速匯聚全國數(shù)萬個官方招考站點的海量信息,更新快、查得快。

科大訊飛

在10月24日至11月6 日舉辦的第八屆世界聲博會暨科大訊飛全球 1024 開發(fā)者節(jié)上,科大訊飛圍繞“更懂你的 AI”主題,集中發(fā)布了大模型、軟硬一體方案、開發(fā)者生態(tài)與行業(yè)應用三大板塊的十余項核心信息:

星火深度推理大模型X1.5 正式亮相:293B 總參數(shù)、30B 激活量的 MoE 架構(gòu),推理效率較 X1 翻倍;數(shù)學、代碼、多語言(130+ 語種)等六大能力對標國際主流,國產(chǎn)算力平臺實現(xiàn) 84% 長思維鏈訓練效率與 520% 非自回歸語音大模型推理成本下降 。

首個“多模態(tài)語音交互”機器人方案落地:與四川長虹聯(lián)合推出 1.6m 人形導購機器人“虹曦”,支持多人連續(xù)對話、中英混合、視覺-激光雷達導航、情緒屏交互,8h 續(xù)航,已在商業(yè)場景批量部署

訊飛輸入法 15.0 & AI 鍵盤:新增側(cè)滑“AI 鍵”,打字自動補句、語音輸入即時語義修正;接入星火高效率語音大模型,離線聽寫準確率提升 25%,中英混輸提升 55% 。

AI 輕辦公四大產(chǎn)品全線升級:智能辦公本、錄音筆、翻譯機、會議耳機新增“星火紀要、星火同傳、星火筆記”等原生能力,并開放 API / SDK 供開發(fā)者二次開發(fā)。

海爾-訊飛“純境零添加”適老電視首發(fā):搭載 AI 知源大模型,方言交互、情緒感知、大字體 UI,入選國家三部委 2024 視聽系統(tǒng)典型案例。

星辰智能體平臺 2.0 & 原生支持RPA的開源框架Astron:提供 8 大行業(yè)模板、個性化聲像復刻、自動化執(zhí)行與效果評估工具,開發(fā)者可“零代碼”拼裝企業(yè)級 Agent。

開發(fā)者生態(tài)最新數(shù)據(jù)與“星火點亮全球”計劃:開放平臺開發(fā)者達 968 萬(年增 200 萬),大模型企業(yè)開發(fā)者增長 125%;2025 AI 開發(fā)者大賽吸引 3.6 萬支團隊、生成 4,622 個垂直智能體;聯(lián)合 14 國伙伴啟動出海扶持,輸出多語言與國產(chǎn)算力方案。

300+“開箱即用”行業(yè)智能體集中展示:已落地“星火行業(yè)分析師”(國內(nèi)首個通過工信部大數(shù)據(jù)分析師認證,得分 92 分,超 85% 人類考生)等多個標桿 AI 員工,覆蓋政務、金融、工業(yè)、教育、醫(yī)療等場景。

本屆開發(fā)者節(jié)凸顯科大訊飛在技術自主可控、場景深度落地、生態(tài)開放共贏三大戰(zhàn)略方向的突破。從星火大模型的多模態(tài)能力升級到 AI 硬件的全棧國產(chǎn)化,從行業(yè)大模型的精準賦能到全球化市場的加速布局,科大訊飛正通過 “算力 + 算法 + 數(shù)據(jù)” 的閉環(huán)生態(tài),推動人工智能從技術創(chuàng)新邁向產(chǎn)業(yè)普惠。

MiniMax

十月,MiniMax在AI領域動作密集,從文本大模型M2開源登頂全球榜單,到視頻、語音、音樂多模態(tài)模型“全家桶”發(fā)布,再到海螺AI、星野APP應用迭代,均體現(xiàn)其“高性能+低成本+全模態(tài)”的技術路線與生態(tài)布局。

10月31日,MiniMax正式發(fā)布新一代AI音樂生成模型Music 2.0,致力于降低音樂創(chuàng)作門檻,讓普通人也能輕松制作專業(yè)級歌曲。該模型基于多模態(tài)AI架構(gòu),訓練數(shù)據(jù)涵蓋海量音樂作品,支持從人聲演唱到完整編曲的全流程生成,單首歌曲最長可達5分鐘,覆蓋流行、搖滾、爵士等多種風格。

Music 2.0最大亮點在于人聲表現(xiàn)細膩,可通過提示詞控制音色與情感,如“低沉男聲”或“漸入高潮的女聲”,并支持男女對唱與多聲部設計。編曲方面,能自動生成主歌、副歌、橋段結(jié)構(gòu),用戶還可指定“鋼琴主線+薩克斯獨奏”等復雜配置。音質(zhì)達44100Hz采樣率、256kbps比特率,支持MP3/WAV格式,細節(jié)清晰、動態(tài)飽滿。

10月28日,MiniMax發(fā)布新一代視頻生成模型海螺2.3,在動態(tài)表現(xiàn)力、風格化呈現(xiàn)與人物表演細膩度方面實現(xiàn)顯著突破,支持復雜動作與微表情生成,性能對標Google Veo。同步推出Fast版本,B端工業(yè)級應用成本降低50%,實現(xiàn)“加量不加價”。

此外,MiniMax發(fā)布Speech 2.6語音模型,針對Voice Agent場景深度優(yōu)化,首包響應時間壓至250ms,解決語音交互“卡頓感”,支持高魯棒性聲音復刻與自動文本規(guī)整。

10月27日,MiniMax發(fā)布并開源新一代文本大模型M2,激活參數(shù)10B(總參230B),在全球權威Artificial Analysis榜單總分位列全球前五、開源第一,性能逼近GPT-5、Claude 4.5等頂尖閉源模型。綜合成本僅0.53美元/百萬Token,不到Claude 4.5的8%,推理速度提升近一倍。模型專為編碼與智能體任務深度優(yōu)化,上線5天即登頂OpenRouter全球調(diào)用量第7、編程場景第3。

商湯科技

近日,商湯日日新在空間智能領域?qū)崿F(xiàn)重要突破,正式發(fā)布并開源SenseNova-SI系列模型。在多項權威評測的空間理解和推理任務上,SenseNova-SI 不僅大幅度領先同量級開源多模態(tài)大模型,還超越了 GPT-5 和 Gemini 2.5 Pro 等國際頂尖閉源模型的表現(xiàn)。

10月15日,商湯科技與寒武紀簽署面向新發(fā)展階段的戰(zhàn)略合作協(xié)議,重點推進軟硬件的聯(lián)合優(yōu)化,并共同構(gòu)建開放共贏的產(chǎn)業(yè)生態(tài)。

在芯片適配方面,雙方將積極推進最新型號的軟硬件產(chǎn)品適配,聯(lián)合打造面向算力市場的服務方案;在一體機解決方案上,雙方將聚焦企業(yè)服務等垂直行業(yè)場景,緊密結(jié)合各自軟硬件能力,打造面向垂直領域的一體機解決方案。

此外,雙方還將共同探索在優(yōu)勢區(qū)域市場的深度協(xié)同,匯聚地方產(chǎn)業(yè)資源和行業(yè)服務優(yōu)勢,構(gòu)建更具活力和影響力的區(qū)域人工智能繁榮生態(tài)。

月之暗面

近日,月之暗面正式發(fā)布了Kimi-k2 thinking模型,其為具有通用Agentic能力和推理能力的思考模型,擅長深度推理,可以通過多輪工具調(diào)用,解決各類復雜的難題。盡管是完全開源,該模型目前在多項標準評估中的表現(xiàn)已超過OpenAI的GPT-5、Anthropic的Claude Sonnet 4.5(思維模式)以及xAI的Grok-4,這標志著開放AI系統(tǒng)競爭力的一個歷史性拐點。

開發(fā)者可以通過 platform.moonshot.ai 和 kimi.com 訪問該模型;權重和代碼托管在 Hugging Face 上。開源發(fā)布包含了聊天、推理和多工具工作流的API。用戶可以直接通過其類似ChatGPT的網(wǎng)站以及Hugging Face空間試用Kimi K2 Thinking。

10月31日,月之暗面正式開源Kimi Linear混合線性注意力架構(gòu),引入Kimi Delta Attention(KDA)模塊,大幅壓縮KV緩存并提升解碼吞吐量。在百萬token上下文長度下,解碼吞吐量可達全注意力架構(gòu)的6倍,KV緩存縮減75%,同時保持高精度。

Kimi Linear的核心是線性注意力模塊Kimi Delta Attention(KDA),通過更細粒度的門控機制擴展了Gated DeltaNet,從而能夠更有效地利用有限狀態(tài)RNN內(nèi)存。論文中指出,Kimi Linear既可以滿足Agent對效率和測試時擴展的需求,同時也不會犧牲模型質(zhì)量。Kimi在社交平臺X發(fā)布帖子稱,Kimi Linear隨時可以作為全注意力的直接替代品。

10月24日,據(jù)《科創(chuàng)板日報》等媒體報道,月之暗面近期將完成新一輪融資,金額達數(shù)億美元。領投方或為騰訊,五源資本大概率參投,美國資本亦有溝通。此輪融資對經(jīng)歷DeepSeek沖擊、融資沉寂后的月之暗面至關重要,有望助力其重回大模型“牌桌”。

DeepSeek

10月20日,國產(chǎn)大模型公司DeepSeek宣布開源其最新研究成DeepSeek-OCR,一款參數(shù)量約30億(3B)的光學字符識別(OCR)模型。這款模型最大的亮點,在于首次通過“光學二維映射”技術,實現(xiàn)了長文本上下文的高效壓縮,在傳統(tǒng)OCR識別的基礎上,讓模型具備了更強的語義理解與結(jié)構(gòu)感知能力。

據(jù)介紹,DeepSeek-OCR擁有約30億參數(shù),在性能與體量之間實現(xiàn)了平衡。它采用“光學二維映射”技術,將圖像中的文字、段落位置、排版結(jié)構(gòu)等視覺要素,一并編碼成二維空間信息,再通過語義映射壓縮算法,把這些信息轉(zhuǎn)化為模型可以理解的“上下文語義表示”。

10月23日,快手StreamLake今天宣布推出“工具+模型+平臺”三位一體AI編程產(chǎn)品矩陣,包括智能開發(fā)工具CodeFlicker、多個自研大模型KAT-Coder以及大模型平臺快手萬擎(Vanchin),為企業(yè)與開發(fā)者構(gòu)建AI編程新生態(tài)。其中KAT-Coder-AirV1版本將面向所有用戶免費使用。

生數(shù)科技

10月21日,生數(shù)科技發(fā)布Vidu Q2“參考生視頻”功能,支持多圖參考生視頻、視頻延長(普通用戶免費延長30秒,付費用戶最長5分鐘),APP從AI創(chuàng)作平臺轉(zhuǎn)型為一站式AI內(nèi)容社交平臺,API全面開放接入。

愛詩科技

10月17日,愛詩科技宣布完成1億元人民幣B+輪融資,由復星銳正、同創(chuàng)偉業(yè)、順禧基金等共同投資,光源資本擔任獨家財務顧問。這是繼9月10日完成超6000萬美元B輪融資(由阿里巴巴領投)后,兩個月內(nèi)完成的又一輪大額融資,創(chuàng)下國內(nèi)視頻生成領域連續(xù)融資紀錄。

美團

10月25日,美團開源了其首款視頻生成大模型——LongCat-Video。該模型面向多任務視頻生成場景,旨在以統(tǒng)一架構(gòu)支持文生視頻、圖生視頻以及視頻續(xù)寫三種能力。

不同于以往針對單一任務訓練的模型,LongCat-Video通過多任務聯(lián)合訓練機制,在同一框架內(nèi)即可處理零幀、單幀及多幀條件輸入。

此外,LongCat-Video重點突破了長視頻生成難題,原生支持輸出5分鐘級別的視頻。相比常見模型在長時序生成中易出現(xiàn)的畫面漂移、色彩偏移等問題,該模型通過在視頻續(xù)寫任務上的原生預訓練,保持了較高的時間一致性與視覺穩(wěn)定性。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
江蘇一地發(fā)布最新人事任免

江蘇一地發(fā)布最新人事任免

黃河新聞網(wǎng)呂梁頻道
2026-01-11 14:08:43
滿屏荷爾蒙!網(wǎng)飛這一脫,又爆了

滿屏荷爾蒙!網(wǎng)飛這一脫,又爆了

來看美劇
2026-01-11 19:15:03
A股:周末下午傳來2大核彈級利好!下周很可能會迎更大級別大行情?

A股:周末下午傳來2大核彈級利好!下周很可能會迎更大級別大行情?

股市皆大事
2026-01-11 14:03:03
善惡有報,2025年塌房的六大網(wǎng)紅,為了流量各種作妖,不值得同情

善惡有報,2025年塌房的六大網(wǎng)紅,為了流量各種作妖,不值得同情

單手搓核彈
2026-01-06 14:04:34
上港本月有可能回購這位外援,讓他二進宮來俱樂部,以官宣為準

上港本月有可能回購這位外援,讓他二進宮來俱樂部,以官宣為準

阿錯田間生活
2026-01-11 18:20:47
這就是毛主席父親的真實容貌,都看看吧,這可不是演員扮演的!

這就是毛主席父親的真實容貌,都看看吧,這可不是演員扮演的!

萬物知識圈
2026-01-05 09:10:33
香港餐廳收內(nèi)地客“天價”小費?港人怒批:香港結(jié)業(yè)潮是有原因的

香港餐廳收內(nèi)地客“天價”小費?港人怒批:香港結(jié)業(yè)潮是有原因的

朝子亥
2026-01-06 11:35:03
隨著韓國4-2,烏茲0-0伊朗,U23亞洲杯最新形勢:首支出局隊誕生

隨著韓國4-2,烏茲0-0伊朗,U23亞洲杯最新形勢:首支出局隊誕生

侃球熊弟
2026-01-11 00:01:06
李在明啟程離京,一個時代告終,臨走前對華改口,中方對日本動手

李在明啟程離京,一個時代告終,臨走前對華改口,中方對日本動手

boss外傳
2026-01-11 21:00:02
安徽通報,薛冰任上落馬

安徽通報,薛冰任上落馬

上觀新聞
2026-01-11 18:33:04
段永平:李東生至今(指2000年)沒有向我道歉,企業(yè)家要有風度

段永平:李東生至今(指2000年)沒有向我道歉,企業(yè)家要有風度

講真
2026-01-05 23:50:45
痛心!陜西15歲“巨嬰”孫寶去世,媽媽背著爬華山,網(wǎng)友:解脫了

痛心!陜西15歲“巨嬰”孫寶去世,媽媽背著爬華山,網(wǎng)友:解脫了

靜若梨花
2026-01-07 17:00:46
1991 年,鄧小平特派代表赴美團聚張學良,邀他重返故土,張學良回應:“回大陸可以,但我有三個要求”

1991 年,鄧小平特派代表赴美團聚張學良,邀他重返故土,張學良回應:“回大陸可以,但我有三個要求”

文史明鑒
2025-12-21 17:07:19
34層高樓僅一部電梯運行,一次只限按5層,200余戶居民出行太痛苦

34層高樓僅一部電梯運行,一次只限按5層,200余戶居民出行太痛苦

恪守原則和底線
2026-01-11 05:15:05
建議大家:假如工資允許,咬咬牙添置“這5樣”,幸福感加倍提升

建議大家:假如工資允許,咬咬牙添置“這5樣”,幸福感加倍提升

家居設計師蘇哥
2025-12-29 13:46:17
為什么公司更傾向重新招人而不留住老員工?評論區(qū)客觀且切中要點

為什么公司更傾向重新招人而不留住老員工?評論區(qū)客觀且切中要點

另子維愛讀史
2026-01-11 20:27:36
足總杯火爆1幕!葡國腳廢人式飛鏟引2次沖突,熱刺維拉數(shù)十人干架

足總杯火爆1幕!葡國腳廢人式飛鏟引2次沖突,熱刺維拉數(shù)十人干架

我愛英超
2026-01-11 06:45:04
2026年春節(jié),要暖到離譜?大年初一撞上七九,老輩人:60年頭回見

2026年春節(jié),要暖到離譜?大年初一撞上七九,老輩人:60年頭回見

叮當當科技
2026-01-07 13:58:49
內(nèi)蒙“女色虎”落馬,靠陪睡高官上位,大肆斂財為了整容

內(nèi)蒙“女色虎”落馬,靠陪睡高官上位,大肆斂財為了整容

文史旺旺旺
2024-10-31 12:26:20
西方環(huán)保學家:中國又開始“反人類操作”,用塑料袋把沙漠變綠洲

西方環(huán)保學家:中國又開始“反人類操作”,用塑料袋把沙漠變綠洲

近史博覽
2026-01-11 06:34:40
2026-01-11 21:36:49
AI大模型工場 incentive-icons
AI大模型工場
專注AI大模型行業(yè)媒體,深度解讀公司大模型行業(yè)動態(tài),且提供一手的AIGC,行業(yè)大模型內(nèi)容。
330文章數(shù) 86關注度
往期回顧 全部

科技要聞

“我們與美國的差距也許還在拉大”

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對勸阻者出言不遜

頭條要聞

零度天母親罰女兒在街頭跪地行走 還對勸阻者出言不遜

體育要聞

詹皇曬照不滿打手沒哨 裁判報告最后兩分鐘無誤判

娛樂要聞

留幾手為閆學晶叫屈?稱網(wǎng)友自卑敏感

財經(jīng)要聞

外賣平臺"燒錢搶存量市場"迎來終局?

汽車要聞

2026款宋Pro DM-i長續(xù)航補貼后9.98萬起

態(tài)度原創(chuàng)

時尚
家居
房產(chǎn)
健康
公開課

當一個57歲的女人,決定從零開始

家居要聞

木色留白 演繹現(xiàn)代自由

房產(chǎn)要聞

66萬方!4755套!三亞巨量房源正瘋狂砸出!

這些新療法,讓化療不再那么痛苦

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版