国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

跟OpenAI撕破臉、微軟喊話要“完全獨立”!靠不到10人、 一半GPU用量,推出三款王炸低價模型

0
分享至


整理|華衛(wèi)

昨日,科技巨頭微軟旗下研究實驗室 Microsoft AI 宣布推出三款基礎(chǔ) AI 模型,可生成文本、語音和圖像。目前三款模型均已登陸 Microsoft Foundry,其中轉(zhuǎn)錄和語音模型也已在 MAI Playground 中開放使用。

此次發(fā)布標(biāo)志著微軟在仍與 OpenAI 保持合作的同時,持續(xù)推進構(gòu)建自有多模態(tài) AI 模型體系,更計劃在模型研發(fā)上與 OpenAI、谷歌及其他前沿實驗室直接競爭。

正面硬剛 OpenAI 和谷歌,

更便宜還更強?

MAI-Transcribe-1 是本次發(fā)布的核心產(chǎn)品。據(jù)介紹,這款語音轉(zhuǎn)文本模型專為復(fù)雜、真實場景下的世界級轉(zhuǎn)錄質(zhì)量而設(shè)計,可將全球使用量最高的 25 種語言的語音轉(zhuǎn)錄為文本,說話人分離、上下文定向優(yōu)化與流式轉(zhuǎn)寫功能均標(biāo)注為 “即將推出”。根據(jù)微軟的基準(zhǔn)測試結(jié)果,該模型在全部 25 種語言上優(yōu)于 OpenAI 的 Whisper-large-v3,在 22 種語言上超過谷歌 Gemini 3.1 Flash,并分別在 15 種語言上領(lǐng)先 ElevenLabs 的 Scribe v2 與 OpenAI 的 GPT-Transcribe。


該模型采用基于 Transformer 的文本解碼器與雙向音頻編碼器,支持 MP3、WAV、FLAC 格式文件,最大容量 200MB。微軟表示,其批量轉(zhuǎn)寫速度是現(xiàn)有 Azure Fast 服務(wù)的 2.5 倍。在行業(yè)標(biāo)準(zhǔn)多語言測試基準(zhǔn) FLEURS 上,該模型針對微軟產(chǎn)品使用量最高的 25 種語言,實現(xiàn)了最低的平均詞錯誤率,僅為 3.8%。微軟已在 Copilot 語音模式和 Microsoft Teams 中測試 MAI-Transcribe-1 用于對話轉(zhuǎn)寫,這一細(xì)節(jié)也凸顯出該公司正計劃迅速用自研模型替代第三方或舊版內(nèi)部模型。

MAI-Voice-1 是一款音頻生成模型,支持用戶在 1 秒內(nèi)生成 60 秒自然流暢的音頻,GPU 利用率極高。它能夠生成自然逼真的語音,細(xì)節(jié)豐富、情感飽滿且富有表現(xiàn)力,即使在長內(nèi)容中也能保留說話人的音色特征。并且,微軟在 Microsoft Foundry 中新增了安全創(chuàng)建自定義語音的功能,僅需幾秒音頻即可完成,能夠極大簡化開發(fā)者構(gòu)建語音交互體驗與智能語音助手的流程。

而 MAI-Image-2 為視頻生成模型,專為攝影師、設(shè)計師和視覺敘事創(chuàng)作者打造,滿足他們對自然光影、精準(zhǔn)膚色與紋理的要求,同時可在圖表、版式和視覺設(shè)計中生成清晰的畫面內(nèi)文字。最初,該模型于 3 月 19 日在全新大語言模型測試工具 MAI Playground 上線,在 Arena.ai 榜單上躋身前三模型系列后,進一步大幅提升了 Copilot 上的圖像生成性能與速度。根據(jù)實際生產(chǎn)流量數(shù)據(jù),用戶在 Foundry 和 Copilot 上的生成速度至少提升至原來的 2 倍,同時畫質(zhì)保持一致。該模型也正在逐步向 Bing 和 PowerPoint 分批推送。


微軟在博客中表示,在日益擁擠的 LLM 市場中,這些模型的一大賣點是定價低于谷歌和 OpenAI 的同類產(chǎn)品。MAI-Transcribe-1 定價起步為每小時 0.36 美元。MAI-Voice-1 起步價為每百萬字符 22 美元,MAI-Image-2 則為文本輸入每百萬 tokens 5 美元、圖像輸出每百萬 tokens 33 美元。

微軟此次發(fā)布恰逢其處境微妙之際。這家公司的股票剛迎來 2008 年金融危機以來表現(xiàn)最差的一個季度,投資者愈發(fā)要求微軟拿出證據(jù),證明其數(shù)千億美元的 AI 基礎(chǔ)設(shè)施投入能夠轉(zhuǎn)化為實際收入。 這批定價極具競爭力、且旨在降低微軟自身銷售成本的模型,正是其應(yīng)對這一壓力的首個答卷。

不足 10 人研發(fā),

GPU 用量僅為競品一半

這些模型由微軟 MAI Superintelligence 團隊研發(fā),同時也是團隊打響的第一槍。該 AI 研究團隊由微軟 AI 負(fù)責(zé)人 Mustafa Suleyman 牽頭,于 2025 年 11 月正式組建并公布,目標(biāo)是實現(xiàn)他所稱的 “AI 自給自足”。

在公開發(fā)布前的采訪中,Suleyman 表示:“我非常激動,我們首批推出的模型就已達到全球頂尖的轉(zhuǎn)寫水準(zhǔn)。不僅如此,我們實現(xiàn)同等效果所需的 GPU 資源僅為當(dāng)前行業(yè)頂尖競品的一半。”同時,Suleyman 對其當(dāng)前的競爭地位信心十足:“我們現(xiàn)已躋身前三的 AI 實驗室,僅次于 OpenAI 與 Gemini?!?/p>

而 Suleyman 透露的最令人震驚的細(xì)節(jié),是研發(fā)這些模型的團隊規(guī)模之小?!罢Z音模型由 10 個人打造,速度、效率與準(zhǔn)確率的大幅提升,絕大部分來自模型架構(gòu)和我們使用的數(shù)據(jù)。圖像團隊同樣不足 10 人。一切都源于模型與數(shù)據(jù)層面的創(chuàng)新,最終實現(xiàn)了頂尖性能。” 他表示,“我的理念一直是:人員要少而精,充分放權(quán)。因此我們采用極度扁平化的管理結(jié)構(gòu)?!?/p>

與之形成對比的是 Meta,Suleyman 在采訪中將其策略形容為 “大量招人,而非打造高效團隊”,據(jù)稱該公司為頂尖研究員開出的薪酬包高達 1 億至 2 億美元。其次,小團隊就能產(chǎn)出頂尖成果,極大優(yōu)化了經(jīng)濟效益。如果微軟僅用 10 名工程師、競品一半的 GPU 資源,就能做出行業(yè)頂尖的轉(zhuǎn)寫模型,其 AI 業(yè)務(wù)的利潤結(jié)構(gòu),將與那些燒錢換取相似基準(zhǔn)成績的公司截然不同。

當(dāng)被問及團隊工作模式時,Suleyman 形容其環(huán)境更像初創(chuàng)公司的交易大廳,而非傳統(tǒng)的微軟工程部門?!皥F隊成員圍坐在圓桌旁,不是傳統(tǒng)辦公桌,用筆記本電腦而非大屏顯示器。 他們?nèi)觳⒓鐓f(xié)作,沉浸式編碼,一個房間里有五六十人,從早到晚?!?/p>

此外,Suleyman 一直在為微軟的 AI 業(yè)務(wù)構(gòu)建一套名為 “人文主義 AI” 的理念品牌。他表示,“我認(rèn)為,人文主義超智能的初衷,是打造真正服務(wù)于人類的技術(shù)。人類將始終處于主導(dǎo)地位,技術(shù)也會始終與人類利益保持一致?!痹谀P桶l(fā)布的博客文章中,Suleyman 也寫道:“在 Microsoft AI,我們正在打造 Humanist AI。我們在創(chuàng)建 AI 模型時有獨特理念,以人為中心針對人類真實溝通方式進行優(yōu)化,面向?qū)嶋H應(yīng)用進行訓(xùn)練。很快,大家將在 Foundry 以及微軟各類產(chǎn)品和體驗中看到我們推出更多模型。”

Suleyman 還強調(diào)數(shù)據(jù)來源是微軟的競爭優(yōu)勢,稱他曾與微軟 CEO Satya Nadella 討論,要打造 “數(shù)據(jù)來源干凈合規(guī)的模型體系”。他隱晦地與開源方案做對比,指出 “很多開源模型的訓(xùn)練數(shù)據(jù)來源可以說并不合規(guī),這可能存在安全隱患。”

與 OpenAI 重新談判,

微軟計劃實現(xiàn) “完全獨立”

要理解這批模型的重要性,就必須看清促成這一切的協(xié)議層面重大轉(zhuǎn)變。盡管推出了自有模型,Suleyman 在接受外媒采訪時重申,微軟仍將繼續(xù)履行與 OpenAI 的合作承諾。不過他也透露,近期雙方對合作關(guān)系的重新談判,為微軟真正開展超智能研究掃清了障礙。

2025 年 10 月之前,微軟受合同限制,無法獨立研發(fā)通用人工智能。2019 年與 OpenAI 簽署的原始協(xié)議中,微軟獲得 OpenAI 模型授權(quán),作為交換為其搭建所需云基礎(chǔ)設(shè)施。但當(dāng) OpenAI 試圖將算力合作拓展至微軟之外,與軟銀等方達成合作時,微軟重啟了協(xié)議談判。正如 Suleyman 在 2025 年 12 月接受外媒采訪時所述,修訂后的協(xié)議意味著 “就在幾周前,微軟還因合同條款,被禁止獨立研發(fā)通用人工智能或超智能模型”。新條款讓微軟得以自研前沿模型,同時保留至 2032 年使用 OpenAI 所有模型的授權(quán)。

Suleyman 也在最新采訪中直言不諱地描述了這一變化?!叭ツ?9 月,我們重新談判了與 OpenAI 的協(xié)議,這讓我們能夠獨立推進自研超智能模型。” 他表示,“自那之后,我們開始整合算力、組建團隊,并采購所需數(shù)據(jù)?!?/p>

同時,他迅速強調(diào),與 OpenAI 的合作關(guān)系保持不變。 Suleyman 稱,“與 OpenAI 的合作不會有任何改變,我們至少會合作至 2032 年,希望能更久。他們一直是我們極為出色的合作伙伴?!?目前,微軟已向該 AI 研究實驗室(OpenAI)投資超 130 億美元,并通過一項多年期合作協(xié)議,將其模型集成到微軟各類產(chǎn)品中。他還提到,微軟通過 Foundry API 提供 Anthropic 的 Claude 訪問服務(wù),將自身定位為 “平臺中的平臺”。

但 Suleyman 的潛臺詞顯而易見:微軟正在構(gòu)建獨立發(fā)展的能力。據(jù)外媒報道,Suleyman 今年 3 月在一份內(nèi)部備忘錄中寫道,他的目標(biāo)是 “未來 5 年,將全部精力投入超智能項目,為微軟打造世界級模型”。這一架構(gòu)調(diào)整讓 Suleyman 從 Copilot 日常產(chǎn)品工作中脫身,前 Snap 高管 Jacob Andreou 接任執(zhí)行副總裁,負(fù)責(zé)整合后的消費及商用 Copilot 體驗業(yè)務(wù)。

Suleyman 在采訪中明確表示,語音轉(zhuǎn)寫、語音與圖像生成只是開端。當(dāng)被問及微軟是否會打造可與 GPT 正面競爭的前沿大語言模型時,他態(tài)度毫不含糊:“我們必將在所有模態(tài)上推出頂尖模型。我們的目標(biāo)是:一旦微軟有需要,就能以最高效率、最低價格提供世界一流技術(shù),并實現(xiàn)完全獨立?!?/p>

據(jù)悉,Suleyman 接受采訪之時,整個團隊正齊聚此地開展為期一周的常規(guī)線下集中會議,Nadella 也專程到場。Suleyman 還透露了多年路線圖,包括 “搭建合適規(guī)模的 GPU 集群”,規(guī)劃 “未來 2 至 4 年實現(xiàn) AI 自給自足所需完成的全部目標(biāo),以及對應(yīng)的算力布局路線”。

https://microsoft.ai/news/today-were-announcing-3-new-world-class-mai-models-available-in-foundry/

https://venturebeat.com/technology/microsoft-launches-3-new-ai-models-in-direct-shot-at-openai-and-google

聲明:本文為 AI 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

QCon 全球軟件開發(fā)大會·2026 北京站將于 4 月 16 日 -18 日正式舉辦。本屆大會以“Agentic AI 時代的軟件工程重塑”為主題,聚焦 100+ 重磅議題,匯聚來自阿里、騰訊、字節(jié)跳動、小米、百度等一線科技企業(yè)與創(chuàng)新團隊的技術(shù)專家,圍繞 AI 工程化、系統(tǒng)架構(gòu)與研發(fā)模式演進展開深入探討。更多詳情可掃碼或聯(lián)系票務(wù)經(jīng)理 18514549229 進行咨詢。

今日薦文


你也「在看」嗎?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
130萬皇馬球迷請愿離隊!姆巴佩心碎發(fā)聲:等我走了你們才會后悔

130萬皇馬球迷請愿離隊!姆巴佩心碎發(fā)聲:等我走了你們才會后悔

體育閑話說
2026-05-07 08:05:06
吳宜澤奪冠后首度現(xiàn)身國內(nèi),在西安機場受球迷接機送花,之后還將舉行見面會,此前他曾表示想回國吃美食、見朋友

吳宜澤奪冠后首度現(xiàn)身國內(nèi),在西安機場受球迷接機送花,之后還將舉行見面會,此前他曾表示想回國吃美食、見朋友

極目新聞
2026-05-07 07:12:51
“我要去中國了” 51歲老馬退出斯諾克元老賽 火箭:為錢我會參加

“我要去中國了” 51歲老馬退出斯諾克元老賽 火箭:為錢我會參加

風(fēng)過鄉(xiāng)
2026-05-07 07:56:33
行業(yè)第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

行業(yè)第一瘋!張雪直播10萬+連線讓用戶公開罵,“真誠殺”太狠了

商悟社
2026-05-07 00:07:04
740萬觀眾的選擇:這部英劇為何讓刻薄女人成了主角

740萬觀眾的選擇:這部英劇為何讓刻薄女人成了主角

娛圈觀察員
2026-05-06 15:15:55
同濟大學(xué)教師王某團隊一年兩登《自然》的論文被指造假,本人曾稱“十年磨一劍” 學(xué)校正調(diào)查

同濟大學(xué)教師王某團隊一年兩登《自然》的論文被指造假,本人曾稱“十年磨一劍” 學(xué)校正調(diào)查

紅星新聞
2026-04-16 21:08:20
豆包搜索黎元洪跳出演員范偉圖片,官方回應(yīng):系媒體大量報道

豆包搜索黎元洪跳出演員范偉圖片,官方回應(yīng):系媒體大量報道

PChome電腦之家
2026-05-06 10:22:59
丟了7年的手機突然發(fā)回定位 還自動拍下了使用者的照片 失主:已經(jīng)成功要回了手機

丟了7年的手機突然發(fā)回定位 還自動拍下了使用者的照片 失主:已經(jīng)成功要回了手機

閃電新聞
2026-05-06 12:58:59
GPT-5.5 Instant 突然全員免費了!

GPT-5.5 Instant 突然全員免費了!

新浪財經(jīng)
2026-05-07 04:41:37
罪有應(yīng)得!以色列,正被全世界集體孤立!

罪有應(yīng)得!以色列,正被全世界集體孤立!

毛豆論道
2026-05-05 17:35:52
日本部署消耗性超廉價紙板無人機:售價2000美元 可在5到10分鐘內(nèi)組裝完成

日本部署消耗性超廉價紙板無人機:售價2000美元 可在5到10分鐘內(nèi)組裝完成

快科技
2026-05-05 10:29:05
黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

黑龍江兩名11歲女孩已遇害:網(wǎng)傳被先奸后殺,兇手身份被曝光

魔都姐姐雜談
2026-05-07 15:17:15
國乒男團VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

國乒男團VS韓國隊,比賽時間公布,王皓是否換人,央視解說引爭議

體育大學(xué)僧
2026-05-07 10:52:38
高校畢業(yè)生創(chuàng)新高 上海打出組合拳護航就業(yè)

高校畢業(yè)生創(chuàng)新高 上海打出組合拳護航就業(yè)

看看新聞Knews
2026-05-06 19:32:02
1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

1958年毛澤東視察濟南,酒桌上突然猛砸杯子死盯王新亭:把你隱瞞的秘密交底吧?

史海孤雁
2026-05-05 17:07:19
問題果然出現(xiàn)了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

問題果然出現(xiàn)了,比亞迪銷量暴跌26%,撕開新能源車最后的遮羞布

混沌錄
2026-05-06 23:01:06
江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對話語權(quán)?

江蘇跨江大橋命名暗戰(zhàn),誰在掌握絕對話語權(quán)?

觀察眼看世界
2026-05-07 11:02:46
馬刺用104歲三塔慶祝!創(chuàng)9紀(jì)錄晉級概率升75% 文班:反彈意料之中

馬刺用104歲三塔慶祝!創(chuàng)9紀(jì)錄晉級概率升75% 文班:反彈意料之中

顏小白的籃球夢
2026-05-07 18:13:57
普京不想再打了,俄軍打下來的領(lǐng)土,足夠給1億俄羅斯人一個交待

普京不想再打了,俄軍打下來的領(lǐng)土,足夠給1億俄羅斯人一個交待

混沌錄
2026-05-05 13:50:21
1933年希特勒接見中國青年潘德明,說了一句話令在場德國軍官震驚

1933年希特勒接見中國青年潘德明,說了一句話令在場德國軍官震驚

超人強動物俱樂部
2026-05-07 15:07:42
2026-05-07 18:48:49
AI前線 incentive-icons
AI前線
面向AI愛好者、開發(fā)者和科學(xué)家,提供AI領(lǐng)域技術(shù)資訊。
1477文章數(shù) 149關(guān)注度
往期回顧 全部

科技要聞

月之暗面完成20億美元融資,估值突破200億

頭條要聞

媒體:不是中國離不開世界杯 是世界杯更需要中國

頭條要聞

媒體:不是中國離不開世界杯 是世界杯更需要中國

體育要聞

巴黎再進歐冠決賽,最尷尬的情況還是發(fā)生了

娛樂要聞

孫楊強迫拉張豆豆手那一幕,我看笑了,也看怒了

財經(jīng)要聞

金融“風(fēng)暴”,AI制造

汽車要聞

雷克薩斯全新純電三排SUV 全新TZ全球首發(fā)

態(tài)度原創(chuàng)

家居
時尚
數(shù)碼
房產(chǎn)
親子

家居要聞

破繭成蝶 土味精裝房爆改

穿黑褲子別只會搭白T恤!看看這些顯瘦的搭配,高級感拉滿

數(shù)碼要聞

華為MatePad Pro Max平板海外首發(fā),預(yù)裝HarmonyOS 4.3系統(tǒng)

房產(chǎn)要聞

負(fù)債23億,抵押482畝地!海南這家巨頭,慘遭拍賣!

親子要聞

三歲女兒在高鐵上給媽媽送祝福,溫暖又治愈

無障礙瀏覽 進入關(guān)懷版