国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

「能說(shuō)會(huì)唱」的MiniMax,拔出國(guó)產(chǎn)AI的瑞士軍刀

0
分享至


文 | 闌夕

今天聽(tīng)到一首歌,旋律隱隱熟悉,似乎有成為爆款BGM的潛質(zhì)。

從開(kāi)始的古箏起始,隨著鼓點(diǎn)加入,進(jìn)到古風(fēng)歌詞——幾段正歌人聲清雋,副歌部分悠長(zhǎng)不絕,訴說(shuō)一個(gè)久遠(yuǎn)的故事……

請(qǐng)中央音樂(lè)學(xué)院的博士好友一聽(tīng),他評(píng)價(jià)編曲、作詞都還不錯(cuò),也認(rèn)真給出了一點(diǎn)建議。

然而,這首三分多鐘的完整歌曲,是只用了一句提示詞、通過(guò)MiniMax Music生成的。

知此情形,音樂(lè)博士好友很受震撼;而真正親歷、見(jiàn)證了這幾年AI音樂(lè)發(fā)展的人士,深度體驗(yàn)后,內(nèi)心的波瀾大概不亞于他。

一曲一世界,一句一乾坤。

  • MiniMax Music測(cè)評(píng):曲風(fēng)由你

AI音樂(lè)之乾坤,唯創(chuàng)作才有發(fā)言權(quán)。使用MiniMax Music消耗數(shù)千積分后,淺談些感受。

生成上一首歌曲的提示詞并不艱深:「模仿周杰倫的旋律,寫(xiě)一首愛(ài)情相關(guān)的歌,有古風(fēng)元素,模仿《七里香》和《說(shuō)好的幸福呢》旋律結(jié)合」。而效果聽(tīng)來(lái)卻有意外之喜,尤其對(duì)幾乎從未嘗試過(guò)獨(dú)立音樂(lè)創(chuàng)作的普通朋友,易上手程度可以說(shuō)已接近「0門(mén)檻」。


用到的模型是MiniMax最新更新的自研音樂(lè)模型 Music 1.5,產(chǎn)品功能很簡(jiǎn)潔,分為簡(jiǎn)單模式(Simple)和高級(jí)模式(Advanced)兩種。前者可以「一句成曲」,而后者「專(zhuān)業(yè)可控」。

簡(jiǎn)單模式下,仍輸入較簡(jiǎn)單的提示詞,輸出結(jié)果卻是曲風(fēng)突變。

「創(chuàng)作一首有爵士風(fēng)格、R&B元素的流行歌曲,表達(dá)年輕一代創(chuàng)業(yè)者的先鋒和創(chuàng)新態(tài)度,用電吉他、Bass、架子鼓等,混合搖滾特征和現(xiàn)代音樂(lè)獨(dú)創(chuàng)性。」

首先必須承認(rèn),Music 1.5的指令依循性很好。提示詞涉及的電吉他、貝斯、架子鼓,特征都很鮮明,前奏先聲奪人譜出跳動(dòng)感,樂(lè)器本身音色特點(diǎn)和想要的歌曲風(fēng)格匹配度高。

而隨著人聲的注入,爵士、R&B、搖滾和現(xiàn)代的風(fēng)格得以彰顯,起調(diào)明亮的樂(lè)器聲作為伴奏則是稍稍后移,在間奏和結(jié)尾又自然呈現(xiàn)。

要知道,如果把提示詞作為「命題作業(yè)」給到音樂(lè)學(xué)院的學(xué)生,單獨(dú)一個(gè)音軌的吉他伴奏,錄音棚中便是不知多少次的從頭再來(lái)。

而今天,實(shí)現(xiàn)如上一首完整作品,所需僅僅一段話(huà)、一模型、數(shù)積分而已。

那么,如果更進(jìn)一步細(xì)化結(jié)構(gòu)層次和指令顆粒度呢?


用Markdown形式和更代碼化的提示詞,效果也沒(méi)讓我失望。最長(zhǎng)的提示詞,帶來(lái)了近期我最滿(mǎn)意的一首AI音樂(lè)作品。

不過(guò)需要注意的是,簡(jiǎn)單模式下,長(zhǎng)提示詞需要控制在300字符內(nèi),這也讓我自然而然開(kāi)啟了高級(jí)模式的探索。


在高級(jí)模式下,指令篇幅來(lái)到了3000字符。輸入「 / 」會(huì)有編曲的分層提示。


完成了前奏、主歌、副歌等的設(shè)計(jì)后,在設(shè)置中可以一鍵選擇風(fēng)格、情緒、場(chǎng)景等。


按照官方表達(dá),Music 1.5 支持 「16種風(fēng)格 × 11種情緒 × 10個(gè)場(chǎng)景」 自定義音樂(lè)特征,理論上有1760種不同的樂(lè)曲類(lèi)型組合。

相比之前「一句話(huà)成曲」能進(jìn)一步感受到控制力的提升。如果把音樂(lè)創(chuàng)作拆解為工作流,此刻Music 1.5已經(jīng)用公式化的結(jié)構(gòu)和標(biāo)簽,讓曾經(jīng)的節(jié)點(diǎn)和Pipeline變成的一個(gè)個(gè)的可點(diǎn)擊選項(xiàng)。


因?yàn)槭窍嗤P偷脑?,歌曲本身的演繹完成度和藝術(shù)性,比起之前的幾個(gè)測(cè)試案例,變化似乎并不顯著;但在高級(jí)模式下,能根據(jù)需要選擇樂(lè)器類(lèi)型、歌詞內(nèi)容、風(fēng)格搭配……相比簡(jiǎn)單模式下用提示詞控制,明顯會(huì)更有掌控感。

哪怕以音樂(lè)學(xué)院博士的眼光來(lái)評(píng)判,選項(xiàng)的細(xì)分程度也已經(jīng)達(dá)到了專(zhuān)業(yè)水準(zhǔn)??梢韵胍?jiàn),在MiniMax Music團(tuán)隊(duì),必然有樂(lè)理專(zhuān)家和職業(yè)音樂(lè)人的支持。

唯一發(fā)現(xiàn)的暫時(shí)還不夠可控的,是純音樂(lè)選項(xiàng),在當(dāng)前最新版本中不論提示詞如何強(qiáng)調(diào),依然無(wú)法消除人聲。通過(guò)增加選擇按鈕的方式等,并不是難題,預(yù)計(jì)也將很快得到完善或取舍。

總體來(lái)看,模型的控制力和音樂(lè)性,是衡量音樂(lè)模型質(zhì)量的兩個(gè)核心指標(biāo)。

從控制力來(lái)說(shuō),Music 1.5能在4分鐘的音樂(lè)中保持高完成度,其背后對(duì)于Long Context的編排,可類(lèi)比2023年Kimi橫空出世的長(zhǎng)文本。音樂(lè)全鏈路、多場(chǎng)景,都達(dá)到了超出業(yè)余的水準(zhǔn)。

從音樂(lè)性講,無(wú)論風(fēng)格的典型性還是編曲層次感,再或者人聲的自然度、結(jié)構(gòu)的動(dòng)態(tài)變化,都堪稱(chēng)令人喜悅。

當(dāng)然,相比Suno細(xì)分功能的豐富度,MiniMax Music尚顯簡(jiǎn)陋,生成的音樂(lè)結(jié)尾處理略生硬,存在戛然而止、聲音突然中斷的抽卡現(xiàn)象。但作為中國(guó)的AI之聲,其肉眼可見(jiàn)的進(jìn)步速度,更值得我們期待。


  • AI音樂(lè),不止重塑音樂(lè)行業(yè)

相較于處于AI舞臺(tái)中央的大語(yǔ)言模型、視頻模型,AI音樂(lè)的戰(zhàn)場(chǎng)似乎并未被充分重視。

然而,一款再先進(jìn)的視頻模型,沒(méi)有聲音也只是默片;沒(méi)有音樂(lè)的注入,即便有了文字、圖片、視頻,靈魂仍然殘缺。

在MiniMax的技術(shù)圖譜內(nèi),聲音模型一直被擺在重要位置,并和其他模型彼此促進(jìn)。從技術(shù)發(fā)展初期,在行業(yè)玩家尚未察覺(jué)之時(shí),就下重注長(zhǎng)線布局,這也是今天MiniMax的模型矩陣都能占據(jù)領(lǐng)先位置的原因。

看MiniMax的全棧AI能力生態(tài),從算力到數(shù)據(jù)、從模型到應(yīng)用,不僅能發(fā)揮協(xié)同效應(yīng)、產(chǎn)模一體自閉環(huán),同時(shí)可以憑借對(duì)外賦能、API邏輯、出海經(jīng)驗(yàn),在商業(yè)上真正全面落地。


不要忘了,MiniMax在語(yǔ)音上已經(jīng)是全球雙榜第一,這意味著它在「聲音」領(lǐng)域的技術(shù)積累有天然優(yōu)勢(shì)。

今年的上海WAIC,開(kāi)幕式的主講嘉賓是諾獎(jiǎng)得主、AI教父辛頓,而另一位啟幕嘉賓則是閆俊杰,MiniMax的創(chuàng)始人。二者演講內(nèi)容的一個(gè)共同點(diǎn)是,都站在了AI與全人類(lèi)關(guān)系的立場(chǎng)上。相比Hinton,MiniMax更加樂(lè)觀,相信AI屬于每個(gè)人,一定會(huì)更普惠地服務(wù)大眾。在AGI的道路上,看似是「微小拼圖」的AI音樂(lè),也終究會(huì)在人類(lèi)科技史、藝術(shù)史上書(shū)寫(xiě)天籟的一筆。

早在2023年,a16z已經(jīng)旗幟鮮明提出,AI將重塑音樂(lè)全產(chǎn)業(yè)鏈。從23年初谷歌的MusicLM文生音樂(lè),到Meta開(kāi)源MusicGen。再之后,Suno橫空出世,憑借其音樂(lè)審美和產(chǎn)品完成度,第一次在音樂(lè)生成領(lǐng)域樹(shù)立標(biāo)桿。

a16z甚至展示了AI音樂(lè)的行業(yè)應(yīng)用光譜,從即時(shí)交互的音樂(lè)信息流,到專(zhuān)業(yè)級(jí)的音樂(lè)工具、技術(shù)棧,不同于Spotify的新一代音樂(lè)媒介正在誕生。AI音樂(lè)專(zhuān)輯、互動(dòng)式音樂(lè)平臺(tái)等形態(tài),也將不再是癡人說(shuō)夢(mèng)。


對(duì)MiniMax Audio來(lái)說(shuō),性?xún)r(jià)比就是最永恒的優(yōu)勢(shì)。效果可媲美Suno、局部亮點(diǎn)突出,價(jià)格僅為suno的一半不到。具體來(lái)看,Suno V3.5的單價(jià)大概是3毛,一首歌要幾十美金,這是Suno的問(wèn)題,也是機(jī)會(huì)窗口。

正如海螺AI在不到一年的時(shí)間里反超Sora,類(lèi)似的戲碼似乎也正在MiniMax Music和Suno之間上演。

在產(chǎn)品設(shè)計(jì)和控制功能上,正視當(dāng)前存在的差距和不足,堅(jiān)定落地「低價(jià)高質(zhì)策略」也將帶來(lái)真正的行業(yè)革新。

從產(chǎn)業(yè)來(lái)看,虛擬陪伴、AI偶像、音樂(lè)電臺(tái)、影視娛樂(lè)……都將隨著AI音樂(lè)能力的注入,讓多模態(tài)交互和體驗(yàn)升級(jí)產(chǎn)生新的可能。

不妨讓想象更狂野一點(diǎn):人類(lèi)和AI正在建立新的合作范式,而協(xié)作創(chuàng)作音樂(lè)就是一個(gè)極致的開(kāi)始。

人類(lèi)擅長(zhǎng)情感表達(dá)與審美判斷,AI 擅長(zhǎng)結(jié)構(gòu)生成與無(wú)限延展。當(dāng)二者結(jié)合,創(chuàng)作不再是單向度的勞動(dòng),而是碳基與硅基的共創(chuàng),既具備技術(shù)的精確性,又不失人性的溫度。

純粹的AI音樂(lè)作品仍顯生硬,而人類(lèi)藝術(shù)家的特權(quán)和創(chuàng)造力也正在喪失。通過(guò)「碳基+硅基」的組合,MiniMax讓我看到了硅碳合一的未來(lái)。


從2023年的Talkie讓我看到多模態(tài)融合陪伴,到海螺AI的一念成真、視覺(jué)重塑,以及MiniMax Agent對(duì)效率生產(chǎn)方式的重新組織,再到今天的Music 1.5,正在書(shū)寫(xiě)音樂(lè)新歷史。

原本的設(shè)想里, AI 音樂(lè)有機(jī)會(huì)真正走進(jìn)B 端與 C 端的雙重舞臺(tái)

B 端:廣告、游戲、影視配樂(lè),AI 音樂(lè)能顯著降低成本。C 端:個(gè)人用戶(hù)、短視頻創(chuàng)作者、樂(lè)隊(duì)玩家,隨手生成高質(zhì)量的原創(chuàng)曲,不再受限于版權(quán)與門(mén)檻。

現(xiàn)在想來(lái),碳基和硅基邊界的重新厘定、人和AI的融合創(chuàng)作與消費(fèi),都將徹底顛覆現(xiàn)有的一切。十年后回看,今天的作曲家、音樂(lè)制作人,也許和千百年前的樂(lè)師沒(méi)有本質(zhì)區(qū)別,而迥乎不同的,是AI音樂(lè)。

最后分享一個(gè)小彩蛋:把DeepSeek瘋狂思考輸出的名場(chǎng)面寫(xiě)成一首歌。


AI時(shí)代,你的歌,你說(shuō)了算……

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
主席唯一曾孫子毛東東,今年22歲身高1米87,出生日期很有寓意!

主席唯一曾孫子毛東東,今年22歲身高1米87,出生日期很有寓意!

霽寒飄雪
2025-08-22 09:20:08
不再執(zhí)教全紅嬋?陳若琳生日,陳芋汐慶生,誰(shuí)注意全紅嬋舉動(dòng)

不再執(zhí)教全紅嬋?陳若琳生日,陳芋汐慶生,誰(shuí)注意全紅嬋舉動(dòng)

樂(lè)聊球
2025-12-28 11:46:04
天下要大亂了,美國(guó)公布最新戰(zhàn)略:為了中國(guó),特朗普決心放棄世界

天下要大亂了,美國(guó)公布最新戰(zhàn)略:為了中國(guó),特朗普決心放棄世界

現(xiàn)代小青青慕慕
2025-12-28 14:32:43
林強(qiáng)涉案989億被抓!生活奢華超過(guò)中東富豪,妻子、父母也有責(zé)任

林強(qiáng)涉案989億被抓!生活奢華超過(guò)中東富豪,妻子、父母也有責(zé)任

動(dòng)漫里的童話(huà)
2025-12-28 15:59:37
南博風(fēng)波后續(xù):全網(wǎng)追查“借畫(huà)不還”的神秘老同志,揭開(kāi)歷史迷霧

南博風(fēng)波后續(xù):全網(wǎng)追查“借畫(huà)不還”的神秘老同志,揭開(kāi)歷史迷霧

公子麥少
2025-12-21 14:54:43
日本的第二大強(qiáng)援出現(xiàn)!高市早苗拍板,要在中國(guó)周邊打造一張巨網(wǎng)

日本的第二大強(qiáng)援出現(xiàn)!高市早苗拍板,要在中國(guó)周邊打造一張巨網(wǎng)

時(shí)時(shí)有聊
2025-12-28 12:23:00
真當(dāng)中國(guó)不敢動(dòng)手?中方向全世界宣布:退出1900億大項(xiàng)目

真當(dāng)中國(guó)不敢動(dòng)手?中方向全世界宣布:退出1900億大項(xiàng)目

趣史微視頻
2025-12-28 17:58:19
時(shí)機(jī)已到,大陸開(kāi)始收網(wǎng),2道通緝令發(fā)往臺(tái)島,臺(tái)當(dāng)局后果自負(fù)

時(shí)機(jī)已到,大陸開(kāi)始收網(wǎng),2道通緝令發(fā)往臺(tái)島,臺(tái)當(dāng)局后果自負(fù)

Ck的蜜糖
2025-12-28 13:56:34
“后悔來(lái)清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

“后悔來(lái)清華參觀,自取其辱”,母親帶娃游清華,被食堂氣到失控

詩(shī)意世界
2025-11-30 11:04:47
萊利預(yù)言成真,火箭擺出終極陣容!杜蘭特笑納大勝申京成唯一輸家

萊利預(yù)言成真,火箭擺出終極陣容!杜蘭特笑納大勝申京成唯一輸家

鍋?zhàn)踊@球
2025-12-28 13:10:00
南博事件新證據(jù)!龐叔令律師:龐家捐贈(zèng)的江南春,不是曝光的兩幅

南博事件新證據(jù)!龐叔令律師:龐家捐贈(zèng)的江南春,不是曝光的兩幅

火山詩(shī)話(huà)
2025-12-26 07:14:22
真不想動(dòng)武!美國(guó)扣押中國(guó)油輪后,中國(guó)在聯(lián)合國(guó)連說(shuō)6個(gè)“反對(duì)”

真不想動(dòng)武!美國(guó)扣押中國(guó)油輪后,中國(guó)在聯(lián)合國(guó)連說(shuō)6個(gè)“反對(duì)”

文史旺旺旺
2025-12-27 18:22:12
什么菜?讓無(wú)數(shù)上海小囡瑟瑟發(fā)抖?網(wǎng)友集體報(bào)菜名!看懂的人都暴露年齡了

什么菜?讓無(wú)數(shù)上海小囡瑟瑟發(fā)抖?網(wǎng)友集體報(bào)菜名!看懂的人都暴露年齡了

上觀新聞
2025-12-28 14:31:15
西安光機(jī)所重大突破!

西安光機(jī)所重大突破!

芯榜
2025-12-27 12:05:55
Lisa在圣誕節(jié)二登瘋馬秀,由男友三公子陪同,直接打臉洗白的粉絲

Lisa在圣誕節(jié)二登瘋馬秀,由男友三公子陪同,直接打臉洗白的粉絲

芊手若
2025-12-26 15:32:19
萬(wàn)萬(wàn)沒(méi)想到,畢福劍敗光的體面,如今被29歲“丑女兒”掙回來(lái)了!

萬(wàn)萬(wàn)沒(méi)想到,畢福劍敗光的體面,如今被29歲“丑女兒”掙回來(lái)了!

知鑒明史
2025-09-03 18:55:30
美媒:若開(kāi)拓者擺爛瀚森將成最大受益者 交易兩人能為他打開(kāi)局面

美媒:若開(kāi)拓者擺爛瀚森將成最大受益者 交易兩人能為他打開(kāi)局面

羅說(shuō)NBA
2025-12-28 06:53:32
袁天罡農(nóng)家躲雨,主人只掃屋心,他面色驟變:三代之內(nèi)必出大人物

袁天罡農(nóng)家躲雨,主人只掃屋心,他面色驟變:三代之內(nèi)必出大人物

小豫講故事
2025-12-28 06:00:08
“早餐這么豐盛,女兒還翻白眼”,2.2w人怒了:讓她餓肚子上學(xué)!

“早餐這么豐盛,女兒還翻白眼”,2.2w人怒了:讓她餓肚子上學(xué)!

卷史
2025-12-26 21:18:25
下車(chē)救人還是肇事逃逸?警方回應(yīng):真的是下車(chē)救人,網(wǎng)友們別再誤會(huì)了

下車(chē)救人還是肇事逃逸?警方回應(yīng):真的是下車(chē)救人,網(wǎng)友們別再誤會(huì)了

封面新聞
2025-12-28 13:05:04
2025-12-28 19:04:49
闌夕 incentive-icons
闌夕
最具觀點(diǎn)的互聯(lián)網(wǎng)商業(yè)評(píng)論
2408文章數(shù) 73948關(guān)注度
往期回顧 全部

科技要聞

特斯拉將在華布局自動(dòng)駕駛?記者求證→

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當(dāng)過(guò)2年幼兒園老師

頭條要聞

杭州"兔子警官"哄孩子式執(zhí)法火了 曾當(dāng)過(guò)2年幼兒園老師

體育要聞

83分鐘絕殺!曼城2-1年度收官:英超6連勝狂飆

娛樂(lè)要聞

白敬亭現(xiàn)身冰雪大世界 拍視頻還翻車(chē)了

財(cái)經(jīng)要聞

英偉達(dá)的收購(gòu)史

汽車(chē)要聞

理想的2026:L9不容有失,i9再戰(zhàn)純電?

態(tài)度原創(chuàng)

教育
房產(chǎn)
親子
公開(kāi)課
軍事航空

教育要聞

于潔:教師怎樣走出這10個(gè)認(rèn)知誤區(qū)

房產(chǎn)要聞

降維打擊!三亞CBD驚現(xiàn)“豪宅新王”,高端局要變天了!

親子要聞

千萬(wàn)別把孩子,養(yǎng)成這種“奴隸”?

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

與特朗普會(huì)晤前 澤連斯基亮明“紅線”

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版