国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

硅基日?qǐng)?bào):前字節(jié)視覺(jué)大模型 AI 平臺(tái)負(fù)責(zé)人加入美團(tuán);面壁智能上線(xiàn)新端到端 TTS 模型 VoxCPM 1.5

0
分享至


據(jù)《智能涌現(xiàn)》獲悉,前閃極AI 合伙人、前字節(jié)視覺(jué)大模型 AI 平臺(tái)負(fù)責(zé)人潘欣,近期已經(jīng)加入美團(tuán)。

據(jù)悉,潘欣曾任谷歌大腦(Google Deepmind)研究員,推動(dòng) TensorFlow 動(dòng)態(tài)圖模式開(kāi)發(fā)。

12 月 10 日,面壁智能宣布,面向高擬真語(yǔ)音生成的新型端到端 TTS 模型 VoxCPM 1.5 版本正式上線(xiàn)。目前,模型已在 Github、Hugging Face 開(kāi)源。

過(guò)去一天,國(guó)內(nèi)外AI行業(yè)還有更多熱點(diǎn)可以關(guān)注,烏鴉君帶你一起看看。

大模型

1)前字節(jié)視覺(jué)大模型 AI 平臺(tái)負(fù)責(zé)人加入美團(tuán)

據(jù)《智能涌現(xiàn)》獲悉,前閃極AI 合伙人、前字節(jié)視覺(jué)大模型 AI 平臺(tái)負(fù)責(zé)人潘欣,近期已經(jīng)加入美團(tuán)。據(jù)悉,潘欣曾任谷歌大腦(Google Deepmind)研究員,推動(dòng) TensorFlow 動(dòng)態(tài)圖模式開(kāi)發(fā)。

回國(guó)后,他先后在百度、騰訊與字節(jié)跳動(dòng)任職。具體來(lái)看,百度期間,潘欣曾主導(dǎo)PaddlePaddle 平臺(tái)優(yōu)化、無(wú)量深度學(xué)習(xí)框架構(gòu)建,而后任騰訊、字節(jié)跳動(dòng) AIGC 和視覺(jué)大模型 AI 平臺(tái)負(fù)責(zé)人,業(yè)務(wù)方向集中在多模態(tài)領(lǐng)域。

此后,2024 年 11 月,其加入閃極科技,擔(dān)任 AI 合伙人,整體負(fù)責(zé) AI 技術(shù)研發(fā)及智能眼鏡項(xiàng)目。據(jù)了解,入職美團(tuán)后,潘欣負(fù)責(zé)多模態(tài) AI 創(chuàng)新工作,主導(dǎo)了 LongCat App 等多個(gè)相關(guān)應(yīng)用的開(kāi)發(fā)。

2)理想自動(dòng)駕駛負(fù)責(zé)人回應(yīng)宇樹(shù)王興興對(duì)VLA 質(zhì)疑

今年8 月的2025 年世界機(jī)器人大會(huì)上,宇樹(shù)科技 CEO 王興興表示當(dāng)下火熱的 VLA 模型(視覺(jué)-語(yǔ)言-動(dòng)作)是「相對(duì)比較傻瓜式的架構(gòu)」,并表示「保持比較懷疑的態(tài)度」。針對(duì)王興興的質(zhì)疑,理想自動(dòng)駕駛負(fù)責(zé)人「郎咸朋」昨日發(fā)文回應(yīng)。

郎咸朋表示,8 月沒(méi)有及時(shí)提出自己觀點(diǎn),是因?yàn)槔硐?VLA 司機(jī)大模型還沒(méi)正式發(fā)布,空口無(wú)憑,并且其對(duì)具身機(jī)器人行業(yè),還處于密切關(guān)注階段。

郎咸朋指出,自己與王興興觀點(diǎn)最不一樣的地方在于,王興興認(rèn)為模型架構(gòu)更重要,但自己認(rèn)為模型的關(guān)鍵是要與整個(gè)具身智能系統(tǒng)適配,在此基礎(chǔ)上,數(shù)據(jù)是起決定意義的。

郎咸朋通過(guò) VLA 以及具身智能兩個(gè)方面進(jìn)行解釋?zhuān)?/p>

VLA


在某些場(chǎng)景下理想的VLA 已經(jīng)具備了對(duì)物理世界的認(rèn)知涌現(xiàn),具體表現(xiàn)是用戶(hù)會(huì)越來(lái)越多的發(fā)現(xiàn)之前端到端沒(méi)有的擬人行為。

世界模型更適合做「考場(chǎng)」而不是「考生」。世界模型的高算力需求(訓(xùn)練和推理都是)決定了它更適合在云端做數(shù)據(jù)生成和極度逼真的仿真測(cè)試和強(qiáng)化訓(xùn)練。

在自動(dòng)駕駛領(lǐng)域,脫離了海量真實(shí)數(shù)據(jù)談模型架構(gòu)都是空中樓閣。理想之所以堅(jiān)持VLA,是因?yàn)閾碛袛?shù)百萬(wàn)輛車(chē)構(gòu)建的數(shù)據(jù)閉環(huán),這讓理想能在當(dāng)前算力下,把駕駛水平做到接近人類(lèi)。

具身智能


要想做好自動(dòng)駕駛,必須先把自動(dòng)駕駛當(dāng)作完整的具身智能系統(tǒng)對(duì)待,每一部分在研發(fā)過(guò)程中要相互配合才能將價(jià)值發(fā)揮出來(lái)。需要做到全棧自研,不僅僅是軟件棧,而是整體軟硬全棧。

模型的關(guān)鍵是要與整個(gè)具身智能系統(tǒng)適配,在此基礎(chǔ)上,數(shù)據(jù)是起決定意義的。在機(jī)器人領(lǐng)域獲取數(shù)據(jù)相對(duì)困難,但在自動(dòng)駕駛領(lǐng)域,特別是建立起數(shù)據(jù)閉環(huán)能力的車(chē)企來(lái)說(shuō)并不是大問(wèn)題。

3)面壁智能上線(xiàn)新端到端 TTS 模型 VoxCPM 1.5

12 月 10 日,面壁智能宣布,面向高擬真語(yǔ)音生成的新型端到端 TTS 模型 VoxCPM 1.5 版本正式上線(xiàn)??焖倏幢敬紊?jí)亮點(diǎn):


高采樣音頻克隆:AudioVAE 采樣率從 16kHz 提升至 44.1kHz ,模型可根據(jù)高質(zhì)量音頻,克隆效果更佳、細(xì)節(jié)更豐富的聲音;

生成效率翻倍:在模型參數(shù)有所增加的前提下,VoxCPM 1.5 僅需 6.25 個(gè) token 即可生成 1 秒音頻,較此前版本提高一倍,在保持速度的同時(shí)提升了音頻生成質(zhì)量;

開(kāi)發(fā)者友好:新增LoRA 和全量微調(diào)腳本,支持深度定制;

增強(qiáng)穩(wěn)定性:減少音頻偽影,優(yōu)化長(zhǎng)文本音頻的生成效果。

目前,模型已在Github、Hugging Face 開(kāi)源。

AI應(yīng)用

1)Spotify 測(cè)試更多個(gè)性化、人工智能驅(qū)動(dòng)的“推薦歌單”

Spotify周三宣布,將首次賦予用戶(hù)更多控制流媒體服務(wù)算法的權(quán)力。至少該公司是這樣描述其全新“推廣歌單”功能的推出的,該功能最初將面向新西蘭的Premium會(huì)員開(kāi)放。

據(jù)Spotify 稱(chēng),該功能目前僅支持英語(yǔ),仍處于測(cè)試階段,在推廣到其他市場(chǎng)之前還會(huì)不斷完善。

據(jù)該公司稱(chēng),這項(xiàng)新工具允許用戶(hù)描述他們想在個(gè)性化歌單中聽(tīng)到的內(nèi)容,從而反映出他們完整的音樂(lè)品味歷程。這意味著歌單不僅關(guān)注你現(xiàn)在喜歡的歌曲,還關(guān)注你從注冊(cè)Spotify第一天起的所有收聽(tīng)記錄——該公司表示,這正是該功能與其他歌單功能的區(qū)別所在。

2)谷歌正在部分出版物的谷歌新聞頁(yè)面上測(cè)試人工智能驅(qū)動(dòng)的文章概述功能

谷歌周三宣布,作為一項(xiàng)新的試點(diǎn)計(jì)劃的一部分,谷歌正在參與的出版物的谷歌新聞頁(yè)面上測(cè)試人工智能驅(qū)動(dòng)的文章概述。

參與試點(diǎn)項(xiàng)目的媒體包括《明鏡周刊》、《國(guó)家報(bào)》、《圣保羅頁(yè)報(bào)》、《Infobae》、《羅盤(pán)報(bào)》、《衛(wèi)報(bào)》、《印度時(shí)報(bào)》、《華盛頓觀察家報(bào)》和《華盛頓郵報(bào)》等。

谷歌在一篇博文中表示,這項(xiàng)新的商業(yè)合作計(jì)劃旨在“探索人工智能如何提升用戶(hù)參與度” 。作為這項(xiàng)人工智能試點(diǎn)計(jì)劃的一部分,谷歌將與出版商合作,在谷歌新聞中測(cè)試新功能。

谷歌表示,通過(guò)添加人工智能驅(qū)動(dòng)的文章摘要,用戶(hù)在點(diǎn)擊閱讀全文之前可以獲得更多背景信息。雖然人工智能生成的摘要可能會(huì)導(dǎo)致新聞文章的點(diǎn)擊量下降,但參與商業(yè)試點(diǎn)項(xiàng)目的媒體機(jī)構(gòu)將直接收到谷歌的付款,這或許可以彌補(bǔ)其網(wǎng)站流量可能出現(xiàn)的減少。

PS:如果你對(duì)AI大模型領(lǐng)域有獨(dú)特的看法,歡迎掃碼加入我們的大模型交流群。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
荒誕!反向騙取電詐團(tuán)伙1800元,不但無(wú)功,竟然還得坐牢?!

荒誕!反向騙取電詐團(tuán)伙1800元,不但無(wú)功,竟然還得坐牢?!

阿陸
2026-01-11 15:27:57
特朗普:格陵蘭島僅靠狗拉雪橇進(jìn)行防衛(wèi),美國(guó)無(wú)論如何都要拿下格陵蘭島

特朗普:格陵蘭島僅靠狗拉雪橇進(jìn)行防衛(wèi),美國(guó)無(wú)論如何都要拿下格陵蘭島

Ck的蜜糖
2026-01-12 11:59:13
中俄相繼出手后,不到24小時(shí),特朗普下令放人,取消第二波打擊

中俄相繼出手后,不到24小時(shí),特朗普下令放人,取消第二波打擊

小鬼頭體育
2026-01-11 07:39:16
離婚19年,朱玲玲每周三仍回霍家吃飯。不是復(fù)婚,也不是演戲。

離婚19年,朱玲玲每周三仍回霍家吃飯。不是復(fù)婚,也不是演戲。

百態(tài)人間
2026-01-10 05:15:03
華為固態(tài)電池續(xù)航3000公里快充5分鐘全球領(lǐng)先

華為固態(tài)電池續(xù)航3000公里快充5分鐘全球領(lǐng)先

南風(fēng)不及你溫柔
2026-01-08 23:52:47
天津宜家亂成一鍋粥,還有人總結(jié)了攻略...

天津宜家亂成一鍋粥,還有人總結(jié)了攻略...

全接觸狐狐
2026-01-12 09:34:14
勇士慘敗老鷹,庫(kù)巴空砍61分!CJ首秀12分!一戰(zhàn)看清以下9名球星

勇士慘敗老鷹,庫(kù)巴空砍61分!CJ首秀12分!一戰(zhàn)看清以下9名球星

毒舌NBA
2026-01-12 12:07:38
格陵蘭值多少錢(qián)

格陵蘭值多少錢(qián)

霹靂炮
2026-01-11 22:55:22
本文含“馬”量極高,馬年得馬住了

本文含“馬”量極高,馬年得馬住了

精品購(gòu)物指南
2026-01-09 19:11:09
難怪生下四個(gè)娃的印度女高管能被馬斯克獨(dú)寵,你看梅耶怎么評(píng)價(jià)她

難怪生下四個(gè)娃的印度女高管能被馬斯克獨(dú)寵,你看梅耶怎么評(píng)價(jià)她

以茶帶書(shū)
2025-12-02 20:09:08
火箭4換1、熱火3換1!莫蘭特最實(shí)在的6個(gè)交易方案:KD親自招募?

火箭4換1、熱火3換1!莫蘭特最實(shí)在的6個(gè)交易方案:KD親自招募?

毒舌NBA
2026-01-12 09:45:42
中央已明確落實(shí):“兩延一彈一自愿”,2026年退休如何選擇更劃算

中央已明確落實(shí):“兩延一彈一自愿”,2026年退休如何選擇更劃算

夜深?lèi)?ài)雜談
2026-01-11 19:29:48
退出國(guó)家隊(duì),赴德國(guó)打球后離婚,如今已過(guò)去24年,丁松現(xiàn)狀如何?

退出國(guó)家隊(duì),赴德國(guó)打球后離婚,如今已過(guò)去24年,丁松現(xiàn)狀如何?

比利
2026-01-09 12:18:11
俄方爆料!“美軍一開(kāi)始就沒(méi)打算讓任何人活下來(lái)”

俄方爆料!“美軍一開(kāi)始就沒(méi)打算讓任何人活下來(lái)”

浙江之聲
2026-01-11 18:23:51
烏克蘭首都基輔響起強(qiáng)烈爆炸聲

烏克蘭首都基輔響起強(qiáng)烈爆炸聲

每日經(jīng)濟(jì)新聞
2026-01-12 09:19:06
河南新蔡縣學(xué)生校內(nèi)死亡事件:權(quán)力輕視程序,民眾可以質(zhì)疑

河南新蔡縣學(xué)生校內(nèi)死亡事件:權(quán)力輕視程序,民眾可以質(zhì)疑

臧啟玉律師
2026-01-11 17:18:18
在最狂野的病歷面前,科幻片也得靠邊站

在最狂野的病歷面前,科幻片也得靠邊站

不相及研究所
2026-01-11 22:49:37
749局高人自述:山海經(jīng)世界真的存在,國(guó)內(nèi)有多個(gè)入口,兩個(gè)遺址

749局高人自述:山海經(jīng)世界真的存在,國(guó)內(nèi)有多個(gè)入口,兩個(gè)遺址

神奇的錘子
2024-08-22 13:53:27
北汽的夢(mèng)幻開(kāi)局,讓教練無(wú)腦換人,北汽"牛B"以110:118深圳

北汽的夢(mèng)幻開(kāi)局,讓教練無(wú)腦換人,北汽"牛B"以110:118深圳

大眼瞄世界
2026-01-12 11:03:02
被批鞋子寒酸后,美國(guó)務(wù)卿在白宮穿上特朗普買(mǎi)的新鞋,盡管不合腳

被批鞋子寒酸后,美國(guó)務(wù)卿在白宮穿上特朗普買(mǎi)的新鞋,盡管不合腳

看盡人間百態(tài)
2026-01-11 13:03:39
2026-01-12 12:24:49
硅基觀察Pro incentive-icons
硅基觀察Pro
人工智能新時(shí)代的商業(yè)智庫(kù)和價(jià)值燈塔
787文章數(shù) 57關(guān)注度
往期回顧 全部

科技要聞

小米二手車(chē)價(jià)大跳水:SU7半年跌5萬(wàn)元

頭條要聞

媒體:美國(guó)"不演了" 特朗普直白表態(tài)震驚世界

頭條要聞

媒體:美國(guó)"不演了" 特朗普直白表態(tài)震驚世界

體育要聞

聰明的球員,不是教練教出來(lái)的

娛樂(lè)要聞

閆學(xué)晶:脫離群眾太久 忘了自己的根

財(cái)經(jīng)要聞

揭秘“穩(wěn)賺不賠”的代工項(xiàng)目騙局

汽車(chē)要聞

"家轎之王"變帥了 東風(fēng)日產(chǎn)全新軒逸量產(chǎn)下線(xiàn)

態(tài)度原創(chuàng)

房產(chǎn)
家居
本地
公開(kāi)課
軍事航空

房產(chǎn)要聞

66萬(wàn)方!4755套!三亞巨量房源正瘋狂砸出!

家居要聞

包絡(luò)石木為生 野性舒適

本地新聞

云游內(nèi)蒙|“包”你再來(lái)?一座在硬核里釀出詩(shī)意的城

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

俄大使:馬杜羅夫婦被控制時(shí)身邊沒(méi)人

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版