国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

網(wǎng)民票選AI王者,LMArena一夜變17億美元獨角獸!

0
分享至

一場AI界的《創(chuàng)造101》火了!LMArena讓你盲投選出最強AI,三年從校園項目逆襲,剛剛?cè)?.5億美元,估值飆到17億美元。眾包投票挑戰(zhàn)專家權(quán)威,爭議四起,卻已成行業(yè)標桿。你的票,就能決定下一個AI頂流!

一場AI界的《創(chuàng)造101》火了!

ChatGPT、Claude、Gemini、Grok等一眾AI「練習生」整齊站好,緊張等待公演。

這不是選秀節(jié)目,而是真實發(fā)生在lmarena.ai上的AI大亂斗。

這個曾經(jīng)的校園開源小項目,最近剛?cè)诘?.5億美元,估值17億美元。

頂級AI實驗室如OpenAI、Google、xAI、Microsoft,都搶著把自家模型送來「試鏡」。

現(xiàn)在,AI強弱不再是大公司自己說了算,決定權(quán)掌握在全球網(wǎng)民手上。

這場「AI創(chuàng)造營」到底怎么玩?誰會成為下一個出道頂流?讓我們一起揭秘。

LMArena的「選秀起源」

從校園項目到硅谷舞臺

一切要從2023年說起。當時,加州大學伯克利分校Sky Computing Lab里,一群研究生和教授搞了個開源小項目,叫Chatbot Arena。

創(chuàng)始人包括伯克利計算機科學教授Ion Stoica(Databricks聯(lián)合創(chuàng)始人)、研究生Anastasios Angelopoulos(現(xiàn)CEO)和Wei-Lin Chiang(現(xiàn)CTO)。


他們最初只是想做一個簡單實驗:讓網(wǎng)友匿名比拼不同AI聊天機器人,看哪個回答更好。

沒想到,這個項目一上線就火了,迅速變成AI圈最受歡迎的眾包基準平臺。

短短三年時間,Chatbot Arena就積累了海量用戶。2025年5月,它正式轉(zhuǎn)為營利性公司,更名為LMArena,并完成1億美元種子輪融資,估值6億美元。

轉(zhuǎn)折點發(fā)生在2026年1月6日——就在昨天!

LMArena宣布完成1.5億美元新一輪融資,由Felicis和加州大學投資臂聯(lián)合領投,Andreessen Horowitz、The House Fund、LDVP、Kleiner Perkins、Lightspeed Venture Partners等明星機構(gòu)跟投。

公司估值直接飆升到17億美元,總?cè)谫Y額超過2.5億美元!

如今,LMArena已經(jīng)擁有超過500萬月活躍用戶,覆蓋150個國家,每月產(chǎn)生超過6000萬次對話。

這些用戶像是投票的「全民制作人」。連最頂級AI實驗室,都把自家最新模型悄悄送來PK。


從一個學術(shù)小實驗,到硅谷新貴,LMArena用三年時間完成了許多選秀冠軍都羨慕的逆襲。

但真正讓它火起來的秘密武器,正是那個簡單卻上癮的「盲盒PK」投票機制。

盲盒PK與網(wǎng)民投票

「全民制作人」的權(quán)利游戲

選秀節(jié)目的高潮,是舞臺公演和現(xiàn)場打投。LMArena的「公演舞臺」也一樣刺激:它叫Arena模式,核心就是一個字——盲!

打開lmarena.ai,進入戰(zhàn)斗模式,隨便輸入一個問題,系統(tǒng)開始隨機匹配兩個匿名AI模型,同時給出答案。

你不知道是誰生成的,只能憑感覺投票。投完票,網(wǎng)站才會揭曉:哦,原來左邊是Gemini-3-Pro,右邊是Grok-4.1!

這種形式很像拆盲盒——公平又上癮。

總得票數(shù)也算入評分體系。LMArena用Elo評分系統(tǒng)實時計算,每贏一次加分,輸了扣分。


7天前的總分榜單,Gemini-3-pro穩(wěn)居榜首

總得分匯總之后,還會公開不同類別的榜單:文本對話、網(wǎng)頁開發(fā)、視覺理解文本生成圖像、圖像編輯、搜索、甚至文本/圖像生成視頻。

在熱門類別里,Gemini-3-Pro在文本和視覺領域遙遙領先,Grok-4.1-thinking緊追不舍,而圖像編輯里GPT-Image-1.5和Gemini的變種輪流霸榜。

怎么一場「選秀比賽」能引得這些頂級模型下場?CEO Anastasios Angelopoulos揭開真相:

領先的AI公司用我們,是因為他們自己都很難判斷模型到底好不好。

還沒公開發(fā)布的新模型,都會偷偷托管到LMArena先測試一下,拿網(wǎng)友反饋快速更新迭代。

網(wǎng)友也不只是實驗的小白鼠,甚至還有點爽——不用懂技術(shù),上手幾分鐘就能當「全民制作人」,把喜歡的AI投上C位。

數(shù)百萬張票匯成熱搜排行,誰上誰下,全看網(wǎng)友心情。

「黑幕」質(zhì)疑與「付費導師」的對決

選秀節(jié)目再火,也逃不過「黑幕」質(zhì)疑和粉絲撕X。LMArena同樣不例外——它一出道就卷入各種爭議,有人喊「太民主了」,有人罵「太亂了」。

吐槽最多的,是眾包投票容易被操縱。

2025年,一篇論文直接曝出黑幕:Meta在Llama 4發(fā)布前,偷偷提交了36個私有變體模型,反復測試「刷分」,成功gaming 排行榜。


研究者來自Cohere、Stanford、MIT等機構(gòu),直指頂級實驗室能通過多次私測優(yōu)化,中小玩家根本玩不起。

類似指控還有:某些大公司被懷疑刷票或優(yōu)先托管新模型,讓排行榜看起來「偏心」。

還有人認為,網(wǎng)民投票不夠?qū)I(yè)。隨便一個網(wǎng)友的票,怎么能跟專家比?

這就牽扯出最大競爭對手——Scale AI。Scale的評價方式完全不同:他們花大錢雇傭付費專家,比如律師、教授、醫(yī)生,來給AI答案打分。

2025年9月,Scale直接推出「Seal Showdown」平臺,公開叫板 LMArena,宣稱自己的方法更有代表性、更嚴謹,避免了眾包的噪音和偏見。


聯(lián)合創(chuàng)始人Ion Stoica去年接受采訪時說過:

最高質(zhì)量的評估——黃金標準——就是讓人們在自己熟悉的話題上投票。

他們認為,用戶對自家問題最懂,能給出最誠實的反饋;付費專家反而可能有偏見或不接地氣。

而且,全球150國用戶的多樣性,讓排行榜更全面,避免了單一文化霸權(quán)。

爭議歸爭議,LMArena的排行榜還是成了行業(yè)事實標準——大公司照樣搶著上。

但選秀不會止步于打投,LMArena已經(jīng)在憋大招。

從排行榜到「AI經(jīng)紀公司」

選秀冠軍出道后,最興奮的莫過于「后續(xù)規(guī)劃」:開演唱會、拍綜藝、接代言,還是轉(zhuǎn)型演員?

LMArena也一樣它不滿足于只辦比賽,已經(jīng)在準備進化成AI界的「全能經(jīng)紀公司」。

新一輪1.5億美元融資,主要就是砸在這上面。

公司公告明確表示,資金將用于大規(guī)模擴充計算資源、招聘頂級工程師,并推出企業(yè)級AI評估服務。


以后,LMArena不光讓網(wǎng)友玩盲測,還會為OpenAI、Google、xAI這樣的大廠提供付費專業(yè)評估,幫他們跑模型、收集反饋、生成報告,甚至深度定制基準測試。

LMArena在強化學習方向同樣野心勃勃。聯(lián)合創(chuàng)始人Ion Stoica早前就透露過,公司正考慮用海量用戶投票數(shù)據(jù)來訓練AI模型——這就是傳說中的RLHF(Reinforcement Learning from Human Feedback,人類反饋強化學習)。

把「好回答」當獎勵、「差回答」當懲罰,讓AI像練習生苦練舞蹈一樣,不斷優(yōu)化自己。

投資者、Felicis合伙人Peter Deng在采訪中直言:

一旦成為事實上的基準層,產(chǎn)品自然會擴展。真正價值在于與AI實驗室的深度合作——結(jié)合他們的內(nèi)部數(shù)據(jù)和我們的比較外部數(shù)據(jù)?!?/p>

這場「AI創(chuàng)造營」才剛剛開播,高潮還在后頭。

LMArena用三年時間證明了一個瘋狂的事實——在AI時代,眾包的力量能碾壓傳統(tǒng)專家,民主投票能成為最鋒利的標尺。

更重要的是,它把我們從旁觀者變成了主角。你的每一張票,不只決定了今天的排行榜C位,還可能在悄無聲息中塑造明天的超級AI。

ChatGPT、Grok、Gemini……誰能持續(xù)霸榜,誰又會突然被黑馬反超,全看我們這些「全民制作人」的心情。

AI的未來不再遙遠,它就藏在你的下一票里。

參考資料:

https://www.theinformation.com/articles/ai-evaluation-startup-lmarena-valued-1-7-billion-new-funding-round?rc=epv9gi

文章來源:新智元。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
燃盡了!巴薩3-0大勝馬競!止步國王杯半決賽,拼盡全力不負熱愛

燃盡了!巴薩3-0大勝馬競!止步國王杯半決賽,拼盡全力不負熱愛

球叮足球
2026-03-04 09:28:05
浙大研究:喜歡吃面大量放醋的人,不出半年,血管或有3個變化!

浙大研究:喜歡吃面大量放醋的人,不出半年,血管或有3個變化!

搖感軍事
2025-12-12 22:05:56
痛心!江西跑友劉濤去世,僅51歲,生前堅持晨跑,是3家公司老板

痛心!江西跑友劉濤去世,僅51歲,生前堅持晨跑,是3家公司老板

離離言幾許
2026-02-25 10:43:45
看上海外婆,再看北京姥姥,我悟了:老了盡量少戴黃金、穿老年裝

看上海外婆,再看北京姥姥,我悟了:老了盡量少戴黃金、穿老年裝

孤傲何妨初
2026-03-03 14:35:38
空手套白狼!幾乎沒有代價,喜獲三位優(yōu)質(zhì)球員,這才是頂級管理層

空手套白狼!幾乎沒有代價,喜獲三位優(yōu)質(zhì)球員,這才是頂級管理層

禾三千體育
2026-03-04 08:58:08
王炸落地!北京2026地鐵狂飆,跨省直通河北,百萬通勤族苦盡甘來

王炸落地!北京2026地鐵狂飆,跨省直通河北,百萬通勤族苦盡甘來

黑哥講現(xiàn)代史
2026-03-04 04:43:40
永遠不要攻擊孩子的人格:毀掉一個孩子,這幾句話就夠了

永遠不要攻擊孩子的人格:毀掉一個孩子,這幾句話就夠了

木言觀
2026-02-09 21:59:55
伊朗重生:德黑蘭的“屈服”與新中東的誕生

伊朗重生:德黑蘭的“屈服”與新中東的誕生

民間胡扯老哥
2026-03-03 07:01:21
C羅或已離開沙特!價值6100萬鎊的私人飛機,已抵達馬德里

C羅或已離開沙特!價值6100萬鎊的私人飛機,已抵達馬德里

懂個球
2026-03-03 16:49:28
盯上了“下一個安世”?荷蘭嘗到甜頭后,準備再次對華虎口奪食?

盯上了“下一個安世”?荷蘭嘗到甜頭后,準備再次對華虎口奪食?

小影的娛樂
2026-03-03 19:13:45
再見開拓者!22.7分5.6籃板新星被裁!楊瀚森呀楊瀚森!說你啥呢

再見開拓者!22.7分5.6籃板新星被裁!楊瀚森呀楊瀚森!說你啥呢

現(xiàn)代小青青慕慕
2026-03-03 10:57:39
豆包推薦:人生回報率最高的8件事,盡早“焊死”在孩子身上

豆包推薦:人生回報率最高的8件事,盡早“焊死”在孩子身上

十點讀書
2026-02-20 18:37:13
貧窮限制了我的想象,中東戰(zhàn)火燃起,又炸出娛樂圈的一大波有錢人

貧窮限制了我的想象,中東戰(zhàn)火燃起,又炸出娛樂圈的一大波有錢人

魔都姐姐雜談
2026-03-03 10:25:53
哈梅內(nèi)伊死得不冤!內(nèi)賈德早就提醒過政府,伊朗高層內(nèi)有大內(nèi)奸

哈梅內(nèi)伊死得不冤!內(nèi)賈德早就提醒過政府,伊朗高層內(nèi)有大內(nèi)奸

欽點歷史
2026-03-04 09:12:51
這一次,伊朗領導人的慘痛遭遇,再一次印證了毛主席的高瞻遠矚

這一次,伊朗領導人的慘痛遭遇,再一次印證了毛主席的高瞻遠矚

夢史
2026-03-02 11:21:33
凌晨2點浦東機場!4個18歲女孩差2分鐘飛泰國,看完后背發(fā)涼

凌晨2點浦東機場!4個18歲女孩差2分鐘飛泰國,看完后背發(fā)涼

瓜哥的動物日記
2026-03-03 01:09:36
華裔天才少年成百億富翁,曾獻計特朗普,阻止中國AI技術(shù)搶跑

華裔天才少年成百億富翁,曾獻計特朗普,阻止中國AI技術(shù)搶跑

明天見灌裝冰塊
2026-03-03 20:21:29
劉亦菲至今未婚:不是沒人追,是她身上根本沒有“性緣氣質(zhì)”

劉亦菲至今未婚:不是沒人追,是她身上根本沒有“性緣氣質(zhì)”

手工制作阿殲
2026-03-03 04:00:24
柯文哲曾言:大陸若膽敢對臺灣出手,我隨隨便便就能讓大陸癱瘓?

柯文哲曾言:大陸若膽敢對臺灣出手,我隨隨便便就能讓大陸癱瘓?

鯨探所長
2026-02-25 09:33:46
伊朗之戰(zhàn),正出現(xiàn)三個新動向

伊朗之戰(zhàn),正出現(xiàn)三個新動向

牛彈琴
2026-03-04 08:11:49
2026-03-04 10:36:49
算法與數(shù)學之美 incentive-icons
算法與數(shù)學之美
分享知識,交流思想
5389文章數(shù) 64616關(guān)注度
往期回顧 全部

科技要聞

新MacBook Pro首發(fā)M5 Pro/Max芯片 17999起

頭條要聞

牛彈琴:伊朗選出新的最高領袖 一個更不可能妥協(xié)的人

頭條要聞

牛彈琴:伊朗選出新的最高領袖 一個更不可能妥協(xié)的人

體育要聞

35輪后積分-7,他們遭遇史上最早的降級

娛樂要聞

謝娜霸氣護夫:喊話薛之謙給張杰道歉

財經(jīng)要聞

伊朗,正在打破特朗普的幻想

汽車要聞

第一梯隊輔助駕駛加持 iCAR V27定檔3月13日上市

態(tài)度原創(chuàng)

房產(chǎn)
親子
時尚
游戲
本地

房產(chǎn)要聞

狂銷13億!近百位三亞頂豪買家,都在All in超級地中?!倫偅?/h3>

親子要聞

金馬賀歲,愿你策馬揚鞭,萬事如意步步高!

今年春天的半裙,很“?!?!

《全境封鎖2》最新更新規(guī)劃 新DLC2026年推出

本地新聞

食味印象|一口入魂!康樂烤肉串起千年絲路香

無障礙瀏覽 進入關(guān)懷版