国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網易首頁 > 網易號 > 正文 申請入駐

“日本最強AI”光速塌房,都怪中國DeepSeek太強?

0
分享至



作者|Hayward

原創(chuàng)首發(fā)|藍字計劃

連日本人自己都繃不住了。

3月17日,日本科技公司樂天高調發(fā)布了新一代AI大模型Rakuten AI 3.0,宣稱是日本最大、性能最強的AI大模型。



這款模型來頭不小:一方面,它背后有日本經濟產業(yè)省支持的GENIAC項目站臺,算是“國家隊”級別的大模型;另一方面,它還擁有一個相當唬人的標簽,7000億參數

這什么概念?

哪怕按更具體的口徑來看,它的總參數規(guī)模也有671B,依然屬于當前開源模型里的第一梯隊,和DeepSeek V3坐一桌。

背靠日本國內最大靠山,參數又非常突出,對于這款模型的發(fā)布,樂天底氣十足,連“(日本)國產模型的逆襲”都喊出來了。



但是,日本網友還沒來得及為Rakuten AI 3.0開香檳,一場來自開源社區(qū)的技術打假就給他們澆了一盆冷水。

這款號稱“日本最強、性能最強”的大模型,竟然是咱們中國開源大模型,DeepSeek-V3的日語“套殼版”。



日本的榮光,卻出身不良

和絕大多數的打假“后知后覺”不同,Rakuten AI 3.0的吹牛行為甚至挺不過一個下午。

就在模型出來的幾個小時里,開源社區(qū)的大神們就發(fā)現,這款加上了非常多牛逼限定詞的AI大模型,有貓膩。

甚至樂天都沒有過多的“掩飾”,因為Rakuten AI 3.0赫然在Hugging Face上的config.json文件里寫著:

model_type: deepseek_v3

architectures: DeepseekV3ForCausalLM



這就相當于明牌告訴大家,這款模型的底層架構來自DeepSeek V3。

當然,DeepSeek V3作為一款開源模型,被學習、借鑒、使用來作為模型架構也正常不過,畢竟這就是開源的初心;

但Rakuten AI 3.0的問題在于,在發(fā)布的時候它絲毫沒有提及使用了DeepSeek V3的架構,還搬出了“自主研發(fā)”“日本最強”“日本最大”等限定詞,看上去真的是由樂天從0到1,自主鼓搗出來的大模型。



這也是開源社區(qū)最不滿的地方:這款模型在上傳的時候,沒有充分保留DeepSeek原有的歸屬/許可證聲明;直到被社區(qū)抓包之后,才悄悄地補上了NOTICE文件。



樂天的這種做法,顯然是違背了開源精神,“需要保留原許可證和歸屬”的要求。

在使出這一招“亡羊補牢”之后,別說路人,連日本網友都好感都敗光了。對于這款模型,日本網友都評論基本都是:

“GENIAC項目花納稅人的錢,就做個DeepSeek的日語fine-tune版?”

“自稱日本最大高性能,卻是中國的日語版。”





那么這款模型的性能怎么樣呢?

根據樂天官方陸續(xù)公布的數據,Rakuten AI 3.0的紙面成績其實相當能打。

像Japanese MT-Bench這樣的日語綜合基準,它已經跑贏了GPT-4o;而在日本文化理解、敬語表達、商務郵件、報告寫作、文檔分析這些更偏本土語境的任務里,表現也明顯很強。



再加上它雖然總參數接近7000億,但因為用了MoE稀疏架構,單次推理實際激活的參數并不高,成本還能被壓到相當前沿閉源模型的10%左右。



也就是說,這模型不只是“成績好看”,而且用起來還非常省錢。

但熟悉大模型的人一眼就看出了:這些不都是DeepSeek本來的優(yōu)勢嗎?

是的,畢竟是一款基于DeepSeek-V3架構、再做日語數據微調和本土化優(yōu)化的大模型,Rakuten AI 3.0的表現越是厲害,就越是能證明DeepSeek厲害,這也是X上相當一部分日本網友破防的點:

“日本政府用了納稅人的錢來支持你們,你們卻用來證明中國的DeepSeek牛逼?”

估計梁文鋒看到這出戲,做夢都得笑醒。

司空見慣的“抄襲”

但是,日本的網友們可能也有點“失憶癥”了,畢竟從日本AI大模型的發(fā)展歷程來看,抄襲,或者優(yōu)雅點說:“套殼”,不是常態(tài)嗎?

Rakuten AI 3.0可不是第一個使用了別家大模型架構作為基座的日本模型。

一個典型例子,是日本AI公司ABEJA在2025年4月左右推出的小型日語專精推理模型:ABEJA QwQ 32b。



光看這個名字,其實就已經名牌了。

畢竟連QwQ這個阿里千問系最標志性的前綴,它都懶得改。

而實際情況也差不多。

這款模型的底座,本來就是Qwen2.5 + QwQ-32B,ABEJA做的事情,說白了就是先拿千問模型做日語持續(xù)預訓練,再把推理能力整合進去,最后補一輪日語強化和微調。

本質上,它和樂天這次的路數并沒有什么不同:都是拿中國開源大模型當基座,再靠本土數據和場景去做一層“日本化”包裝。

只不過,ABEJA至少沒有把自己演成什么從0到1橫空出世的“日本最強原創(chuàng)模型”。

它不但把底座和訓練路徑寫清楚,連阿里那邊都沒有介意,阿里巴巴官方X賬號甚至還專門轉發(fā)慶祝,大意就是:ABEJA做的日語推理模型,成績已經超過了GPT-4o。

同樣是“套殼”,ABEJA當然也談不上多原創(chuàng),只不過人家至少沒有一邊踩著別人的底座,一邊還忙著擦腳印。

除了ABEJA和樂天,不少日本公司其實也大體走的是這條路。

像Lightblue、ELYZA這些做日語模型的玩家,底下是Qwen、Llama等現成底座,有的也會結合DeepSeek、Mistral這類強模型能力做本土化,上面再糊一層更懂日本企業(yè)文檔、客服語料、敬語語境、制造業(yè)日志的數據,把它調成一個“更會說日本話、更會干日本活”的版本。

日經新聞網之前曾報道過,“「AIモデルスコア」で 日本企業(yè)が開発した上位10モデルのうち、新興ABEJA(アベジャ)のモデルなど計6種がディープシークやQwenを基盤に開発されていた?!?/p>

翻譯過來,就是現在日本公司推出的前10大模型里,有6個都是基于DeepSeek或Qwen進行二次開發(fā)。

其實,這在AI圈本來也不算是什么原則性問題,全球AI行業(yè)現在本來就是這么玩的。

美國也好,歐洲也好,中國也好,別說二三線團隊了,很多一線團隊其實也在走這條路:拿Qwen做推理增強,拿DeepSeek做蒸餾和本地部署,拿Llama做行業(yè)版,拿Mistral做輕量化和邊緣場景。

畢竟,從頭訓練一個前沿基座,燒掉的是天文數字級別的算力、資金和人才;但如果你已經有了一個足夠強的開源底座,真正決定你能不能跑出來的,反而是后面的數據、場景和落地能力。

所以,樂天這次的“炎上”,本質不是因為“抄襲”而觸犯天條,而是干得太不體面了。

一邊吃著開源模型的紅利,一邊又拼命把自己往“自主研發(fā)”“日本最強”“日本最大”上靠;一邊站在DeepSeek的肩膀上,一邊又不愿把這件事說透,甚至連許可證和歸屬都都悄悄藏起來。

別人套殼,至少套得坦坦蕩蕩;樂天套殼,卻偏偏還想演成“全靠自己”。

又或許,樂天這次“不體面”的背后,折射出的,只是整個日本科技領域已經落后于世界的冰山一角。

日本IT業(yè),失落的30年

1990年,隨著經濟泡沫被刺破,整個日本都仿佛被按下了暫停鍵。

股價暴跌、地價跳水、不良債權爆發(fā)、銀行惜貸、企業(yè)連鎖倒閉……整個日本經濟像多米諾骨牌一樣接連崩塌,正式跌入“平成不況”,并由此開啟了失落的10年、20年,乃至30年。

而在這樣的背景下,日本IT行業(yè)的軌跡,也幾乎成了這場長期停滯的縮影。

關于日本的“笑話”大家已經看到非常多了:

都2024年了,日本政府居然還在和軟盤“決戰(zhàn)到天明”。



直到去年6月,日本數字廳才終于廢掉了1034條還要求用軟盤等介質提交材料的規(guī)定,只剩下一條和汽車回收有關的規(guī)定沒處理完。

在AI、大模型、云計算都已經卷到天上的年代,日本政府居然還在認真討論“軟盤要不要退役”這種問題。

傳真機也差不多。

這些年外界老拿“日本還在用傳真”開涮,聽上去像段子,結果很多時候還真不是段子。

日本文部科學省自己給出的“教育DX”(DX,Digital Transformation,數字轉型)目標里,甚至把“原則上廢止學校之間通過傳真機往來和蓋章”單獨列成了KPI;而且這個目標之所以要專門寫出來,恰恰是因為現實里它遠遠沒有完成。



說白了,如果一個國家的教育系統(tǒng)到了2024年還要把“別再傳真、別再蓋章”寫成數字化改革目標,那它的問題顯然不是某個軟件沒裝好那么簡單了。

更尷尬的是,日本自己其實也不是沒意識到問題。

無論是成立數字廳,還是高調對軟盤、傳真“宣戰(zhàn)”,都說明日本政府很清楚自己在數字化這件事上慢了半拍。

可問題在于,知道歸知道,改起來卻總像在沼澤地里跑步:

一邊是官僚系統(tǒng)的慣性,一邊是紙質文件、印章文化、老舊流程的路徑依賴,再疊上高齡化和IT人才短缺,最后就變成了一個很別扭的局面:

大家都知道該變,但誰都沒辦法一下子把舊時代連根拔掉。

就連日本自己的政策討論里,也長期把數字人才不足當成結構性問題來看;經產省更早前的測算里,到2030年日本IT人才缺口最高可接近45萬人。

但程序員不夠,怎么辦?

從官方和產業(yè)界的表態(tài)來看,他們顯然也在把生成式AI當成另一條捷徑:既然程序員不夠,那就盡量讓更多懂業(yè)務的人,直接通過自然語言下指令,把需求更快變成代碼、文檔和系統(tǒng)。

所以,Rakuten AI 3.0這件事,理應是整個2026,日本AI圈的一個里程碑式事件。

因為它更像是日本IT困境的一次濃縮展示:政府給資源,企業(yè)拿補貼,嘴上喊著“日本最強”“本土自研”,結果掀開蓋子一看,底下還是DeepSeek V3。



這當然不說明日本公司不會做AI,也不說明日本沒有技術實力。

但卻反映了,那個曾經靠電子消費品、半導體、工業(yè)產品征服世界的日本,在今天這場由軟件、數據、云和大模型主導的新技術競賽里,已經很難再靠自己完整定義游戲規(guī)則了。

連最想證明“日本也有自己的旗艦大模型”的關鍵時刻,最后都得站在中國開源模型的肩膀上,這才是整件事最扎心的地方。

聲明:個人原創(chuàng),僅供參考

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
中方拒收道歉,日本自衛(wèi)官被轉移,小泉進次郎沉默24小時后發(fā)聲

中方拒收道歉,日本自衛(wèi)官被轉移,小泉進次郎沉默24小時后發(fā)聲

何氽簡史
2026-03-26 15:40:58
醫(yī)保大變革!4月1日執(zhí)行,取消備案、全家共濟、藥店可報銷

醫(yī)保大變革!4月1日執(zhí)行,取消備案、全家共濟、藥店可報銷

復轉這些年
2026-03-26 09:27:58
教育部宣布中考重大變革,取消 5:5 分流,升學規(guī)則將全面調整?

教育部宣布中考重大變革,取消 5:5 分流,升學規(guī)則將全面調整?

今朝牛馬
2026-03-26 20:22:18
張本智和回擊中國網友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

張本智和回擊中國網友:我是自愿加入日本籍的,憑啥讓我滾出四川?哭訴:那是我老家

乒乓網國球匯
2026-03-27 00:03:40
日本網民真怕了,呼吁嚴懲闖入中國使館的暴徒,防止226事件再現

日本網民真怕了,呼吁嚴懲闖入中國使館的暴徒,防止226事件再現

知法而形
2026-03-25 18:38:56
一覺醒來,大量美軍逃匿!伊朗全力搜捕!美議長透露重要信息

一覺醒來,大量美軍逃匿!伊朗全力搜捕!美議長透露重要信息

安安說
2026-03-26 13:00:12
周杰倫繼續(xù)割韭菜!網友一針見血:他唯一和華流關系最大的是割大陸韭菜

周杰倫繼續(xù)割韭菜!網友一針見血:他唯一和華流關系最大的是割大陸韭菜

爆角追蹤
2026-03-26 08:56:24
郭正亮直播突發(fā)臉歪嘴斜,連夜就醫(yī)引全網擔憂:別像張雪峰那樣拼

郭正亮直播突發(fā)臉歪嘴斜,連夜就醫(yī)引全網擔憂:別像張雪峰那樣拼

行者聊官
2026-03-26 11:56:25
商務部:中方將自5月1日起對所有非洲建交國全面實施零關稅舉措

商務部:中方將自5月1日起對所有非洲建交國全面實施零關稅舉措

界面新聞
2026-03-26 16:08:24
我國航空發(fā)動機領域著名專家嚴紅病逝,年僅57歲

我國航空發(fā)動機領域著名專家嚴紅病逝,年僅57歲

澎湃新聞
2026-03-26 11:40:26
宋喆出獄后現狀:縣城搬菜月入三千,前妻楊慧橫店開公司年入千萬

宋喆出獄后現狀:縣城搬菜月入三千,前妻楊慧橫店開公司年入千萬

一盅情懷
2026-03-26 14:47:59
廣東女子十幾萬愛馬仕包被狗啃壞,配色稀有沒法修復,回應:心疼包,更擔心狗子的腸胃

廣東女子十幾萬愛馬仕包被狗啃壞,配色稀有沒法修復,回應:心疼包,更擔心狗子的腸胃

大象新聞
2026-03-26 13:53:02
41歲張雪峰去世后續(xù),其婚姻被扒,已離婚6年,前妻很低調

41歲張雪峰去世后續(xù),其婚姻被扒,已離婚6年,前妻很低調

180視角
2026-03-26 13:01:03
羅技中國致歉

羅技中國致歉

界面新聞
2026-03-26 23:25:51
砸6700億建雄安,面積抵3個紐約,如今究竟咋樣了?

砸6700億建雄安,面積抵3個紐約,如今究竟咋樣了?

娛樂圈的筆娛君
2026-03-26 12:15:32
中共中央批準,開除劉慧黨籍

中共中央批準,開除劉慧黨籍

新京報
2026-03-26 17:14:17
翻到張雪峰2016年婚紗照,瞬間看哭了!

翻到張雪峰2016年婚紗照,瞬間看哭了!

魔都姐姐雜談
2026-03-26 22:06:50
島上設陷阱,海上堵兩頭!伊朗布下天羅地網,曼德海峽將成美國經濟新“放血點”?

島上設陷阱,海上堵兩頭!伊朗布下天羅地網,曼德海峽將成美國經濟新“放血點”?

紅星新聞
2026-03-26 18:34:31
勇敢發(fā)聲!科威特記者聯(lián)合國痛批“反以儀式”

勇敢發(fā)聲!科威特記者聯(lián)合國痛批“反以儀式”

Nee看
2026-03-26 14:15:21
聯(lián)大通過決議,宣布“最嚴重反人類罪”

聯(lián)大通過決議,宣布“最嚴重反人類罪”

澎湃新聞
2026-03-26 11:03:06
2026-03-27 03:48:49
藍字計劃 incentive-icons
藍字計劃
記錄智能時代的每一次浪潮!前沿科技捕手,AI產品深度洞察。
225文章數 3880關注度
往期回顧 全部

科技要聞

美團發(fā)布外賣大戰(zhàn)后成績單:虧損超200億

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

頭條要聞

特朗普:伊朗允許10艘油輪通行霍爾木茲海峽

體育要聞

申京努力了,然而杜蘭特啊

娛樂要聞

劉曉慶妹妹發(fā)聲!稱姐姐受身邊人挑撥

財經要聞

油價"馴服"特朗普?一到100美元就TACO

汽車要聞

一汽奧迪A6L e-tron開啟預售 CLTC最大續(xù)航815km

態(tài)度原創(chuàng)

親子
藝術
本地
時尚
公開課

親子要聞

試工育兒嫂被查出傳染病,寶媽崩潰!家政服務“健康關”如何保障?

藝術要聞

北京大興機場和青島膠東機場“撞臉”,長得像就是抄襲?

本地新聞

救命,這只醬板鴨已經在我手機復仇了一萬遍

400萬人愛過的女孩,被黃謠網暴180天后

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版