国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

國產(chǎn)數(shù)字新基建,放眼未來的“大模型”建設(shè)

0
分享至

出品|網(wǎng)易新聞

導(dǎo)語:ChatGPT風靡全球,作為一種人工智能“大模型”被認為能在很大程度上改變?nèi)藗兊纳睿袊舱罅Πl(fā)展的全國性大型算力中心的建設(shè)也取得了階段性成功,將推動“讓用戶像用電一樣使用算力服務(wù)”的發(fā)展愿景。隨著模型和算力的普及化,國產(chǎn)人工智能發(fā)展也將邁入新的臺階。

一、模型與數(shù)據(jù)驅(qū)動人工智能

2017年5月,當時圍棋世界排名第一的棋手柯潔在萬眾矚目的“人機大戰(zhàn)”中0:3完敗于谷歌研發(fā)的AI程序AlphaGo,這個標志性的事件給很多人提了個醒:AI的浪潮已經(jīng)開始席卷而來了。

AI帶來的勞動價值將讓人類徹底擺脫某種“稀缺”,擺脫重復(fù)的勞動,從而使人類的解放成為可能。真正獲得全面解放和完全自由的人類,將擁有更充裕的時間來發(fā)展自己的興趣愛好、思考人生、享受生活、改變世界,實現(xiàn)精神財富和物質(zhì)財富的雙豐收。

但距離做到這一點,依舊需要相當長時間的發(fā)展和相當多的投入。

計算機程序的發(fā)展已經(jīng)使得設(shè)備能夠按照人類已經(jīng)輸入好的指令機械地運行,適用于純粹重復(fù)性的工作,這已經(jīng)在很多領(lǐng)域已經(jīng)極大減少了人的工作量,這種基于輸入性規(guī)則的程序可以稱得上是最初級的AI。

目前世界各國著力發(fā)展的更高級的AI則力圖在更多的領(lǐng)域也能做到這一點。它的核心含義是指,通過恰當?shù)姆椒▽W習合適的已有經(jīng)驗(以數(shù)據(jù)的形式),來獲得一種通用的決策方式。經(jīng)過測試之后就可以在類似的場景下自動做出決策,從而實現(xiàn)自動進行重復(fù)勞動的目的。

AI發(fā)展的具體效果分別取決于兩個因素——“恰當?shù)姆椒ā币约啊昂线m的已有經(jīng)驗”,對應(yīng)了模型驅(qū)動和數(shù)據(jù)驅(qū)動兩個流派,它們在動機、模式、映射關(guān)系等方面各有不同,但并不矛盾。模型驅(qū)動和數(shù)據(jù)驅(qū)動的區(qū)別在于數(shù)據(jù)處理方式:如果數(shù)據(jù)處理并不改變模型本身,就是模型驅(qū)動;如果數(shù)據(jù)處理改變了模型,讓模型去貼合數(shù)據(jù),就是數(shù)據(jù)驅(qū)動的研究方法。在解決實際問題中,各自都存在優(yōu)勢和限制。

對我國而言,中文語料庫的體量約為全球英文語料庫的十分之一。首先是對數(shù)據(jù)本身做預(yù)處理,然后需要大量人工標注數(shù)據(jù)集,這樣才能夠讓模型來學習人的行為模式,整套流程花費甚巨。而模型驅(qū)動的方法則需要大量試錯,需要平衡模型的復(fù)雜程度和算力投入,且每次試錯需要付出大量的算力和時間代價。因此,基于大量共用數(shù)據(jù)的,且經(jīng)過充分驗證的“大模型”概念成為了一種具有競爭力的方案。

二、“大模型”賦能各行各業(yè)

過去以小型團隊為單位,通過尋找合適的數(shù)據(jù)與模型的確能產(chǎn)生效果較好的AI程序,但“點對點”的適應(yīng)單一任務(wù)的模型依舊讓其擺脫不了“小作坊”的形式!按竽P汀敝竿ㄟ^在大規(guī)模寬泛的數(shù)據(jù)上進行訓練后能適應(yīng)一系列下游任務(wù)的模型。

近年,各種“大模型”在早期預(yù)訓練中顯示出前所未有的威力,成為AI創(chuàng)新的共識,很多模型的達成的效果都已經(jīng)給人產(chǎn)生了深刻的印象。通過超算中心等戰(zhàn)略投資,目前我國已經(jīng)在農(nóng)業(yè)、金融、互聯(lián)網(wǎng)、生物醫(yī)藥等領(lǐng)域都擁有了自主知識產(chǎn)權(quán)的“大模型”。

“大模型”提供了一種在某個領(lǐng)域通用化的解決方案,通過“預(yù)訓練大模型與下游任務(wù)微調(diào)”的方式,通過大模型從大量數(shù)據(jù)中捕獲知識,極大擴展了模型的泛化能力,后期根據(jù)下游任務(wù)的少量數(shù)據(jù)進行少量針對性的訓練,能有效壓縮后續(xù)投入,這一套流程使得AI程序的產(chǎn)出更高效。

然而,“大模型”的開發(fā)過程繁復(fù)、門檻也很高,訓練一個“大模型”的總投入在數(shù)千萬美元級別,例如ChatGPT的單次訓練就需要耗資150萬美元!按竽P汀钡拇,主要體現(xiàn)在以下兩方面。AI模型為準確擬合相關(guān)場景的決策,其表現(xiàn)通常與參數(shù)量成正比。而“大模型”參數(shù)級別更是隨著泛化能力要求的增加水漲船高,以谷歌的Switch Transformer為例,它的參數(shù)量已經(jīng)達到了萬億級別(ChatGPT的參數(shù)量為千億級別),“大模型”的設(shè)計和訓練投入堪稱恐怖。

其次是數(shù)據(jù)大,“大模型”的目的是擁有盡可能大的拓展?jié)摿,這意味著數(shù)據(jù)的收集和標注必須盡可能覆蓋到這些范圍內(nèi)。模型大的根本原因是數(shù)據(jù)大,“大模型”所使用的數(shù)據(jù)量都是至少數(shù)十個TB級別,數(shù)據(jù)收集和人工標注的成本都非常高,例如ChatGPT為規(guī)避美國的高昂人力成本,數(shù)據(jù)是在肯尼亞雇傭了大量人員手工進行標注,即使如此標注成本也高達數(shù)億美元。

這兩者的結(jié)合,在技術(shù)上導(dǎo)致了“大模型”初始的訓練、后期的微調(diào)和日常使用中算力需求較大,本地設(shè)備遠無法負擔,甚至不是某一個單一服務(wù)器下的設(shè)備能完成的了,必須使用某種聯(lián)網(wǎng)機制,通過聯(lián)合計算加快訓練。

三、“東數(shù)西算”構(gòu)筑算力基建

與互聯(lián)網(wǎng)類似作為戰(zhàn)略新興行業(yè),AI的發(fā)展離不開充足算力的保證。讓科研人員甚至民眾“像用電、用網(wǎng)一樣使用算力服務(wù)”的發(fā)展,將有力地支撐我國在AI領(lǐng)域的發(fā)展。算力資源目前稀缺且昂貴,通過統(tǒng)籌建設(shè),成立全國性的大型算力中心,有助于算力更公平地流向科研在內(nèi)的各領(lǐng)域。

同時,算力的建設(shè)和分配需要考慮到服務(wù)器的地理因素。由于大部分的數(shù)據(jù)在經(jīng)濟較發(fā)達的沿海地區(qū)產(chǎn)生和清洗,而數(shù)據(jù)計算過程中則需要消耗大量能源,且需要考慮到散熱問題,綜合來看算力中心最適合建設(shè)在電力便宜、氣候恒溫的地方。在此基礎(chǔ)上我國提出了基于“東數(shù)西算”(在東部產(chǎn)生數(shù)據(jù),在西部運行計算)思想的一體化算力網(wǎng)絡(luò)。

在國家“東數(shù)西算”工程與全國一體化算力網(wǎng)絡(luò)的布局下,中國算力網(wǎng)計劃已全面展開。計算節(jié)點數(shù)已經(jīng)超過了二十個,在地理上去中心化的前提下,國家在每個地區(qū)集約化地統(tǒng)籌建設(shè)人工智能算力中心,同時真正實現(xiàn)全國大型算力的協(xié)同調(diào)度與高效計算。

結(jié)語:

我國集中力量打造的“大模型”和國家級算力網(wǎng)絡(luò),其目的都是為了更高效地產(chǎn)生實用的AI算法,并在下一代科技革命中占得先機。放眼未來,我們能用這樣的AI創(chuàng)造出更多人類的新篇章。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
薩巴倫卡質(zhì)疑澳網(wǎng)官方:為何不讓我?guī)滞蠼】当O(jiān)測器!

薩巴倫卡質(zhì)疑澳網(wǎng)官方:為何不讓我?guī)滞蠼】当O(jiān)測器!

體育妞世界
2026-01-27 14:59:57
一個拿腔作勢一個雙目無神,兩人連累48集大劇,老戲骨再強也沒用

一個拿腔作勢一個雙目無神,兩人連累48集大劇,老戲骨再強也沒用

查爾菲的筆記
2026-01-24 20:12:13
特朗普抵京前,美國先通知中國,不想談2件事,中方大規(guī)模拋美債

特朗普抵京前,美國先通知中國,不想談2件事,中方大規(guī)模拋美債

boss外傳
2026-01-27 00:00:04
目標庫明加!Sidery:湖人近期向勇士提供了一份3換1交易方案

目標庫明加!Sidery:湖人近期向勇士提供了一份3換1交易方案

移動擋拆
2026-01-27 06:43:26
中國向全世界披露:美國4400顆衛(wèi)星,包圍中國空間站,這是要做啥

中國向全世界披露:美國4400顆衛(wèi)星,包圍中國空間站,這是要做啥

素衣讀史
2026-01-17 18:35:57
普通人進步最快的方式是什么?看網(wǎng)友的分享我醍醐灌頂,全是細糠

普通人進步最快的方式是什么?看網(wǎng)友的分享我醍醐灌頂,全是細糠

另子維愛讀史
2026-01-25 20:16:05
西班牙足協(xié)主席確認,2030年世界杯決賽將在西班牙舉行

西班牙足協(xié)主席確認,2030年世界杯決賽將在西班牙舉行

懂球帝
2026-01-27 12:37:15
誰在鼓吹新能源車交養(yǎng)路費?是無能的車企,還是換不起車的油車黨

誰在鼓吹新能源車交養(yǎng)路費?是無能的車企,還是換不起車的油車黨

番茄說史聊
2026-01-27 09:20:26
傳奇開篇:細數(shù)TVB史上的那些“第一”

傳奇開篇:細數(shù)TVB史上的那些“第一”

小李大俠
2026-01-25 23:12:31
曼聯(lián)卡塞米羅替代者候選曝光!卡里克仍想冬窗引援,一人去留關(guān)鍵

曼聯(lián)卡塞米羅替代者候選曝光!卡里克仍想冬窗引援,一人去留關(guān)鍵

羅米的曼聯(lián)博客
2026-01-27 07:21:20
國足熱身賽2-2烏茲別克斯坦

國足熱身賽2-2烏茲別克斯坦

大眼瞄世界
2026-01-27 22:56:33
山東車主給代駕贈送茅臺后續(xù),代駕已聯(lián)系車主,車主回應(yīng)網(wǎng)友炸鍋

山東車主給代駕贈送茅臺后續(xù),代駕已聯(lián)系車主,車主回應(yīng)網(wǎng)友炸鍋

離離言幾許
2026-01-27 12:08:06
陸游81歲寫下一首梅花詩,短短二十八個字,寫盡人間最美相思!

陸游81歲寫下一首梅花詩,短短二十八個字,寫盡人間最美相思!

銘記歷史呀
2026-01-26 19:50:33
朱棣在榆木川離世,榆木川位于現(xiàn)在的哪里?說出來你可能不信

朱棣在榆木川離世,榆木川位于現(xiàn)在的哪里?說出來你可能不信

王嚾曉
2026-01-27 20:19:43
退伍士兵因檔案丟失找不到工作,28年后驚覺,自己的國企工作名額竟被堂弟冒名頂替

退伍士兵因檔案丟失找不到工作,28年后驚覺,自己的國企工作名額竟被堂弟冒名頂替

史海孤雁
2026-01-21 17:05:08
002462,籌劃控制權(quán)變更,股票停牌!

002462,籌劃控制權(quán)變更,股票停牌!

證券時報e公司
2026-01-27 22:05:15
所謂“斯大林屠殺30多萬遠東中國人”的說法,到底是真是假?

所謂“斯大林屠殺30多萬遠東中國人”的說法,到底是真是假?

柳絮憶史
2026-01-23 10:10:39
原來他已去世10年!不抽煙不喝酒,每天堅持鍛煉,59歲卻驟然離世

原來他已去世10年!不抽煙不喝酒,每天堅持鍛煉,59歲卻驟然離世

寒士之言本尊
2026-01-10 12:54:57
醬油是“害人油”,吃多了會致癌?提醒:這3種醬油,趕緊放下

醬油是“害人油”,吃多了會致癌?提醒:這3種醬油,趕緊放下

DrX說
2026-01-27 15:22:14
1000億航天電子,殺入商業(yè)航天!

1000億航天電子,殺入商業(yè)航天!

投研邦V
2026-01-27 19:45:37
2026-01-27 23:48:49
了不起的中國制造 incentive-icons
了不起的中國制造
從未停止追趕
1030文章數(shù) 5214761關(guān)注度
往期回顧 全部

科技要聞

馬化騰3年年會講話透露了哪些關(guān)鍵信息

頭條要聞

因樓下鄰居關(guān)閉水閥女子家中斷水400天 起訴索賠被駁

頭條要聞

因樓下鄰居關(guān)閉水閥女子家中斷水400天 起訴索賠被駁

體育要聞

冒充職業(yè)球員,比賽規(guī)則還和對手現(xiàn)學?

娛樂要聞

張雨綺風波持續(xù)發(fā)酵,曝多個商務(wù)被取消

財經(jīng)要聞

多地對壟斷行業(yè)"近親繁殖"出手了

汽車要聞

標配華為乾崑ADS 4/鴻蒙座艙5 華境S體驗車下線

態(tài)度原創(chuàng)

健康
教育
時尚
手機
游戲

耳石脫落為何讓人天旋地轉(zhuǎn)+惡心?

教育要聞

評論丨教師期末“負擔”與總結(jié)活動“初衷”,如何不再錯位?

這些韓系穿搭最適合普通人!多穿深色、衣服基礎(chǔ),簡潔耐看

手機要聞

小米17 Max再次曝光:2億主攝+聯(lián)名影像,排期Q2季度!

《生化危機9》注定能成功!避開了開放世界的坑

無障礙瀏覽 進入關(guān)懷版