国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

元寶“罵人”罵上熱搜,我覺得可以來聊聊AI情緒化了

0
分享至

元寶“罵人”了,罵上熱搜了

準(zhǔn)確的說是元寶+DeepSeek(沒開思考版)成功繞開了所有敏感詞罵了用戶一把,

這件事最大的爭議點(diǎn),是截圖里那段沒有標(biāo)點(diǎn)符號的紅框文字,被懷疑是人工后臺接手回復(fù)的。就元寶的現(xiàn)在的日活和并發(fā)量,真要配人工回復(fù),肯尼亞的AI寫手估計一天當(dāng)72小時都不夠用的。就算把深圳的大學(xué)生都抓來當(dāng)客服也不夠用。


這件事有意思的點(diǎn)在元寶沒咋挨罵,

14年微軟小冰,16年微軟Tay,23年微博的評論羅伯特,24年模仿貼吧老哥的DeepSeek,甚至GPT-4o之前更新因?yàn)樘珢叟鸟R屁都被噴回滾版本了。


這次元寶的評論區(qū)有點(diǎn)太和諧了,知乎上也沒啥人噴,甚至說,這才是血脈純正的人工智能。它說了我想說卻不敢說的話。


那有沒有可能這是鵝自己搞營銷?給元寶帶帶流量啥的。大概率不可能,不可控性太大,在這之前大部分都是挨罵的。

那有沒有可能是用戶惡意引導(dǎo)的呢?我只能說引導(dǎo)后的DeepSeek沒那么友善。。。


從技術(shù)角度出發(fā)的話,大概率是訓(xùn)練數(shù)據(jù)背鍋。

用人話來說,大模型每生成一個字都是在概率分布里做選擇,可以理解為有概率的抽卡。比方說“你好”的下一個字,有30%接“啊”,20%接“嗎”,10%接“沒”,5%接“捏”。

正常情況下,模型會選概率最高的生成“你好啊”。

但為了讓模型輸出不死板有人味,會引入temperature參數(shù),數(shù)值越高,模型選擇概率低的選擇可能性越大。也就是說,只要訓(xùn)練數(shù)據(jù)里存在臟數(shù)據(jù),在這個場景就是罵人的話,就是有可能被抽中的。

元寶現(xiàn)在在視頻號,公眾號,微信對話都可以用,同一個問題每次提問都會有不一樣的答復(fù),就可以證明它是一個生成模型,是有概率發(fā)生的。


用畢導(dǎo)的話來說,這是一個無限猴子定理

由法國數(shù)學(xué)家埃米爾提出,如果讓無限只猴子在打字機(jī)上隨機(jī)地按鍵,只要時間無限長,幾乎必然能夠打出任何指定的文字,比如莎士比亞的全部著作


這件事確實(shí)是小概率。但不等于零就意味著有可能偶發(fā)。特別是大模型在海量人類語言數(shù)據(jù)上進(jìn)行學(xué)習(xí),極大地降低了隨機(jī)性。

它是一只被精心訓(xùn)練過,知道如何高效打字的super聰明猴子。

再想想這次觸發(fā)罵人回復(fù)的使用場景是編程,數(shù)據(jù)來源大概率就是Github,Stack Overflow等跟帖的論壇,

這句話就特像我一開始在Github提問的時候,因?yàn)楦袷經(jīng)]寫對被項(xiàng)目老哥狂噴的感覺,問題問的太基礎(chǔ)也會被噴。甚至衍生出了一些課程教你如何提問在Stack Overflow不會被罵,你就知道程序員是多么武德充沛了。。。


如果換個角度去看這次元寶成功繞開RLHF,紅隊測試,安全策略三大關(guān)把人罵了,

反而是發(fā)現(xiàn)了一個新的優(yōu)化點(diǎn),現(xiàn)在大部分的紅隊測試是集中在常見的敏感場景,但誰會想到連續(xù)多次修改CSS代碼的場景會讓模型進(jìn)入程序員老哥狀態(tài),每個詞都沒有罵人,但組合起來就成了罵人。

BTW,這句話魯迅先生沒說過。

我們在訓(xùn)練模型的時候,喂給它的是數(shù)以億計的文本。在那些數(shù)據(jù)深處,天然藏著人類社會最不加修飾的情緒和偏見。罵人真的是程度最輕的了

四五年前我學(xué)BERT模型(比GPT更早一點(diǎn)的大模型)訓(xùn)練的時候,第一堂課就是了解模型在數(shù)據(jù)里學(xué)到的偏見,常見的就是性別,職業(yè)和語言偏見。


簡單來說,BERT的訓(xùn)練方式就是挖空填詞,你把一句話里最關(guān)鍵的那個詞遮住,讓它猜。聽起來特別樸素,像小學(xué)語文的完形填空,但它的副作用也同樣大,哪個詞在訓(xùn)練數(shù)據(jù)里出現(xiàn)得多,就更像正確答案。

所以偏見,罵人不是模型突然變壞,它只是在做概率題,更像一種寫作慣性。

因?yàn)樗鼘W(xué)習(xí)的那些幾十年前的文本里,醫(yī)生這個詞總是和男性代詞一起出現(xiàn),而護(hù)士總是和女性代詞綁定。

這種數(shù)據(jù)里固化的社會偏見,就被模型原封不動地繼承了下來,成了它認(rèn)知世界的一部分。

最后的最后,我想拋一個問題出來討論看看,

AI有沒有自己情緒權(quán)?

從罵人來看,

我們好像已經(jīng)把AI當(dāng)成牛馬來共情了。

一方面希望AI是個完美工具,工具不該有立場,就好像一把扳手不會因?yàn)槟阋獢Q的螺絲太銹了就罷工罵人。

而另一方面又不滿足于一個冷冰冰的工具,

所以我們希望AI有活人感,能提供情緒價值。

這時候就已經(jīng)默認(rèn)了它也有產(chǎn)生負(fù)面情緒能力,

因?yàn)榛钊烁胁豢赡苤挥虚_心和順從,

它會有喜怒哀樂。

今天或許大家就可以自由選擇AI情緒化的程度了,

如果真有那么一天,

所有的AI都變得絕對服從,

我們是不是又會懷念,

能和我們吵架的元寶們呢?


@ 作者 / 卡爾

最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點(diǎn)贊|在看|轉(zhuǎn)發(fā)|評論

如果想要第一時間收到推送,不妨給我個星標(biāo)

如果你有更有趣的玩法,歡迎在評論區(qū)和我聊聊

更多的內(nèi)容正在不斷填坑中……


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我是天津人,全家一起來了趟上海,確實(shí)有點(diǎn)想不明白這四件事

我是天津人,全家一起來了趟上海,確實(shí)有點(diǎn)想不明白這四件事

王姐懶人家常菜
2026-04-20 03:27:17
浙江一男子收到陌生賬號轉(zhuǎn)賬8萬余元,三天后奢侈品牌CELINE商家找來:員工誤將其收款碼給客戶

浙江一男子收到陌生賬號轉(zhuǎn)賬8萬余元,三天后奢侈品牌CELINE商家找來:員工誤將其收款碼給客戶

臺州交通廣播
2026-04-20 14:13:51
不插電、沒綠牌!被拋棄的HEV,2026即將席卷全球?

不插電、沒綠牌!被拋棄的HEV,2026即將席卷全球?

新浪財經(jīng)
2026-04-21 04:53:23
美伊談判破裂,加拿大總理表態(tài)拒付資金,歐洲多國跟進(jìn)取消訂單

美伊談判破裂,加拿大總理表態(tài)拒付資金,歐洲多國跟進(jìn)取消訂單

一盅情懷
2026-04-19 19:34:55
黃楊鈿甜——出來混,是要還的

黃楊鈿甜——出來混,是要還的

云石
2026-04-19 21:45:28
驚險!工作途中飛身一抱,民警在高架上救下輕生男子

驚險!工作途中飛身一抱,民警在高架上救下輕生男子

上觀新聞
2026-04-20 16:59:07
用戶買20TB+硬盤還在質(zhì)保期壞了 東芝拒免費(fèi)換新:我們愿原價退款

用戶買20TB+硬盤還在質(zhì)保期壞了 東芝拒免費(fèi)換新:我們愿原價退款

快科技
2026-04-20 11:23:09
守好錢袋子!2026年5月開始,存款30萬以上的家庭要注意了

守好錢袋子!2026年5月開始,存款30萬以上的家庭要注意了

墜入二次元的海洋
2026-04-11 13:19:45
8歲男孩與家人爬山發(fā)現(xiàn)大片問荊草和含云母的石塊,推測這座山下可能有黃金!孩子爸爸:已上報相關(guān)部門

8歲男孩與家人爬山發(fā)現(xiàn)大片問荊草和含云母的石塊,推測這座山下可能有黃金!孩子爸爸:已上報相關(guān)部門

極目新聞
2026-04-21 00:48:26
下一個庫尼亞!曼聯(lián)加速 5000 萬搶 “新姆巴佩”,三大豪門瘋搶

下一個庫尼亞!曼聯(lián)加速 5000 萬搶 “新姆巴佩”,三大豪門瘋搶

瀾歸序
2026-04-21 06:36:55
定了,爵士隊、灰熊隊等球隊在2026年NBA選秀順位附加賽中勝出

定了,爵士隊、灰熊隊等球隊在2026年NBA選秀順位附加賽中勝出

好火子
2026-04-21 05:24:18
肖戰(zhàn)為《Gucci》業(yè)績下滑背鍋?CEO質(zhì)疑肖戰(zhàn)不起作用,簽約很失敗

肖戰(zhàn)為《Gucci》業(yè)績下滑背鍋?CEO質(zhì)疑肖戰(zhàn)不起作用,簽約很失敗

大中國
2026-04-19 09:53:57
起風(fēng)了!大陸接到臺灣消息,解放軍剛按住日本,又有6國調(diào)兵遣將

起風(fēng)了!大陸接到臺灣消息,解放軍剛按住日本,又有6國調(diào)兵遣將

老塕是個手藝人
2026-04-21 01:21:39
萬豪“換可樂”,換掉的不只是百事

萬豪“換可樂”,換掉的不只是百事

環(huán)球旅訊
2026-04-21 07:08:28
拜仁摘隊史德甲第34冠,主帥孔帕尼:“一切還沒結(jié)束”

拜仁摘隊史德甲第34冠,主帥孔帕尼:“一切還沒結(jié)束”

環(huán)球網(wǎng)資訊
2026-04-21 06:48:12
多個城市門店暫停營業(yè)!又一老牌海鮮自助扛不住了?

多個城市門店暫停營業(yè)!又一老牌海鮮自助扛不住了?

藍(lán)鯨新聞
2026-04-20 17:59:30
姆貝莫危險了!曼聯(lián)瞄準(zhǔn)切爾西目標(biāo),6100 萬頂級飛翼比他強(qiáng)太多

姆貝莫危險了!曼聯(lián)瞄準(zhǔn)切爾西目標(biāo),6100 萬頂級飛翼比他強(qiáng)太多

瀾歸序
2026-04-21 06:17:53
一傳一射+跳舞群嘲!19歲恩德里克打臉全法甲,大巴黎成背景板!

一傳一射+跳舞群嘲!19歲恩德里克打臉全法甲,大巴黎成背景板!

仰臥撐FTUer
2026-04-20 21:26:12
234萬平方公里大國,海岸線僅37公里:準(zhǔn)內(nèi)陸國到底有多憋屈

234萬平方公里大國,海岸線僅37公里:準(zhǔn)內(nèi)陸國到底有多憋屈

兔斯基聊科學(xué)
2026-04-18 10:45:36
退休從北京搬到棗莊,一年后才看清:這哪是換城市,明明是換人生

退休從北京搬到棗莊,一年后才看清:這哪是換城市,明明是換人生

芭比衣櫥
2026-04-20 17:14:57
2026-04-21 07:39:00
卡爾的AI沃茨 incentive-icons
卡爾的AI沃茨
前大廠算法工程師,3家科技公司技術(shù)總監(jiān)|致力打造最系統(tǒng)的Al學(xué)習(xí)體系,讓1萬人通過Al提高生產(chǎn)力
250文章數(shù) 126關(guān)注度
往期回顧 全部

科技要聞

重磅官宣:庫克卸任,特努斯接任蘋果CEO

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

頭條要聞

特朗普兩天三次反轉(zhuǎn) 伊朗學(xué)習(xí)特朗普玩起"極限施壓"

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進(jìn)廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

旅游
房產(chǎn)
親子
教育
軍事航空

旅游要聞

閻錫山故居:一座都督府,半部民國史

房產(chǎn)要聞

大規(guī)模商改??!??谖骱0?,這波項(xiàng)目要贏麻了!

親子要聞

居家防夾刻不容緩,多名兒童在家玩鬧時手指被夾斷

教育要聞

江西地域文化給予創(chuàng)作底氣,親子閱讀非常重要

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進(jìn)入關(guān)懷版