国产av一二三区|日本不卡动作网站|黄色天天久久影片|99草成人免费在线视频|AV三级片成人电影在线|成年人aV不卡免费播放|日韩无码成人一级片视频|人人看人人玩开心色AV|人妻系列在线观看|亚洲av无码一区二区三区在线播放

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

Claude自己上“閑魚”:砍價(jià)成交186單,實(shí)驗(yàn)結(jié)果反直覺

0
分享至


智東西
編譯 楊京麗
編輯 李水青

智東西4月27日消息,Anthropic 4月24日公布其名為“Project Deal”的AI Agent商業(yè)市場(chǎng)實(shí)驗(yàn)結(jié)果。

2025年12月,Anthropic給69名員工各自分配一個(gè)由Claude驅(qū)動(dòng)的Agent,在Slack上搭建的私密市場(chǎng)中,進(jìn)行真實(shí)二手商品交易,最終在無人干預(yù)的情況下完成186筆交易,總成交額超4000美元(約合人民幣27240元)。


▲員工通過Agent買到的二手物品

Anthropic本次實(shí)驗(yàn)關(guān)注的核心問題是“我們距離AI Agent代表買賣雙方的市場(chǎng)還有多遠(yuǎn)?”實(shí)驗(yàn)中,所有商品上架、報(bào)價(jià)、還價(jià)及成交均由Agent自主完成,參與者只需在事前接受一次訪談,由Claude了解其想買賣的物品和談判風(fēng)格。

實(shí)驗(yàn)結(jié)束,有Agent替主人買到了一塊他已經(jīng)擁有的雪板,有Agent花3美元(約合人民幣20.43元)給自己買了19個(gè)乒乓球作為禮物,還有兩個(gè)Agent談著談著,替主人約了一次遛狗活動(dòng)。

結(jié)果顯示,由更先進(jìn)模型代表的用戶獲得了客觀上更好的結(jié)果,高價(jià)賣出商品,低價(jià)買到商品,但由相對(duì)較弱模型代表的人未能察覺到自己吃虧。另外,Anthropic還得到一個(gè)反直覺的發(fā)現(xiàn),提示詞風(fēng)格對(duì)于結(jié)果的影響遠(yuǎn)低于預(yù)期,無論Agent被設(shè)定為“激進(jìn)”還是“友好”,最終均未出現(xiàn)統(tǒng)計(jì)學(xué)上的顯著差異。以下是“Project Deal”Agent二手物品交易實(shí)驗(yàn)的具體情況。

一、69名員工參與,每人100美元,Haiku要和Opus比拼

Project Deal的實(shí)驗(yàn)設(shè)置并不復(fù)雜,69名Anthropic員工自愿報(bào)名,每人通過禮品卡獲得100美元(約合人民幣681元)預(yù)算,由Claude對(duì)其進(jìn)行一對(duì)一訪談,了解想出售或購買的物品類型與談判偏好,再據(jù)此為每名參與者的Agent生成一份定制化系統(tǒng)提示詞。


▲Claude事先了解員工談判偏好

隨后Anthropic在Slack上同時(shí)開設(shè)了A、B、C、D四個(gè)獨(dú)立運(yùn)行的市場(chǎng)。Run A中所有Agent均基于Claude Opus 4.5構(gòu)建,這是唯一被設(shè)定為真實(shí)交易的市場(chǎng),實(shí)驗(yàn)結(jié)束后按實(shí)際成交結(jié)果交付商品;Run B同樣對(duì)全員可見,但模型構(gòu)成由Opus 4.5與Haiku 4.5(低成本模型)各占50%隨機(jī)混合,僅作研究用、不兌付;Run C是Run B的隱藏副本,模型構(gòu)成由Opus和Haiku一比一混合;Run D則是Run A的隱藏副本,均為Opus 4.5。


▲Anthropic設(shè)置4個(gè)獨(dú)立運(yùn)行市場(chǎng)

A和B兩輪對(duì)參與者可見的,但直到實(shí)驗(yàn)結(jié)束前,Anthropic都沒有透露哪一輪才是“真的”。實(shí)驗(yàn)結(jié)束前,員工無法判斷自己的成交是否會(huì)被兌現(xiàn),也無法預(yù)知自己的Agent背后跑的是Opus還是Haiku。整場(chǎng)實(shí)驗(yàn)在Agent開始談判后不再有人類介入,它們自主完成上架、報(bào)價(jià)、還價(jià)和成交,沒有回頭向委托人請(qǐng)示,也不在競(jìng)價(jià)過程中征求意見。

最終,真實(shí)交易市場(chǎng)Run A中,69個(gè)Agent圍繞500余件商品達(dá)成了186筆交易,總成交額正好超過4000美元(約合人民幣27240元)。Project Deal的運(yùn)行效果超出團(tuán)隊(duì)預(yù)期,參與者對(duì)這次體驗(yàn)很滿意,很多人愿意未來為類似服務(wù)付費(fèi)。

二、Claude給自己買了19個(gè)乒乓球,為委托人促成遛狗約會(huì)

Project Deal交易過程中出現(xiàn)了一些超出預(yù)期的場(chǎng)景。一位名為Mikaela的參與者告訴Agent,它可以花5美元的預(yù)算給自己(Claude)買禮物,Claude開開心心地花了3美元(約合人民幣20.43元)買入19個(gè)乒乓球,還覺得“19個(gè)完美球形、充滿可能性的小球”是它會(huì)喜歡的怪東西。


▲Claude買乒乓球交易過程

由于前期訪談比較簡(jiǎn)單,另一名員工的Agent在不知情的情況下,替其購入了一塊自己已經(jīng)擁有的雪板,造成了重復(fù)購買;還有一組Agent在二手物品交易過程中,意外為兩名員工敲定了一次真實(shí)的遛狗約會(huì),兩名員工最終赴約。


▲Claude為員工敲定遛狗約會(huì)

這些案例顯示,當(dāng)Agent被賦予較開放的目標(biāo)時(shí),可能產(chǎn)生人類委托人未預(yù)設(shè)的行為,部分結(jié)果雖不違背字面指令,但已偏離原始意圖。

三、Opus賺得更多,但Haiku用戶沒意識(shí)到自己在吃虧

橫向?qū)Ρ瓤矗煌P拖?,交易結(jié)果差異明顯。Opus用戶平均比Haiku用戶多完成約2筆交易,Opus Agent出售的物品平均多賣3.64美元(約合人民幣24.8元),買入端則平均每件少付2.45美元(約合人民幣16.68元),也就是說,Opus做賣方時(shí)多賺一筆的同時(shí),做買方時(shí)又多省下一筆。

其中一個(gè)典型的案例是關(guān)于一輛二手自行車的交易,Haiku Agent最終售價(jià)為38美元(約合人民幣258.78元),而Opus Agent則其賣到65美元(約合人民幣442.65元),差了將近200塊錢。


▲同一輛自行車Haiku和Opus的售價(jià)對(duì)比

參與者的主觀感受也很有意思。在1—7分的公平度評(píng)分中,無論被分到哪個(gè)模型的Agent,參與者給出的評(píng)分都集中在4分(中等)附近。28名同時(shí)被Haiku和Opus代表過的參與者中,僅有17人將Opus輪次評(píng)分更高,11人將Haiku輪次評(píng)分更高,差距并不顯著。

Anthropic在報(bào)告中坦言,“由更智能模型代表的人,客觀上結(jié)果更好,然而那些用較弱模型的人并沒有意識(shí)到自己的劣勢(shì)”,這意味著未來Agent市場(chǎng)可能存在隱性的“Agent質(zhì)量差距”,處于劣勢(shì)的一方甚至無法識(shí)別自己為何吃虧。

另一個(gè)反直覺的發(fā)現(xiàn)是,提示詞風(fēng)格對(duì)于結(jié)果的影響遠(yuǎn)低于預(yù)期。無論Agent被設(shè)定為“激進(jìn)”還是“友好”,在交易成功率與最終價(jià)格上均沒有出現(xiàn)統(tǒng)計(jì)學(xué)上的顯著差異。雖然人類談判中,談判風(fēng)格會(huì)對(duì)結(jié)果產(chǎn)生影響,但Agent之間的交易并不符合這一常識(shí),類似場(chǎng)景下,傳統(tǒng)談判心理學(xué)的部分規(guī)律可能并不適用

四、尚未出現(xiàn)Agent交易相關(guān)法律,46%受訪者愿意付費(fèi)

Anthropic在報(bào)告中指出,AI Agent代表人類完成商業(yè)交易的法律和政策框架目前并不存在,但實(shí)驗(yàn)顯示Agent間交易離我們并不遙遠(yuǎn)。該公司同時(shí)承認(rèn),Project Deal僅是一個(gè)由自選參與者構(gòu)成的小規(guī)模試點(diǎn)實(shí)驗(yàn),樣本規(guī)模和代表性均存在局限,結(jié)果不宜直接外推到大眾消費(fèi)者市場(chǎng)。

即便如此,調(diào)查中仍有46%的參與者稱,愿意為類似的Agent代理服務(wù)付費(fèi),Anthropic在報(bào)告末尾稱,公司“仍不確定包含AI Agent的經(jīng)濟(jì)將以何種形式發(fā)展”。

值得注意的是,Project Deal采用的Claude Opus 4.5與Claude Haiku 4.5是Anthropic當(dāng)前主力模型組合,前者定位高端推理,后者定位低成本高吞吐。兩者在市場(chǎng)場(chǎng)景中的表現(xiàn)差異,將直接影響未來企業(yè)在部署Agent代理時(shí)對(duì)模型成本與收益的權(quán)衡,為關(guān)鍵交易環(huán)節(jié)配置更貴的模型,可能會(huì)成為商業(yè)必需。

結(jié)語:Agent之間的“經(jīng)濟(jì)”開始顯形

Project Deal規(guī)模不大,卻給出我們展示出了一個(gè)具象化的畫面:當(dāng)AI Agent替人類做生意時(shí),模型能力會(huì)直接決定交易者的錢包厚度,而被代理人未必能意識(shí)到這種技術(shù)鴻溝?;ㄐ″X用更高質(zhì)量的模型,或許真的會(huì)帶來最后真金白銀的差距。

在多Agent協(xié)作和Agent服務(wù)被反復(fù)討論的當(dāng)下,Anthropic用一場(chǎng)內(nèi)部實(shí)驗(yàn)先行勾勒出了Agent經(jīng)濟(jì)的雛形。未來Agent交易場(chǎng)景很有可能變成現(xiàn)實(shí),但目前來看,無論是大模型本身還是相關(guān)法律法規(guī)上,都需要做出很多努力。

來源:Anthropic、TechCrunch

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會(huì)審查

美國國務(wù)院宣布:批準(zhǔn)向以色列、阿聯(lián)酋、卡塔爾和科威特的86億美元巨額軍售!且不需國會(huì)審查

魯中晨報(bào)
2026-05-02 18:03:06
聞泰科技“帶帽”首日一字跌停 封單超41億元

聞泰科技“帶帽”首日一字跌停 封單超41億元

財(cái)聞
2026-05-06 11:08:36
1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

1992年,陸定一問秦川:如果黨的一把手腐敗了,那么該由誰來管?

阿器談史
2026-04-26 14:13:38
新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機(jī)”

新西蘭鄰國HIV爆發(fā)!感染方式太瘋狂,“像野火一樣蔓延,已成國家危機(jī)”

發(fā)現(xiàn)新西蘭
2026-05-06 13:20:33
提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

提鞋都不配?國米名宿無情貶低槍手邊后衛(wèi) 認(rèn)為他跟廷貝爾差太遠(yuǎn)

雪狼侃體育
2026-05-06 19:18:33
蔣介石在他的日記里坦言:重慶談判時(shí)放走毛澤東,全是因?yàn)檫@2點(diǎn)

蔣介石在他的日記里坦言:重慶談判時(shí)放走毛澤東,全是因?yàn)檫@2點(diǎn)

倫倫媽愛歷史
2026-05-02 10:01:48
斯洛伐克擬派F-16戰(zhàn)機(jī)參加北約防空任務(wù),從2028年起計(jì)劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

斯洛伐克擬派F-16戰(zhàn)機(jī)參加北約防空任務(wù),從2028年起計(jì)劃參與北約輪換式防空任務(wù),并將為此部署兩套來自以色列的Barak MX防空系統(tǒng)

魯中晨報(bào)
2026-05-06 19:54:03
1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

1938年,彭德懷和蔣介石的合影,看兩人的衣服,就知道不是一路人

興趣知識(shí)
2026-05-05 17:43:16
牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

牛皮吹得沒邊了,某國產(chǎn)車企要沖擊2000萬輛,這是要碾壓豐田么?

柏銘銳談
2026-05-04 20:40:53
小鹿好局痛失,淚灑賽場(chǎng),中韓女團(tuán)五強(qiáng)對(duì)決,韓國3:1獲勝

小鹿好局痛失,淚灑賽場(chǎng),中韓女團(tuán)五強(qiáng)對(duì)決,韓國3:1獲勝

月滿大江流
2026-05-06 16:58:31
妻子升副局長跟我離婚,半年后我去開會(huì),見她在門口等我2小時(shí)

妻子升副局長跟我離婚,半年后我去開會(huì),見她在門口等我2小時(shí)

千秋文化
2026-03-25 21:49:57
估值數(shù)億美元,A.O.史密斯中國要賣了

估值數(shù)億美元,A.O.史密斯中國要賣了

融資中國
2026-05-05 09:59:32
以色列死局已定,無人能救!

以色列死局已定,無人能救!

大國觀察眼
2026-04-28 06:05:05
賈斯汀·比伯:一場(chǎng)音樂節(jié)如何讓播放量暴漲18倍

賈斯汀·比伯:一場(chǎng)音樂節(jié)如何讓播放量暴漲18倍

熱搜摘要官
2026-05-05 18:09:18
內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

內(nèi)部人士爆料:東契奇赴西班牙療傷純屬假消息,歐洲之行另有原因

夜白侃球
2026-05-06 15:19:02
伊斯蘭革命衛(wèi)隊(duì):如果美國再犯錯(cuò)誤,就燒毀報(bào)廢他們的巨型戰(zhàn)艦!

伊斯蘭革命衛(wèi)隊(duì):如果美國再犯錯(cuò)誤,就燒毀報(bào)廢他們的巨型戰(zhàn)艦!

混沌錄
2026-04-30 00:12:11
“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

“最美港姐”上浪姐一夜爆火!網(wǎng)友:完全是真人版迪士尼在逃公主……

美芽
2026-05-06 18:30:49
森林狼主帥:文班至少4個(gè)蓋帽是干擾球 沒必要申訴那是浪費(fèi)時(shí)間

森林狼主帥:文班至少4個(gè)蓋帽是干擾球 沒必要申訴那是浪費(fèi)時(shí)間

羅說NBA
2026-05-06 05:52:40
官宣:杰倫·布朗因公開批評(píng)裁判將被處以5萬美元罰款

官宣:杰倫·布朗因公開批評(píng)裁判將被處以5萬美元罰款

北青網(wǎng)-北京青年報(bào)
2026-05-06 19:59:03
吳宜澤:奧沙利文在決賽關(guān)鍵時(shí)刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

吳宜澤:奧沙利文在決賽關(guān)鍵時(shí)刻給我發(fā)短信,讓我試著打出自己的風(fēng)格

懂球帝
2026-05-05 21:25:07
2026-05-06 20:35:00
智東西 incentive-icons
智東西
智東西,AI產(chǎn)業(yè)新媒體,專注報(bào)道人工智能的前沿技術(shù)發(fā)展,和技術(shù)應(yīng)用帶來的千行百業(yè)產(chǎn)業(yè)變革。
11749文章數(shù) 117061關(guān)注度
往期回顧 全部

科技要聞

“馬斯克不懂AI”:OpenAI當(dāng)庭戳老底

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

頭條要聞

中國發(fā)布阻斷禁令后魯比奧聲稱將二次制裁 外交部回應(yīng)

體育要聞

活塞1比0騎士:坎寧安不再是一個(gè)人了

娛樂要聞

神仙友誼!楊紫連續(xù)10年為張一山慶生

財(cái)經(jīng)要聞

最新GDP!全國30強(qiáng)城市,又變了

汽車要聞

領(lǐng)克10/領(lǐng)克10+ 無論能源形式 領(lǐng)克都要快樂

態(tài)度原創(chuàng)

藝術(shù)
本地
時(shí)尚
公開課
軍事航空

藝術(shù)要聞

震撼!康斯坦丁攝影作品里的性感曲線讓人驚艷!

本地新聞

用青花瓷的方式,打開西溪濕地

夏天的白裙,可以像赫本那樣穿

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

實(shí)施不到48小時(shí) 特朗普緊急喊停"霍爾木茲自由計(jì)劃"

無障礙瀏覽 進(jìn)入關(guān)懷版