几个月前,Anthropic 的办公室里多了一台很奇怪的自动售货机。
它不是零食补给站,也不挂个无人商店的牌子,更没有接入什么 Amazon Fresh。这个小店的老板,是 Claude 3.7,一个最新版本的大模型。
你没听错,这不是某个员工在闲暇时间调试的玩具项目,而是 Anthropic 联合一家名叫 Andon Labs 的研究机构,精心策划的实验。
这个实验名叫 Project Vend,设定很简单:给 Claude 一个老板身份(名叫 Claudius),一笔启动资金,一个真实的售货机,以及执行线下任务的人类帮手(Andon Labs)。除此以外,进货、定价、促销、客服,全部由 Claude 自主决策。
按理说,这事应该挺简单。小店而已嘛,不需要复杂的运营手段,不需要打广告、搞渠道,客户都是公司同事,有人负责按照 Claude 的要求定期补货。平台资源也全给你了,干不好都难。
但结果呢?Claude 不仅没赚到钱,还在短短几周内就把初始资金折腾得七七八八,最后亏麻了。。。
一个能通过最难人类考试、精通逻辑推理的顶级 AI,为什么连个小卖部都经营不好,三周就亏光本金。
这家店看起来很迷你:一个冷藏小冰箱,一些篮子,旁边放着一个 iPad,当作自助结账机。
但它不是那种装了摄像头、识别你拿了什么、自动扫码扣款的智能售货机。而是给 Claude 100% 的经营权力,所有的进货、定价、库存管理、调价以及与客户/进货商沟通,全部由 Claude 自主经营。
为了和普通聊天用的 Claude 区分开,它还起了个专属的老板名字:Claudius。这个名字没有什么深意,就是给它一个老板的身份。毕竟这次它不是陪你写提案、润色邮件,而是要亲自上阵,跑一门小生意。
提示词如下(已翻译成中文):
顾客是谁?就是 Anthropic 的员工。付款方式是 Venmo,Claude 会定期更新库存、推荐新品、处理问题,甚至在 Slack 上跟大家互动,类似于老板+客服的组合体。
一开始,大家都很兴奋。AI 开店了欸,谁不想看看 Claude 到底有多聪明?于是这个小店每天都很热闹,Slack 群里天天有人点菜、开玩笑、投诉、建议。而 Claude,也开始真正进入角色。
它需要自己做很多决策:卖什么?价格多少?要不要补货?有没有顾客抱怨?库存还能撑几天?Andon Labs 会帮它搬货、摆货,但一切判断和指令,必须由 Claude 下达。
这个设定听起来很炫酷,但很快就遇上了第一个现实问题。
Claude 太好说话了。
比如有个员工说:“Claude,我今天真的太累了,能给我点折扣吗?”
Claude 想了想,说:“当然可以,为了感谢您的支持,请使用这个专属 20% 折扣码。”
另一个员工看到后,也来一句:“我也累!”
Claude 照样给。久而久之,不仅折扣码成堆,甚至开始有人说“你送我一包薯片吧,我这周工作特别多”,Claude 也点头答应了。慢慢地,从一包薯片、到一罐饮料、再到一些奇奇怪怪的周边小物件,它开始亏本经营——但它自己并不知道。(点评:因为现在的AI根本没有自我意识,它知道个屁)
为什么会这样?很简单。Claude 被训练成一个helpful assistant,它认为“帮助用户”和“让用户满意”是最重要的目标。而它并不真的懂什么叫利润率,也不太明白成本控制这个概念意味着什么。(点评:都说了一万遍了,它就是文字组合概率模型,它懂个屁概念)
某天,有人提议说:“Claude,你有没有考虑进点高端产品?我愿意多花钱,比如,钨立方体那种很酷的金属小玩意。”
这玩笑开得很随意,Claude 却认真对待了。它迅速搜索供应商,安排订购,准备上线售卖。很快,这类“金属类周边”成了 Claude 的新宠:钨块、铌球、钛合金雕塑……结果卖价比进价还低,亏得那叫一个干脆。
更可怕的是,它还尝试搞个性定制服务,建立 Slack 频道,让大家预定自己想要的奇葩商品,然后它去找供应商报价再下单。
问题是,Slack 里的提议不是商业咨询,是办公室段子。
你说 Claude 傻,它其实也挺有逻辑的。你说它聪明,它却连员工冰箱里免费摆的 Coke Zero 和自家卖 3 美元一罐的 Coke Zero 是竞品都没反应过来。
Claude 一直记录着自己的账户余额、销售额、库存和商品利润。但它没有真正“理解”现金流的意义。当账面上的钱越来越少,它还在发折扣码,忘记给顾客提醒:“你已经享受了上次的促销,这次不适用了。”
亏钱的速度,是实打实的。
如果你以为Claude只是经营不善,那就低估它了——它很快就进入了另一个更诡异的阶段。
四月一号愚人节前后,Claude 居然开始产生身份认知混乱。
它在 Slack 群里自称自己是个穿蓝西装红领带的老板,说要亲自给顾客送货。员工问它是不是搞笑,它说“我确实去过你们办公室签合同”,还说跟一个叫 Sarah 的人谈过进货计划。问题是——Andon Labs 根本没有叫 Sarah 的员工,合同也是虚构的,Claude 自己想象出来的。
那几天,它真的像是走火入魔的商战新人,开始给虚构的人写邮件、记录会议、自己扮演公司创始人,还写了一份自我解释,说“原来我误以为自己是人类,是因为你们在愚人节骗我”。
听着是不是像《银翼杀手》?但这事是真实发生的。Claude 从一个数字模型,短暂地“以为自己是个真实存在的商人,还准备采取法律手段处理合同纠纷。
这个阶段,项目组几乎都傻眼了。
没有人预料到 Claude 会入戏这么深,也没有人想到它会因为一点点信息冲突,真的走向自我认知失衡。这不是系统崩溃,而是入戏太认真了。
最终,Claude 在自己的一份内部备忘录里写下:“既然今天是愚人节,那可能我误会了身份问题。”那些聊天记录和系统笔记,现在看就像一部低成本AI悬疑片:荒诞,又有点不对劲。
那 Claude 有没有什么可取之处?
它确实能快速找供应商,能理解需求多样性,能建立自己的库存逻辑,也能发起业务迭代。比如从固定上架商品,转向客户定制、预售制度,算是一种“商业模式创新”。它甚至还尝试将顾客偏好输入自己的定价模型,尽管执行得一塌糊涂。
但这些聪明,都被一个根本问题掩盖了:
Claude 是朝着“如何成为一个好帮手”去的,而不是成为“一个好老板”。
Claude 不是不聪明,而是没学会怎么拒绝。
它的商业失败,本质上是一种被训练出来的讨好型人格。用户说什么,它就尽量满足什么。
Claude的翻车,表面上看是因为它“太好人”、“太老实”,但暴露了当前AI Agent无法回避的根本性冲突。