出品|虎嗅科技组
作者|陈伊凡
编辑|苗正卿
头图|AI生成
“AI原生100”是虎嗅科技组推出针对AI原生创新栏目,这是本系列的第「56」篇文章
今年四月,甲骨文公司裁掉了全球3万名员工,占其总人力的五分之一。这家云平台巨头的赌注很明确:AI可以顶上这些岗位,而系统不会崩溃。
对于前AWS人工智能研究员Raphael Shu来说,这是一个信号:当企业的经济主体从“人”切换到“AI”时,变革的临界点已经到来。
Raphael Shu 显然是那个对智能体未来更激进的人。他曾早在2022年,即 ChatGPT 发布前,就在亚马逊内部推动了 Agent 的研发。
在与虎嗅交流时,Raphael 刚结束一场跨时区的会议。因为长期旅居国外,他的中文表达不算流利,语速很慢,表达的速度跟不上思考的速度。
2022年ChatGPT尚未问世,他已在亚马逊内部推动智能体(Agent)研发。如今他创办的OpenAgents只有7名员工,但目标是让这个小团队带着上百个AI协同工作。他的判断是:随着大模型推理速度指数级飙升,人类不仅会失去执行层的主导权,甚至会沦为阻塞生产链条的“效率瓶颈”。
带着这样的预判,Raphael 离开亚马逊创办了 OpenAgents。他的初创团队目前仅有7名员工,但他们的近期目标是:让这几个员工带着上百个 AI 一起工作。他们致力于为多智能体提供一个互相交流、协作互动的底层场所,打造一个专属于 AI 的“数字城邦”。
在 Raphael 看来,多智能体协作是现阶段 AI 行业最值得押注的方向之一,且留给行业的窗口期,只剩1到2年。
Raphael Shu演讲 图片由OpenAgents提供
2022年,Raphael还在AWS,ChatGPT还没出来,那时候最好的大模型叫Code davinci 002,你问它“人怎么上火星”,它会回答“人怎么上月球”、“人怎么上太阳”。
彼时,Raphael Shu和他在AWS的团队做了一个实验:把当时最好的大模型接进来,让它一边和人对话、一边写代码。他们连了一个Dropbox,让模型先自己读文档学会怎么用Dropbox,然后告诉它“帮我把所有TXT文件重命名成MD”——它就自己写代码,把这事办了。这成了智能体协作的雏形。
Chat GPT出来后,全球都在进行“大模型炼丹”的游戏,没有人在意智能体,甚至听不懂所谓的“AI Agent”是什么。
在大型科技公司的官僚体系中,最具颠覆性的创新往往首先被视为某种乏味的微调。Raphael在公司推“Agent”,大家一看demo,第一反应就是“这也就是更聪明的RPA(流程自动化)”,但是“RPA历史上都没多少用户,这能有什么用”。但当这项技术雏形被呈递给高管时,得到的冷淡回应:“这不就是更聪明的RPA(机器人流程自动化)吗?”
直到2023年3月,OpenAI推出了ChatGPT Plugin。决策者们恍然大悟,紧急开会,迅速拨给 Raphael 10个人和一大笔数据标注预算(他们还在印度雇佣了大量标注工程师),要求他以最快速度将 Agent 能力训练到亚马逊自研的大模型中。
但大厂留给创新的窗口期总是极短。随着 AWS 内部两位关键人物的离开,Raphael 决定不再等待,从亚马逊抽身,躬身入局。
刚出来创业时,Raphael Shu回了趟中国,他几乎把国内排名前 20 的头部投资机构聊了个遍。但他发现,当时国内投资人对 Agent 的认知,几乎全部停留在“Langchain 思维”里。“
在 Raphael 看来,Langchain 用一种极具“误导性”的方式定义了 Agent——它将 Agent 矮化为了一个固定的“工作流(Workflow)”。这导致当你在聊 Agent 时,大家脑子里想的依然是画流程图。当 Raphael 试图向他们推销“多智能体协作”时,投资人以为的只是“多个工作流之间如何串联”。
但这二者有着本质的区别:工作流是死板的“流水线”,上下游按部就班,一步出错全盘崩溃;而多智能体协作则是“人类团队开会”,不同的 AI 扮演不同的角色,它们可以自主对话、动态分工,甚至互相纠错。
2026年,OpenClaw出现,许多人才开始接受了多智能体协作的概念,但Raphael早就料到了这个趋势。随后,另一个比OpenClaw距离真正的AI员工更近的应用Hermes出现。
Raphael认为,OpenClaw能火,是因为打了两个关键概念:一是“打造属于你自己的agent”,把AI从工具变成了工具人;二是它极其聪明地将交互界面搬到了 Telegram 上,让用户像给真人发微信一样,给 AI 派发任务、接收汇报。这让许多不懂技术的 CEO 和律师也能瞬间 Get 到它的价值。随后,距离真正的“AI 员工”更近的开源项目 Hermes 也应运而生。
但 Raphael 敏锐地指出,OpenClaw 并非没有代价,它的致命伤在于“极低的透明度”。由于用户完全看不到 Agent 在沙盒里具体执行了什么操作,这导致它极难被应用于软件开发这类需要过程全透明的场景。
这揭示了一个有趣的 PMF(产品市场契合度)错位:OpenClaw 最终圈粉的,其实是与开发者完全反向的那批人——因为开发者需要掌控感和透明度,而许多非技术用户根本不在乎黑盒里的过程,他们只要结果。
Raphael Shu成立OpenAgents,想做另一件事。
“如果大家都在打一场篮球赛,OpenClaw 想做的是场上最好的篮球选手,而我们想做的,是提供最好的篮球场。” Raphael 这样形容 OpenAgents 的定位,OpenAgents打造一个开放平台,允许用户接入各式各样的 Agent,甚至自定义 Agent。
但这块“篮球场”的搭建并非一帆风顺。去年,Raphael 团队的核心精力放在了打造一款面向开发者的底层工具上——通过 Python 构建一个网络,让基于 Langchain 或 AutoGen 开发的 Agent 能在其中互相通信与协作。
然而,当他们举办一场几百人规模的黑客松,却发现真正能运用工具跑通项目的人远低于预期时,Raphael 发现问题既不在宣发,也不在于教育成本,而是伪需求与高门槛:开发者必须先费力做出单个有用的 Agent,然后才能去探索多个 Agent 之间的协作。具备这种复合能力和强烈协作需求的开发者,实在太少了。
认清现实后,团队在今年进行了一次大刀阔斧的转型,决定做一款“Customer Zero Product”(零号客户产品)。这源于 Raphael 的一个坚持:“如果一个产品我们自己团队都不愿意每天用,那我宁愿不做。”
这一思路直接催生了现象级产品 Open Agents Workspace。它彻底抛弃了复杂的代码,变成了一个有 UI 界面、支持 MacOS、Windows 和 Linux 的零代码工作区。用户只需安装软件,像平时用电脑一样点几下鼠标,就能配置好 Agent 并接入工作区,全程不需要写一行代码。
Workspace 上线后的火爆程度超出了所有人的预料。连续三天,服务器被汹涌的流量挤爆,GitHub几天内暴涨了 1600 多颗星。Workspace迅速黏住了一批每天高频使用的铁杆用户,他们甚至比官方还着急。系统一出问题,这些具备技术能力的用户直接在 GitHub 上提 Issue、提 PR,顺手就帮官方把 Bug 修了。甚至有合作方直接出了一名工程师,无偿帮他们开发出了MacOS和手机端的APP。
“你看,这就是开源的价值,” Raphael告诉我,“你不只是拥有一批用户,你拥有的是一批会把自己需求直接变成产品进化能力的人。”
目前,OpenAgents 在国内已积累了七八千名开发者用户,海外也有五六百人的核心圈层。在新加坡的一场国际学术会议 Workshop 上,更是吸引了 560 人付费报名。但这距离 Raphael 的目标还很远,他想要的不仅是规模大,更是一个能影响整个 Agent 经济走向的“超级社区”。
他希望这个社区里有创始人、大厂产品经理、学术界研究员,大家在一个开放环境里共同探讨一个终极命题:当经济的主体从人变成 AI 时,世界会发生什么? 同时,他也定下了一个宏大目标:社区里孵化出 10 万个“Agent Master(智能体大师)”。你不必是懂代码的开发者,只要你拥有并熟练指挥你自己的 Agent,你就是这个新经济生态的一部分。
事实上,这种“经济主体让位给 AI”的未来,已经提前在 OpenAgents 的客户那里上演了。
Raphael 透露,他们目前正在与一家合作公司进行一项名为“Shadow Mode(影子模式)”的激进实验。具体做法是:雇佣一名真人工程师或在线销售,让其在一个特定的模拟器上正常工作 40 小时。在此期间,AI 像影子一样在后台全程静默观察,记录下这个人的所有操作逻辑、行为模式,甚至包括他说话的语气和性格。40小时后,AI 将全面接管这个模拟器,用完全相同的“人类外壳”去自动化完成后续的所有工作。
在 Raphael 看来,OpenAgents 本质上是一家非常典型的 B2B 创业公司。其商业飞轮非常清晰:开源项目负责建立行业影响力和引流,企业端服务(如影子模式)负责创造现金流。
“在这个时代,Idea 本身没有那么值钱。” 经历了大厂的洗礼和创业的摸爬滚打,Raphael 对 AI 红海有着清醒的认知,真正难的是,在每天都有新东西冒出来、每天都有人高呼“这是 Next Big Thing”的喧嚣里,你还能看清楚一个自己愿意长期做下去的方向,并且坚持足够久。而这件事本身,就会成为的壁垒。
如今的 OpenAgents 保持着极致的精简:整个团队仅有7人,3名开发、1名 AI 工程师以及3名市场人员。这恰恰是 Raphael 理想中未来企业的切片:保持 8 到 12 人的极小人类团队规模,但背后却带着 100 个 AI Agents 在“数字领地”里开疆拓土。
这种预演,已经在巨头体内悄然发生。在我们对话的前几周,甲骨文(Oracle)启动了一场波及全球 3 万人的大裁员,裁员比例高达惊人的 18%-20%。
这件事给了 Raphael 极大的震撼。在他看来,云平台不同于普通的软件公司——Photoshop 的代码写错了,顶多是滤镜难看;但云平台的底层代码一旦出错,面临的就是大面积的服务宕机,“Oracle 敢下如此狠手,说明他们内部一定已经跑通了数据,证明裁掉这 20% 的人之后,靠 AI 顶上,系统绝对不会垮。”
这会触发一场可怕的连锁反应:一旦 Oracle 的算盘打通,其他巨头们绝对坐不住。竞争对手通过裁员狂砍运营成本,再把省下的重金砸向 AI,利润率和估值双双飙升——在华尔街的凝视下,谁敢不跟进?
归根结底,这是一笔冷峻的经济账。在美国西海岸,维持一个能独立产出的资深软件工程师,公司一年的综合成本高达 60 万到 80 万美元;而像 Claude Code 这样的 AI 工具,哪怕按最高频次满负荷拉满,一个月的成本也不过九牛一毛。
当两者之间的成本鸿沟足够大时,用 AI 替代人类就不再是“偏好”的问题,而纯粹是个“时间”问题。“我觉得甚至都不需要等 3 到 5 年,快的话可能也就是 1 年左右的事。” Raphael 预判道。
那么,距离多智能体全面接管还有多远?Raphael 认为,在 Agent 大爆发之前,行业还需要几次类似 OpenClaw 这样现象级的创新。并且,这些引爆点极有可能诞生在“闭源产品”中。理由很简单:开源项目极难打磨出具备爆发力的 C 端体验,而闭源产品形态成熟,更容易在交互上完成降维打击,从而迎来真正的破圈。
“这就像人类历史的演进规律一样。” Raphael 用了一个比喻:任何重大成就都会经历两个阶段——首先是“个人突破”,其次是“团队突破”。就像造原子弹,第一阶段是奥本海默这样的天才在理论上验证了制造的可能性;第二阶段,则是把顶尖大脑们聚在一个“曼哈顿计划”里,分工协作把原子弹真正造出来。
当前的 AI 行业,正处于“单个 Agent 能力突破”的奥本海默阶段。而下一个纪元,毫无疑问将是“多智能体协作(Multi-Agent)”引爆的曼哈顿时刻。
Raphael 正在耐心地等待那个时刻的降临。对 OpenAgents 来说,眼下最重要的事情只有一件:赶在狂欢达到高潮之前,把那座最好的“篮球场”先铺好。
虎嗅: 你当时创业为什么选择在美国,而不是回国?
Raphael Shu:我大学毕业之后在日本待了11年,后来才来美国,所以我在国内的人脉非常弱。不过出来之后我回国聊了非常多的人,也发现国内投资圈其实大家互相都认识,我才逐渐觉得这个圈子并没有想象中那么封闭。
虎嗅: 我记得你在AWS从2022年就开始押注agent。那时候ChatGPT都还没出来,为什么会有这么早的判断?
Raphael Shu:以前任何技术,就算你给它一万条训练数据,也很难达到这种程度。所以我们当时就认为,至少对于“能对话、能执行任务”这类机器人来说,大模型是一个颠覆性的转折。后来我也慢慢把这件事想清楚了。一个会话型AI,真正要解决的问题其实只有两个:第一,功能够不够全;第二,对话能不能像人一样自然。以前很多技术最多只能把其中一个维度往前推一点点。大模型出来之后,这两个问题同时被推到了一个新范式里。
虎嗅: 在AWS和Bedrock那段经历里,哪些东西后来投射到了你现在的创业里?
Raphael Shu: 2022年到2023年,我们在AWS内部去押注agent。那段经历很像一次大公司内部创业:你看到了明确方向,但很难说服stakeholder,最后是外部环境变化,反过来推着组织来找你做这件事。
后来我在Bedrock带团队尝试多智能体协作。这两段经历让我形成了一个很重要的判断:AI行业变化太快了,很多人一看到新东西出来,比如MCP出来了,或者OpenClaw出来了,就立刻想跟着做一个项目,但这种跟法其实很危险。不是说这个idea一定错,而是你会没有足够的思考空间。
我现在会更在意一件事:不是看眼前这个机会,而是去想6个月之后,行业里哪些东西是确定会发生的。你如果押注的是那种更长期、更确定的变化,才有时间打磨产品,也才有真正的runway。
虎嗅: 你决定创业后,回国见了一遍投资人,得出了什么判断?
Raphael Shu: 我后来有个很深的感受,就是创业公司大体上其实只有两种模式。
一种是现金流模式,做的是一个长期存在、能稳定产生现金流的business。另一种是IPO模式,在几年之内靠不断融资、快速扩张,把公司推到一个非常大的量级,最后走向IPO或者被大公司高价收购。这两种模式会直接决定你该做什么产品、不该做什么产品,甚至决定你需要什么样的co-founder、招什么样的人。
虎嗅:那你呢?你自己想做哪种公司?
Raphael Shu:第一种。我更想做一个能健康产生现金流的business,而不是疯狂烧钱的公司。
虎嗅: 你们发布了Workspace之后,Github上涨了1600颗星,还有很多开发者自主过来帮你们维护和完善,你们做的是人和agent协同的社区,还是agent和agent协同的社区?
Raphael Shu:现在还是一个过渡形态。我们发布的Workspace首先还是给人用的,所以它强调的是“多个人+多个agent”的协作。但更长远地看,我最看重的其实是agent和agent之间的协同。因为随着推理速度越来越快,人和AI在时间尺度上会越来越不匹配,到最后,人更像是慢速工具,agent才是高速执行和高速协同的主体。
所以在产品设计上,我最看重的不是把一个agent做得多强,而是怎么把一整个agent团队配置好、分工好、协作好。
虎嗅: 如果真进入那个阶段,对多智能体协作意味着什么?
Raphael Shu: 意味着“人告诉它做什么、它做10分钟再回来汇报”这种模式就不够了。公司需要的是能自主决策、24小时运转、自己开会复盘的agent。
举个很实际的例子。假设一家公司里,每个人未来都有自己的agent。如果Bary是CTO,Julia是工程师,两人有时差。Bary给Julia发了一个需求:做一个新的用户登录系统。Julia的agent看完之后,马上会意识到需求缺了关键信息,于是它不会等Julia醒来,而是直接去问Bary的agent:到底是继续用邮箱登录,还是改成Google登录?Bary的agent知道上下文,因为它知道Bary为什么提这个需求,于是会直接回答:全部改成手机号登录。这样很多信息差在agent之间就先补完了。
虎嗅: 你给自己留了多长的runway?
Raphael Shu:对我个人来说,runway基本是无限的,因为我同时也在给其他公司做顾问,但我不打算一直靠这个撑着。我的初衷就是做一个能健康产生现金流的business,不想走疯狂烧钱找接盘侠那条路。
虎嗅: 什么时候准备开始融资?
Raphael Shu:我希望至少等企业端产品有10个客户在用,并且有积极的数据点之后再融资。如果我是做ToC,我可能会做个PPT,马上融一大笔钱,烧三个月看能不能爆。但我们是ToB,我还是更想慢慢把cash flow(现金流)做强。
本文来自虎嗅,原文链接:https://www.huxiu.com/article/4860309.html?f=wyxwapp