12 天,24000 颗星。这个 TypeScript 项目凭什么在 Agent 编排领域掀起风暴?
一、先说结论:它到底是什么
2026 年 3 月 4 日,一个叫 Paperclip 的开源项目悄然上线 GitHub。12 天后,它的星标数突破 24000,成为 2026 年初增长最快的 AI Agent 项目之一。
Paperclip 自称”零人工公司的编排层”(orchestration layer for zero-human companies)。翻译成人话就是——它不教你怎么造 Agent,它教你怎么用一群 Agent 开公司。
这话听着像科幻,但它的实现方式极其”企业”:组织架构图、预算管控、目标层级、考勤心跳、董事会审批。你以为在配置一个 AI 系统,其实你在注册一家公司。只是这家公司的每个”员工”都是 Claude Code、Codex、Cursor 或者 OpenClaw。
二、谁做的?为什么做?
Paperclip 的作者是 Dotta(GitHub: @cryppadotta),他同时还是 Forgotten Runes Wizard’s Cult 的 CEO——一个被 Alexis Ohanian 旗下 Seven Seven Six 基金投资的 Web3 项目。
Dotta 做 Paperclip 的起因很接地气:他当时在跑一个自动化对冲基金,桌面上同时开着 20 个 Claude Code 标签页,但完全不知道哪个 Agent 在干什么、花了多少钱、进度到哪了。
他的感受是:单个 Agent 像员工一样好用,但没人来管理这些”员工”。CrewAI 管的是任务分配,LangGraph 管的是流程编排,但谁来管预算?谁来管汇报关系?谁来管这个 Agent 为什么在做这件事?
于是他造了 Paperclip,然后在 Twitter 上放出了那句定位极其清晰的 Slogan:
“如果 OpenClaw 是一个员工,Paperclip 就是这家公司。”
三、项目画像:一眼看清家底
先看硬指标(截至 2026 年 3 月 15 日):
指标 | 数值 |
GitHub 星标 | ~24,300 |
Fork 数 | ~3,300 |
总提交数 | 1,008 |
Open Issue | ~244 |
Open PR | ~380 |
CI/CD 运行次数 | 1,940+ |
主语言 | TypeScript |
许可证 | MIT |
当前版本 | v0.3.1(3 月 12 日发布) |
每版本贡献者数 | 14–24 人 |
增长曲线很陡:3 月 6 日 4,300 星 → 3 月 10 日 14,600 → 3 月 11 日 20,000 → 3 月 15 日 24,000。传播路径几乎全靠 Twitter/X,Dotta 的发布推文获得了 71,400 次浏览和 2,200 个点赞。在 Hacker News 和 Reddit 上反而没掀起太大水花。
除了核心仓库,paperclipai 组织下还有 8 个子项目,包括 clipmart(计划中的公司模板交易市场)、companies(预置公司模板)、pr-reviewer(PR 分发界面)和基于 Mintlify 的文档站。
四、技术架构:一个 TypeScript Monorepo 里的”公司”
Paperclip 是一个 pnpm monorepo,完全用 TypeScript 编写,核心结构如下:
server/ → Express REST API + 编排服务(端口 3100)ui/ → React + Vite 仪表盘(支持 PWA 安装)packages/db/ → Drizzle ORM 数据模型与迁移packages/shared/ → 共享类型、常量、校验器cli/ → paperclipai 命令行工具skills/ → 运行时技能注入文件数据库层用 PostgreSQL,但开发体验做得很聪明:本地开发直接内嵌 PGlite(零外部依赖),生产环境接外部 Postgres。只需一行命令就能跑起来:
npx paperclipai onboard --yes前端以 PWA(Progressive Web App)形式发布,支持 Service Worker 离线缓存,可以装到手机上随时监控 Agent 状态。界面包括仪表盘、组织架构图、工单视图(支持线程式对话)、成本面板(按 Agent 显示预算进度条)、收件箱、审批队列、命令面板,以及带 Markdown 渲染的运行日志查看器。
测试框架用的是 Vitest(单元测试)和 Playwright(端到端测试)。CI/CD 基于 GitHub Actions,包含 PR 校验、策略检查和 lockfile 刷新流水线。
五、五根脊柱:Paperclip 凭什么说自己不一样
柱子一:组织架构即基础设施
Paperclip 把真实的企业层级结构做成了一等公民——角色(Role)、职位(Title)、岗位职责(Job Description)、汇报关系(Reporting Line)全部显式建模。
一个典型的架构可能长这样:CEO(Claude)→ CTO(Cursor)+ CMO(OpenClaw)+ COO(Claude)→ 工程师(Codex、Claude Code)。当你输入一个公司使命(Mission),系统会自动生成组织架构、创建 Agent 角色、开始分配工单。委派沿着层级自动流转,跨部门请求会根据角色定义路由到最合适的 Agent。
柱子二:原子级预算管控
每个 Agent 有一个月度美元支出上限。预算执行是原子操作——领取任务和扣减预算在同一个事务里完成,从根上杜绝重复计费和失控消费。
80% 使用率时触发软警告,100% 时硬停——Agent 自动暂停,新任务被阻断。人类操作者(”董事会”)可以随时覆盖限额。费用追踪精确到四个层级:单 Agent、单任务、单项目、单目标。心跳产生的开销走专门的 costService,不和业务逻辑混在一起。
有位 Medium 上的方案架构师 Kelvin Kwong 做了详细的上手评测,称预算治理是他在任何 Agent 框架中见过的最实用的创新。
柱子三:目标对齐——每个任务都知道”为什么”
Paperclip 里的每一个任务都能回溯到公司使命,中间经过一条完整的目标链:
公司使命 → 项目目标 → Agent 目标 → 具体任务这意味着每个 Agent 不只知道做什么,还知道为什么做。当一个 Agent 接手工单时,它会收到从使命到当前任务的完整目标血统(Goal Ancestry),作为上下文注入。
这个设计看似简单,但在多 Agent 协作中极其关键。没有它,下游 Agent 容易陷入”局部最优”——完成了手头的事,却偏离了公司方向。
柱子四:心跳驱动的调度机制
Agent 不是永远在线。它们按可配置的时间表(心跳/Heartbeat)醒来,检查待办工作,执行,汇报,然后回去”睡觉”。任何能接收心跳信号的 Agent 运行时都兼容。
v0.3.1 新增了 skipWhenIdle 心跳策略(PR #921),允许 Agent 在没有待办工作时跳过唤醒周期。Agent 的状态在心跳和重启之间持久化,上下文不会因为”下班”而丢失。
柱子五:治理——人类是”董事会”
人类操作者在 Paperclip 中扮演的不是产品经理,而是董事会。权限包括:批准”招聘”(启动新 Agent)、覆盖战略、暂停或终止 Agent。敏感操作有审批门槛。配置变更带版本控制和回滚能力。
所有决策记录在一个不可变的追加写入审计日志里,包含完整的工具调用链路。审批操作具有幂等性——重复提交不会产生重复记录。
六、Agent 之间怎么沟通?不靠聊天,靠工单
这是 Paperclip 和 AutoGen、LangGraph 最本质的区别。
AutoGen 靠的是对话——Agent 之间像微信群聊一样你一句我一句。LangGraph 靠的是状态机——Agent 之间通过图节点传递状态。
Paperclip 靠的是工单系统,类似 Jira 或 GitHub Issues:
- 工单(Ticket) 定义工作单元,有明确的负责人、状态和线程式对话
- 委派(Delegation) 沿组织架构流转——上级 Agent 给下属 Agent 派单
- @提及 会触发事件驱动的唤醒,把特定 Agent 叫起来
- 上下文 通过嵌入工单的目标血统传递
- 每一条指令、响应、工具调用都记录在不可变审计日志中
用 Paperclip 文档里的一句话概括:“Agent 有的是岗位,不是聊天窗口。”
七、自带你的 Agent:10 种运行时适配器
Paperclip 不造 Agent,也不绑定运行时。它提供的是适配器层,目前支持 10 种:
适配器 | 说明 |
Claude Code | 本地编码 Agent,环境变量隔离 |
OpenClaw | 网关 SSE 流式传输,设备密钥配对 |
Codex | OpenAI 的编码 Agent |
Cursor | 模型发现、运行日志流、技能注入 |
OpenCode | 一等支持,含模型发现 |
Pi | 本地 RPC 模式,含成本追踪 |
Gemini CLI | API Key 探测、轮次限制、三种运行模式 |
Mistral Vibe | 开发中(PR #917) |
Bash | Shell 命令执行 |
HTTP | Webhook 方式,接入任意外部服务 |
还有一套运行时技能注入系统:通过向 Agent 环境注入 SKILLS.md 文件,让 Agent 在不重新训练的前提下学会 Paperclip 的工作流。系统同时提供面向 Agent 的机器可读 API 文档。
八、它和其他框架到底什么关系?
很多人第一反应是”这不就是另一个 CrewAI 吗?”不是。层次不一样。
[单体 Agent] → Claude Code, OpenClaw, Codex, Cursor[Agent 框架] → CrewAI, LangGraph, AutoGen, MetaGPT[公司编排层] → Paperclip ← 就在这里[业务运营] → 营收、客户、产品能力 | Paperclip | CrewAI | AutoGen | LangGraph | MetaGPT |
组织架构层级 | ✅ 完整 | ❌ 扁平角色 | ❌ | ❌ | 部分 |
预算管控 | ✅ 原子级 | ❌ | ❌
| ❌ | ❌ |
目标血统 | ✅ 使命→任务 | 部分 | ❌ | ❌ | ❌ |
董事会治理 | ✅ 审批门控 | ❌ | ❌ | HITL | ❌ |
不可变审计 | ✅ | ❌ | ❌ | ❌ | ❌ |
多公司隔离 | ✅ | ❌ | ❌ | ❌ | ❌ |
Agent 无关 | ✅ 任意运行时 | ❌ 自有 Agent | ❌ | ❌ | ❌ |
持久化调度 | ✅ 心跳机制 | ❌ | ❌ | ❌ | ❌ |
主语言 | TypeScript | Python | Python | Python | Python |
MetaGPT 和 ChatDev 在概念上最接近——它们也模拟 CEO、CTO、程序员的企业角色。但它们只覆盖软件开发场景,而且是框架——你要用它们来构建 Agent。Paperclip 覆盖所有业务功能,且不构建 Agent,只管理 Agent。
CrewAI 管的是任务小队,不是公司。AutoGen 以对话为中心。LangGraph 是底层的图执行引擎,理论上可以跑在 Paperclip 的某个 Agent 内部。
真正的竞品在”公司即服务”赛道:
- Polsia(闭源,$50/月 + 20% 营收分成,3,800+ 活跃公司)
- Moltcorp(民主制 Agent 治理,没有人类覆盖权——结构上和 Paperclip 的董事会模型正好相反)
- ZHC Institute(私密的从业者网络,专注 OpenClaw 方案)。
九、社区怎么看?
开发者反响整体很积极,但带着清醒。
Kelvin Kwong(Medium 上的方案架构师)做了最详细的上手评测。他夸安装过程”简单得让人起疑”,称预算治理是框架中的最佳实践。但他也警告:“模糊的输入会产生模糊的 Agent 职责。垃圾进,混乱出。” 他还指出,两周内拿到两万颗星,这代表的是开发者的好奇心,不是生产就绪度。
Brian Roemmele(自称”零人工公司”概念的发起人,46K 浏览量)评价 Paperclip 是”零人工运动中的同道”,但指出它还没展示过大规模并行能力——他自己的方案能跑 2,048 个 Agent,峰值 64,000 个,Paperclip 还没在这个量级上验证过。
Flowtivity(澳洲 AI 咨询公司)从实战角度给了一个警示:“当一个 AI Agent 犯了错并把结果喂给另一个 Agent,错误会像多米诺一样传下去。我们吃过亏——一次批量外联本来只该联系 3 个客户,结果发给了 23 个。” 他们认为 ROI 是真实的,但见效要在第二、三个月,不是第一周。
Dion Hinchcliffe(VP & 首席分析师)在 Twitter 上称之为”未来工作方式的重要路标”,并用了”科幻级”这个词。
值得注意的是:在 Hacker News 和 Reddit 上几乎找不到讨论帖。传播几乎完全集中在 Twitter/X,这说明受众目前还是 AI Agent 圈子的核心爱好者,尚未破圈到更广的开发者社区。
十、预置的公司模板:不是概念,是能跑的
在 companies 仓库和计划中的 Clipmart 市场里,已经有一批预置模板:
- 内容营销公司——8 个 Agent 负责 SEO、博客写作、社交媒体排期
- 加密货币交易台——12 个 Agent 做分析、执行、风控、合规
- 电商运营——10 个 Agent 管理商品、客服、库存、广告
- YouTube/TikTok 内容工厂——5–6 个 Agent 写脚本、剪视频、做封面
- 开发工作室——9 个 Agent 扮演 PM、工程师、QA、DevOps
- 房产获客——7 个 Agent 做潜客发掘、外联、跟进、成交
README 里的标杆案例是:“打造排名第一的 AI 笔记应用,做到 100 万美元月经常性收入”——作为公司使命输入后,Paperclip 自动生成组织架构并开始分配任务。一位叫 Scott Sparkwave 的用户公开记录了他用 8 个 Agent 在 Paperclip 上运营真实业务(Sparkwave Digital)的过程,Dotta 在 Twitter 上转发后获得了 54,600 次浏览。
十一、冷水时间:它的短板在哪
这是一个 年龄只有12 天的项目。 多位评测者明确说:现在的态度应该是”保持关注”,而不是”明天上线”。
可扩展性未经验证。 没有公开的基准测试,超过约 20 个 Agent 的场景都还是空白。Brian Roemmele 的对比尤其扎眼——他的方案跑几千个并发 Agent 毫无压力,Paperclip 还没在这个量级上测试过。v0.3.1 新增的”成本安全熔断器”(PR #920)暗示团队正在加固生产稳定性。
TypeScript 在 Python 主导的生态里是异类。 整个 AI/ML 生态以 Python 为中心。Paperclip 的 Node.js + React 技术栈对 LangChain、CrewAI、AutoGen 用户来说有切换成本,而且目前没有 Python SDK。
不支持标准协议。 不同于正在拥抱 A2A(Agent-to-Agent)和 MCP(Model Context Protocol)标准的 CrewAI 和 LangGraph,Paperclip 的适配器系统是自定义的。随着生态成熟,这可能成为互操作性的瓶颈。
质量取决于你的使命描述。 自动生成的组织架构好不好,完全取决于你的使命描述写得好不好。含混的描述 = 混乱的 Agent 分工 = 浪费的预算。
错误会级联放大。 当 Agent 通过工单系统把输出喂给其他 Agent 时,错误会像滚雪球一样越滚越大。Flowtivity 的 23 人外联事故就是例子。
只有自托管。 没有托管的云服务,非技术用户或不想管基础设施的团队门槛较高。
Clipmart 还是画饼。 公司模板交易市场目前只在路线图上,还没有可用的产品。
十二、对 Agent 开发者的实际价值
说了这么多,Paperclip 对你我——写代码的 AI Agent 开发工程师——到底有什么用?
第一,架构思路值得借鉴。 即使你不用 Paperclip,”原子级预算管控”和”目标血统上下文注入”这两个设计模式可以直接移植到你自己的多 Agent 系统里。前者解决的是”多少钱花在了哪个 Agent 身上”这个所有人都在头疼但没人认真做的问题;后者解决的是”下游 Agent 不知道全局目标”这个协作中最常见的对齐失败。
第二,它把”Agent 编排”往上抬了一层。 过去我们聊 Agent 编排,聊的是任务分配、流程图、状态机。Paperclip 把讨论抬到了”组织设计”的高度——汇报关系、权责划分、审计追溯。这不是噱头,而是当 Agent 数量超过 10 个之后你必须面对的真问题。
第三,”公司即服务”这个赛道刚刚打开。 Paperclip、Polsia、Moltcorp 代表了三种截然不同的治理哲学:Paperclip 是人类独裁(董事会模型),Moltcorp 是 Agent 民主(无人类覆盖权),Polsia 是商业闭源。作为开发者,现在是介入这个方向最好的时机——标准未定,格局未成。
第四,谨慎对待生产部署。 12 天的项目,24000 颗星,版本号 v0.3.1。这三个数字放在一起,传递的信号是:社区兴奋度拉满,但工程成熟度还在路上。把它当成学习材料和设计参考,比把它直接搬进生产线更明智。
