web前端工作职责(Paperclip:”开公司的”AI Agent)

web前端工作职责(Paperclip:”开公司的”AI Agent)
Paperclip:”开公司的”AI Agent


12 天,24000 颗星。这个 TypeScript 项目凭什么在 Agent 编排领域掀起风暴?

一、先说结论:它到底是什么

2026 年 3 月 4 日,一个叫 Paperclip 的开源项目悄然上线 GitHub。12 天后,它的星标数突破 24000,成为 2026 年初增长最快的 AI Agent 项目之一。

Paperclip 自称”零人工公司的编排层”(orchestration layer for zero-human companies)。翻译成人话就是——它不教你怎么造 Agent,它教你怎么用一群 Agent 开公司

这话听着像科幻,但它的实现方式极其”企业”:组织架构图、预算管控、目标层级、考勤心跳、董事会审批。你以为在配置一个 AI 系统,其实你在注册一家公司。只是这家公司的每个”员工”都是 Claude Code、Codex、Cursor 或者 OpenClaw。

二、谁做的?为什么做?

Paperclip 的作者是 Dotta(GitHub: @cryppadotta),他同时还是 Forgotten Runes Wizard’s Cult 的 CEO——一个被 Alexis Ohanian 旗下 Seven Seven Six 基金投资的 Web3 项目。

Dotta 做 Paperclip 的起因很接地气:他当时在跑一个自动化对冲基金,桌面上同时开着 20 个 Claude Code 标签页,但完全不知道哪个 Agent 在干什么、花了多少钱、进度到哪了。

他的感受是:单个 Agent 像员工一样好用,但没人来管理这些”员工”。CrewAI 管的是任务分配,LangGraph 管的是流程编排,但谁来管预算?谁来管汇报关系?谁来管这个 Agent 为什么在做这件事

于是他造了 Paperclip,然后在 Twitter 上放出了那句定位极其清晰的 Slogan:

“如果 OpenClaw 是一个员工,Paperclip 就是这家公司。”

三、项目画像:一眼看清家底

先看硬指标(截至 2026 年 3 月 15 日):

指标

数值

GitHub 星标

~24,300

Fork 数

~3,300

总提交数

1,008

Open Issue

~244

Open PR

~380

CI/CD 运行次数

1,940+

主语言

TypeScript

许可证

MIT

当前版本

v0.3.1(3 月 12 日发布)

每版本贡献者数

14–24 人

增长曲线很陡:3 月 6 日 4,300 星 → 3 月 10 日 14,600 → 3 月 11 日 20,000 → 3 月 15 日 24,000。传播路径几乎全靠 Twitter/X,Dotta 的发布推文获得了 71,400 次浏览和 2,200 个点赞。在 Hacker News 和 Reddit 上反而没掀起太大水花。

除了核心仓库,paperclipai 组织下还有 8 个子项目,包括 clipmart(计划中的公司模板交易市场)、companies(预置公司模板)、pr-reviewer(PR 分发界面)和基于 Mintlify 的文档站。

四、技术架构:一个 TypeScript Monorepo 里的”公司”

Paperclip 是一个 pnpm monorepo,完全用 TypeScript 编写,核心结构如下:

server/          → Express REST API + 编排服务(端口 3100)ui/              → React + Vite 仪表盘(支持 PWA 安装)packages/db/     → Drizzle ORM 数据模型与迁移packages/shared/ → 共享类型、常量、校验器cli/             → paperclipai 命令行工具skills/          → 运行时技能注入文件

数据库层用 PostgreSQL,但开发体验做得很聪明:本地开发直接内嵌 PGlite(零外部依赖),生产环境接外部 Postgres。只需一行命令就能跑起来:

npx paperclipai onboard --yes

前端以 PWA(Progressive Web App)形式发布,支持 Service Worker 离线缓存,可以装到手机上随时监控 Agent 状态。界面包括仪表盘、组织架构图、工单视图(支持线程式对话)、成本面板(按 Agent 显示预算进度条)、收件箱、审批队列、命令面板,以及带 Markdown 渲染的运行日志查看器。

测试框架用的是 Vitest(单元测试)和 Playwright(端到端测试)。CI/CD 基于 GitHub Actions,包含 PR 校验、策略检查和 lockfile 刷新流水线。

五、五根脊柱:Paperclip 凭什么说自己不一样

柱子一:组织架构即基础设施

Paperclip 把真实的企业层级结构做成了一等公民——角色(Role)、职位(Title)、岗位职责(Job Description)、汇报关系(Reporting Line)全部显式建模。

一个典型的架构可能长这样:CEO(Claude)→ CTO(Cursor)+ CMO(OpenClaw)+ COO(Claude)→ 工程师(Codex、Claude Code)。当你输入一个公司使命(Mission),系统会自动生成组织架构、创建 Agent 角色、开始分配工单。委派沿着层级自动流转,跨部门请求会根据角色定义路由到最合适的 Agent。

柱子二:原子级预算管控

每个 Agent 有一个月度美元支出上限。预算执行是原子操作——领取任务和扣减预算在同一个事务里完成,从根上杜绝重复计费和失控消费。

80% 使用率时触发软警告,100% 时硬停——Agent 自动暂停,新任务被阻断。人类操作者(”董事会”)可以随时覆盖限额。费用追踪精确到四个层级:单 Agent、单任务、单项目、单目标。心跳产生的开销走专门的 costService,不和业务逻辑混在一起。

有位 Medium 上的方案架构师 Kelvin Kwong 做了详细的上手评测,称预算治理是他在任何 Agent 框架中见过的最实用的创新

柱子三:目标对齐——每个任务都知道”为什么”

Paperclip 里的每一个任务都能回溯到公司使命,中间经过一条完整的目标链

公司使命 → 项目目标 → Agent 目标 → 具体任务

这意味着每个 Agent 不只知道做什么,还知道为什么做。当一个 Agent 接手工单时,它会收到从使命到当前任务的完整目标血统(Goal Ancestry),作为上下文注入。

这个设计看似简单,但在多 Agent 协作中极其关键。没有它,下游 Agent 容易陷入”局部最优”——完成了手头的事,却偏离了公司方向。

柱子四:心跳驱动的调度机制

Agent 不是永远在线。它们按可配置的时间表(心跳/Heartbeat)醒来,检查待办工作,执行,汇报,然后回去”睡觉”。任何能接收心跳信号的 Agent 运行时都兼容。

v0.3.1 新增了 skipWhenIdle 心跳策略(PR #921),允许 Agent 在没有待办工作时跳过唤醒周期。Agent 的状态在心跳和重启之间持久化,上下文不会因为”下班”而丢失。

柱子五:治理——人类是”董事会”

人类操作者在 Paperclip 中扮演的不是产品经理,而是董事会。权限包括:批准”招聘”(启动新 Agent)、覆盖战略、暂停或终止 Agent。敏感操作有审批门槛。配置变更带版本控制和回滚能力。

所有决策记录在一个不可变的追加写入审计日志里,包含完整的工具调用链路。审批操作具有幂等性——重复提交不会产生重复记录。

六、Agent 之间怎么沟通?不靠聊天,靠工单

这是 Paperclip 和 AutoGen、LangGraph 最本质的区别。

AutoGen 靠的是对话——Agent 之间像微信群聊一样你一句我一句。LangGraph 靠的是状态机——Agent 之间通过图节点传递状态。

Paperclip 靠的是工单系统,类似 Jira 或 GitHub Issues:

  • 工单(Ticket) 定义工作单元,有明确的负责人、状态和线程式对话
  • 委派(Delegation) 沿组织架构流转——上级 Agent 给下属 Agent 派单
  • @提及 会触发事件驱动的唤醒,把特定 Agent 叫起来
  • 上下文 通过嵌入工单的目标血统传递
  • 每一条指令、响应、工具调用都记录在不可变审计日志中

用 Paperclip 文档里的一句话概括:“Agent 有的是岗位,不是聊天窗口。”

七、自带你的 Agent:10 种运行时适配器

Paperclip 不造 Agent,也不绑定运行时。它提供的是适配器层,目前支持 10 种:

适配器

说明

Claude Code

本地编码 Agent,环境变量隔离

OpenClaw

网关 SSE 流式传输,设备密钥配对

Codex

OpenAI 的编码 Agent

Cursor

模型发现、运行日志流、技能注入

OpenCode

一等支持,含模型发现

Pi

本地 RPC 模式,含成本追踪

Gemini CLI

API Key 探测、轮次限制、三种运行模式

Mistral Vibe

开发中(PR #917)

Bash

Shell 命令执行

HTTP

Webhook 方式,接入任意外部服务

还有一套运行时技能注入系统:通过向 Agent 环境注入 SKILLS.md 文件,让 Agent 在不重新训练的前提下学会 Paperclip 的工作流。系统同时提供面向 Agent 的机器可读 API 文档。

八、它和其他框架到底什么关系?

很多人第一反应是”这不就是另一个 CrewAI 吗?”不是。层次不一样。

[单体 Agent]        → Claude Code, OpenClaw, Codex, Cursor[Agent 框架]         → CrewAI, LangGraph, AutoGen, MetaGPT[公司编排层]         → Paperclip  ← 就在这里[业务运营]           → 营收、客户、产品

能力

Paperclip

CrewAI

AutoGen

LangGraph

MetaGPT

组织架构层级

✅ 完整

❌ 扁平角色

部分

预算管控

✅ 原子级

web前端工作职责(Paperclip:”开公司的”AI Agent)

目标血统

✅ 使命→任务

部分

董事会治理

✅ 审批门控

HITL

不可变审计

多公司隔离

Agent 无关

✅ 任意运行时

❌ 自有 Agent

持久化调度

✅ 心跳机制

主语言

TypeScript

Python

Python

Python

Python

MetaGPT 和 ChatDev 在概念上最接近——它们也模拟 CEO、CTO、程序员的企业角色。但它们只覆盖软件开发场景,而且是框架——你要用它们来构建 Agent。Paperclip 覆盖所有业务功能,且不构建 Agent,只管理 Agent。

CrewAI 管的是任务小队,不是公司。AutoGen 以对话为中心。LangGraph 是底层的图执行引擎,理论上可以跑在 Paperclip 的某个 Agent 内部。

真正的竞品在”公司即服务”赛道:

  • Polsia(闭源,$50/月 + 20% 营收分成,3,800+ 活跃公司)
  • Moltcorp(民主制 Agent 治理,没有人类覆盖权——结构上和 Paperclip 的董事会模型正好相反)
  • ZHC Institute(私密的从业者网络,专注 OpenClaw 方案)。

九、社区怎么看?

开发者反响整体很积极,但带着清醒

Kelvin Kwong(Medium 上的方案架构师)做了最详细的上手评测。他夸安装过程”简单得让人起疑”,称预算治理是框架中的最佳实践。但他也警告:“模糊的输入会产生模糊的 Agent 职责。垃圾进,混乱出。” 他还指出,两周内拿到两万颗星,这代表的是开发者的好奇心,不是生产就绪度。

Brian Roemmele(自称”零人工公司”概念的发起人,46K 浏览量)评价 Paperclip 是”零人工运动中的同道”,但指出它还没展示过大规模并行能力——他自己的方案能跑 2,048 个 Agent,峰值 64,000 个,Paperclip 还没在这个量级上验证过。

Flowtivity(澳洲 AI 咨询公司)从实战角度给了一个警示:“当一个 AI Agent 犯了错并把结果喂给另一个 Agent,错误会像多米诺一样传下去。我们吃过亏——一次批量外联本来只该联系 3 个客户,结果发给了 23 个。” 他们认为 ROI 是真实的,但见效要在第二、三个月,不是第一周

Dion Hinchcliffe(VP & 首席分析师)在 Twitter 上称之为”未来工作方式的重要路标”,并用了”科幻级”这个词。

值得注意的是:在 Hacker News 和 Reddit 上几乎找不到讨论帖。传播几乎完全集中在 Twitter/X,这说明受众目前还是 AI Agent 圈子的核心爱好者,尚未破圈到更广的开发者社区。

十、预置的公司模板:不是概念,是能跑的

在 companies 仓库和计划中的 Clipmart 市场里,已经有一批预置模板:

  • 内容营销公司——8 个 Agent 负责 SEO、博客写作、社交媒体排期
  • 加密货币交易台——12 个 Agent 做分析、执行、风控、合规
  • 电商运营——10 个 Agent 管理商品、客服、库存、广告
  • YouTube/TikTok 内容工厂——5–6 个 Agent 写脚本、剪视频、做封面
  • 开发工作室——9 个 Agent 扮演 PM、工程师、QA、DevOps
  • 房产获客——7 个 Agent 做潜客发掘、外联、跟进、成交

README 里的标杆案例是:“打造排名第一的 AI 笔记应用,做到 100 万美元月经常性收入”——作为公司使命输入后,Paperclip 自动生成组织架构并开始分配任务。一位叫 Scott Sparkwave 的用户公开记录了他用 8 个 Agent 在 Paperclip 上运营真实业务(Sparkwave Digital)的过程,Dotta 在 Twitter 上转发后获得了 54,600 次浏览。

十一、冷水时间:它的短板在哪

这是一个 年龄只有12 天的项目。 多位评测者明确说:现在的态度应该是”保持关注”,而不是”明天上线”。

可扩展性未经验证。 没有公开的基准测试,超过约 20 个 Agent 的场景都还是空白。Brian Roemmele 的对比尤其扎眼——他的方案跑几千个并发 Agent 毫无压力,Paperclip 还没在这个量级上测试过。v0.3.1 新增的”成本安全熔断器”(PR #920)暗示团队正在加固生产稳定性。

TypeScript 在 Python 主导的生态里是异类。 整个 AI/ML 生态以 Python 为中心。Paperclip 的 Node.js + React 技术栈对 LangChain、CrewAI、AutoGen 用户来说有切换成本,而且目前没有 Python SDK。

不支持标准协议。 不同于正在拥抱 A2A(Agent-to-Agent)和 MCP(Model Context Protocol)标准的 CrewAI 和 LangGraph,Paperclip 的适配器系统是自定义的。随着生态成熟,这可能成为互操作性的瓶颈。

质量取决于你的使命描述。 自动生成的组织架构好不好,完全取决于你的使命描述写得好不好。含混的描述 = 混乱的 Agent 分工 = 浪费的预算。

错误会级联放大。 当 Agent 通过工单系统把输出喂给其他 Agent 时,错误会像滚雪球一样越滚越大。Flowtivity 的 23 人外联事故就是例子。

只有自托管。 没有托管的云服务,非技术用户或不想管基础设施的团队门槛较高。

Clipmart 还是画饼。 公司模板交易市场目前只在路线图上,还没有可用的产品。

十二、对 Agent 开发者的实际价值

说了这么多,Paperclip 对你我——写代码的 AI Agent 开发工程师——到底有什么用?

第一,架构思路值得借鉴。 即使你不用 Paperclip,”原子级预算管控”和”目标血统上下文注入”这两个设计模式可以直接移植到你自己的多 Agent 系统里。前者解决的是”多少钱花在了哪个 Agent 身上”这个所有人都在头疼但没人认真做的问题;后者解决的是”下游 Agent 不知道全局目标”这个协作中最常见的对齐失败。

第二,它把”Agent 编排”往上抬了一层。 过去我们聊 Agent 编排,聊的是任务分配、流程图、状态机。Paperclip 把讨论抬到了”组织设计”的高度——汇报关系、权责划分、审计追溯。这不是噱头,而是当 Agent 数量超过 10 个之后你必须面对的真问题。

第三,”公司即服务”这个赛道刚刚打开。 Paperclip、Polsia、Moltcorp 代表了三种截然不同的治理哲学:Paperclip 是人类独裁(董事会模型),Moltcorp 是 Agent 民主(无人类覆盖权),Polsia 是商业闭源。作为开发者,现在是介入这个方向最好的时机——标准未定,格局未成。

第四,谨慎对待生产部署。 12 天的项目,24000 颗星,版本号 v0.3.1。这三个数字放在一起,传递的信号是:社区兴奋度拉满,但工程成熟度还在路上。把它当成学习材料和设计参考,比把它直接搬进生产线更明智。

文章版权声明:除非注明,否则均为边学边练网络文章,版权归原作者所有