#开发者工具

面条的草稿箱
深入浅出 Chrome DevTools Protocol (CDP)：浏览器自动化的幕后功臣当你在 Chrome 中按下 F12 打开开发者工具，查看网络请求、调试 JS 代码或模拟手机时，你是否好奇过这个面板是如何与浏览器核心进行通信的？答案就是 CDP（Chrome DevTools Protocol，Chrome 开发者工具协议）
08:52 · 2026年7月18日 · 周六
深入浅出 Chrome DevTools Protocol (CDP)：浏览器自动化的幕后功臣

当你在 Chrome 中按下 F12 打开开发者工具，查看网络请求、调试 JS 代码或模拟手机时，你是否好奇过这个面板是如何与浏览器核心进行通信的？

答案就是 CDP（Chrome DevTools Protocol，Chrome 开发者工具协议）。它是所有 Chromium 系浏览器（包括 Chrome、Edge、Brave、Arc 等）对外的控制接口。无论是开发者面板本身，还是 Puppeteer、Playwright 等自动化测试框架，甚至是最新的 AI 浏览器 Agent，底层都依赖 CDP。

什么是 CDP？

CDP 是一个基于 JSON 的通信协议，通常通过 WebSocket 传输。它将浏览器的控制权划分为多个不同的“域”（Domains）：

• Page：负责控制页面导航、截屏等。
• Network：观察和拦截网络请求与响应。
• Runtime：执行 JavaScript 代码并获取控制台输出。
• Input：模拟底层的鼠标、键盘和触摸输入。
• Target：发现并连接到不同的页面、Iframe 或 Service Worker。

为什么直接操作原生 CDP 非常困难？

虽然发送 JSON 指令看起来很简单，但维护浏览器状态却极其复杂：

1. 动态生命周期：页面导航会销毁旧的 JavaScript 执行上下文并创建新的上下文。一旦发生跳转，之前的对象 ID 和引用都会失效。
2. 多进程架构（Site Isolation）：为了安全，浏览器会将跨站点的 Iframe 放在不同的渲染进程中。在 CDP 中，这意味着它们会被作为不同的 Target 暴露，你需要自己管理复杂的 Session 树。
3. 协议演进快：CDP 的方法会随着 Chromium 的更新而频繁变动，维护兼容性成本极高。

因此，在实际开发中，更推荐使用 Playwright 或 Puppeteer 这样成熟的库。它们帮我们处理了繁琐的等待、定位和生命周期管理，只在需要更底层能力时才向外暴露 CDP 会话。

理解 CDP 的工作原理，能让我们在构建浏览器自动化工具或浏览器 AI Agent 时，做出更合理的架构设计。

原文链接：https://x.com/kylejeong/status/2078196340216185127

#浏览器自动化 #Chrome #CDP #开发者工具 #Web开发
X (formerly Twitter)

Kyle Jeong (@kylejeong) on X

How Agents actually use your browser: A guide to CDP (Chrome DevTools Protocol)

08:52 · 2026年7月18日 · 周六
浏览器自动化 Chrome CDP 开发者工具 Web开发
面条的草稿箱
Grok Build 开源：xAI 推出终端 AI 编码助手马斯克旗下的 AI 公司 xAI（SpaceXAI）开源了其终端 AI 编码代理工具 Grok Build（命令行工具名为 grok）
14:49 · 2026年7月16日 · 周四
Grok Build 开源：xAI 推出终端 AI 编码助手

马斯克旗下的 AI 公司 xAI（SpaceXAI）开源了其终端 AI 编码代理工具 Grok Build（命令行工具名为 grok）。

Grok Build 是一款运行在终端（TUI）的全屏交互式 AI 助手，专为开发者设计。它不仅能够深度理解你的本地代码库，还可以直接编辑文件、执行 Shell 命令、进行网页搜索，并管理长期运行的任务。

主要特性：

• 多种运行模式：支持全屏交互式终端界面；支持无头（Headless）模式，便于在脚本和 CI 流程中调用；还可以通过 Agent Client Protocol (ACP) 协议嵌入到其他编辑器中。
• 极速体验：项目 99% 以上的代码由 Rust 编写，保证了极佳的运行效率和响应速度。
• 开源协议：采用 Apache License 2.0 协议。需要注意的是，目前该项目主要由 xAI 内部单向同步，暂不接受外部代码贡献。

想要体验的开发者可以通过以下命令快速安装：
```
curl -fsSL https://x.ai/cli/install.sh | bash
```
https://github.com/xai-org/grok-build

#Grok #xAI #AI编码助手 #开源项目 #Rust
GitHub

GitHub - xai-org/grok-build: SpaceXAI's coding agent harness and TUI. Fullscreen, mouse interactive, extensible.

SpaceXAI's coding agent harness and TUI. Fullscreen, mouse interactive, extensible. - xai-org/grok-build
14:49 · 2026年7月16日 · 周四
Grok xAI AI编码助手开源项目 Rust
面条的草稿箱
OpenConnector：让 AI Agent 轻松连接万物的开源授权网关在构建 AI Agent 时，如何安全、高效地让它连接各种第三方 SaaS 服务（如 GitHub、Gmail、Notion、Slack 等）？Composio 的开源替代方案 —— OpenConnector 带来了一个优雅的解法
21:29 · 2026年7月10日 · 周五
OpenConnector：让 AI Agent 轻松连接万物的开源授权网关

在构建 AI Agent 时，如何安全、高效地让它连接各种第三方 SaaS 服务（如 GitHub、Gmail、Notion、Slack 等）？Composio 的开源替代方案 —— OpenConnector 带来了一个优雅的解法。

OpenConnector 是一个专为 AI Agent 设计的开源连接授权网关。通过它，你只需配置一次用户账号，即可向 Agent 开放包含 1,000+ 服务商、超过 10,000 个预置 Action 的共享目录。

核心亮点

• 安全隔离：敏感凭证、OAuth 权限和运行日志均保留在可审计的运行时内，Agent 无法直接接触，有效保障数据安全。
• 多端友好：提供 TypeScript SDK、oo CLI 工具，原生支持 MCP（Model Context Protocol）以及标准 HTTP/OpenAPI 接口。
• 灵活部署：支持本地 Docker 运行，也支持部署在 Fly.io、Cloudflare Workers 等无服务器（Serverless）平台，或直接使用官方托管版本。
• 可视化管理：自带直观的 Web Dashboard，方便浏览连接器、配置凭证、生成 Runtime Token 以及实时监控调用日志和异常。

对于正在开发 Agent 应用，且需要稳定、安全地对接用户日常工作流软件的开发者来说，这是一个非常值得尝试的基础设施。

原链接：https://github.com/oomol-lab/open-connector

#AIAgent #开源工具 #API网关 #MCP
GitHub

GitHub - oomol-lab/open-connector: Open-source auth gateway connecting 1000+ SaaS providers to AI agents through SDK, CLI, MCP…

Open-source auth gateway connecting 1000+ SaaS providers to AI agents through SDK, CLI, MCP, HTTP, and OpenAPI. - oomol-lab/open-connector

21:29 · 2026年7月10日 · 周五
AIAgent 开源工具 API网关 MCP
面条的草稿箱
极简终端 AI 编码助手，带你读懂 Agent 的核心设计：TauHugging Face 开源的 Tau 是一款运行在终端（Terminal）里的 AI 编码助手
10:18 · 2026年7月9日 · 周四
极简终端 AI 编码助手，带你读懂 Agent 的核心设计：Tau

Hugging Face 开源的 Tau 是一款运行在终端（Terminal）里的 AI 编码助手。只需输入简单的需求，它就能帮你读取文件、修改代码、执行 Bash 命令并记录会话历史。

不同于庞大复杂的商业项目，Tau 的核心定位是一个教学型项目。它的代码极其精简、层级分明，非常适合开发者用来理解“AI 编码 Agent 是如何从零构建的”。

核心特性：

• 极简且模块化的架构：代码分为 tau_ai（模型适配）、tau_agent（核心大脑与工具流）和 tau_coding（TUI 与命令行包装器）三层，核心大脑完全独立，可轻松作为第三方库引入。
• 终端交互式操作：内置基于 Textual 的命令行 TUI 界面，支持 /login 登录、模型切换以及流式输出。
• 多模型支持：支持对接 OpenAI、Anthropic、OpenRouter、Hugging Face 以及兼容 OpenAI 格式的本地大模型。
• 持久化会话管理：通过 JSONL 格式安全存储每一次会话，支持中断恢复与分支操作。

如果你想拥有一个轻量级的命令行开发助手，或是想动手写一个自己的 AI Agent，Tau 是一个绝佳的起点。

项目链接：https://github.com/huggingface/tau

#AI #Agent #Python #开源项目 #编程助手
GitHub

GitHub - huggingface/tau: A Python port of Pi’s minimalist coding agent.

A Python port of Pi’s minimalist coding agent. Contribute to huggingface/tau development by creating an account on GitHub.

10:18 · 2026年7月9日 · 周四
AI Agent Python 开源项目编程助手
面条的草稿箱
面向 Codex 用户的本地无限画布插件：Cowart如果你在使用 Codex 并且需要一个好用的可视化工具，不妨关注一下 Cowart
12:03 · 2026年6月22日 · 周一
面向 Codex 用户的本地无限画布插件：Cowart

如果你在使用 Codex 并且需要一个好用的可视化工具，不妨关注一下 Cowart。它是一个基于 tldraw 开发的本地无限画布插件，专门用来帮助开发者在本地进行构思、标注、生成以及迭代图片。所有画布数据都默认保存在你当前项目的 canvas/ 目录下，安全又私密。

核心功能包括：

• 本地无限画布：在 Codex 中一键拉起本地 tldraw 可视化页面。
• 本地持久化：所有的画布数据与图片资源都会跟着你的项目走。
• AI 占位符生成：在画布里创建一个 AI 占位框，写下提示词，Codex 就会根据比例自动填入生成的图像。
• 标注图迭代：在画布里随手画标注或箭头，截图发给 Codex，它就能直接帮你生成修改后的干净新图并并排摆放。
• MCP 工具支持：支持通过 MCP 接口自动读取状态、保存或插入图片，实现工作流自动化。

对于想要摆脱云端束缚，又想拥有丝滑 AI 绘图/修改体验的 Codex 用户来说，这绝对是一个值得尝试的效率利器。

https://github.com/zhongerxin/Cowart

#Codex #无限画布 #AICanvas #开源项目 #效率工具
GitHub

GitHub - zhongerxin/Cowart

Contribute to zhongerxin/Cowart development by creating an account on GitHub.

12:03 · 2026年6月22日 · 周一
Codex 无限画布 AICanvas 开源项目效率工具
面条的草稿箱
像使用 shadcn/ui 一样构建 AI Agent：开源模板库 agentcn如果你喜欢 shadcn/ui 的组件化设计，那一定不要错过 agentcn
09:45 · 2026年6月21日 · 周日
像使用 shadcn/ui 一样构建 AI Agent：开源模板库 agentcn

如果你喜欢 shadcn/ui 的组件化设计，那一定不要错过 agentcn。这是由 shadcn-labs 推出的开源、可定制且生产可用的 AI Agent 模板库。它将 shadcn 的设计理念带入到了 AI 智能体开发领域。

项目亮点：

• 零配置开箱即用：提供合理的默认设置，支持一键命令快速初始化。
• 无缝兼容 shadcn CLI：采用相同的 Registry 格式，使用体验与 shadcn/ui 高度一致。
• 强大的底层支撑：基于 Eve 和 Flue 框架构建，完整包含指令、工具、技能和工作流。
• 可组合与在线预览：支持通过声明式组件构建复杂的交互界面，并在文档中提供直接运行的实时预览。

对于想要快速、规范地搭建 AI Agent 的开发者来说，这是一个非常值得尝试的脚手架工具。

https://github.com/shadcn-labs/agentcn

#AIAgent #开源项目 #前端开发 #shadcn #人工智能
GitHub

GitHub - shadcn-labs/agentcn: shadcn/ui, but for building agents. 🤖

shadcn/ui, but for building agents. 🤖. Contribute to shadcn-labs/agentcn development by creating an account on GitHub.

09:45 · 2026年6月21日 · 周日
AIAgent 开源项目前端开发 shadcn 人工智能
面条的草稿箱
omp：直接集成 IDE 能力的终端 AI 编码助手oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体
23:52 · 2026年6月15日 · 周一
omp：直接集成 IDE 能力的终端 AI 编码助手

oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体。它不仅是一个代码生成器，更是一个深度集成 IDE 工具的“全能型选手”，旨在为开发者提供开箱即用、无缝连接的终端开发体验。

核心亮点：

• 深度集成 IDE 工具链：内置 LSP（Language Server Protocol），AI 能够像在 IDE 中一样精准进行跨文件重命名与格式化；同时支持 DAP（Debug Adapter Protocol），可以直接启动调试器（如 lldb, dlv, debugpy）进行单步调试和堆栈排查。
• 创新的 Snapcompact 图像压缩：当对话历史过长时，omp 不使用 LLM 进行文本总结，而是将历史记录渲染成极其微小的像素字体 PNG 图像，并发送给多模态模型读取。这一技术能够确保上下文细节不丢失，且仅消耗约 1/3 的 Token 成本。
• 强悍的 Rust 原生引擎：核心由约 5.5 万行 Rust 代码构建，搜索、shell、AST 分析等高频操作均在进程内完成，避免频繁 fork 子进程，效率极高。
• 本地化记忆与离线整理：使用本地 SQLite 矢量记忆库，并使用本地的小模型（如 Qwen-1.7B / Gemma-1B）在本地整理记忆与会话标题，数据不离设备。
• 强大的协作与扩展性：支持通过 /collab 实现端到端加密的实时会话共享；兼容多种主流编辑器规则（如 Cursor, Cline, Copilot），甚至可以通过 ACP 协议直接在 Zed 编辑器中驱动终端中的同一个 omp 实例。

原链接：https://omp.sh/

#AI编码助手 #编程工具 #Rust #开源项目 #智能开发
omp

omp — a coding agent with the IDE wired in

Subagents, plan mode, LSP, DAP, hindsight memory, hashline edits, time-traveling rules — with a native Rust engine doing the heavy lifting.

23:52 · 2026年6月15日 · 周一
AI编码助手编程工具 Rust 开源项目智能开发
面条的草稿箱
Slim Tools：为 AI 智能体减负的统一 MCP 工具网关在使用 AI Agent（如 Claude、Cursor 等）时，你是否遇到过因为加载了太多 MCP 或 OpenAPI 工具，导致上下文窗口（Context Window）被严重占用、Token 消耗飞涨的情况？Slim Tools 提供了一个巧妙的解决方案：它将所有上游工具统一封装进一个极简的 MCP 接口中
20:18 · 2026年5月23日 · 周六
Slim Tools：为 AI 智能体减负的统一 MCP 工具网关

在使用 AI Agent（如 Claude、Cursor 等）时，你是否遇到过因为加载了太多 MCP 或 OpenAPI 工具，导致上下文窗口（Context Window）被严重占用、Token 消耗飞涨的情况？

Slim Tools 提供了一个巧妙的解决方案：它将所有上游工具统一封装进一个极简的 MCP 接口中。

核心特性：

• 统一入口：无需向 AI 暴露所有工具，只需提供一个 Slim Tools 的 MCP URL（https://slim.tools/mcp）。
• 按需探索：AI 代理在运行阶段仅能看到 discover_tools（工具搜索）和 execute_code（沙盒代码执行）两个核心能力。
• 高效联动：AI 通过搜索找到匹配的工具，然后在沙盒中运行代码来组合并调用这些上游 API（如 GitHub、Notion、Slack、Figma 等）。
• 简化授权：统一管理所有上游服务的 OAuth 授权，无需重复配置。

通过这种“运行时发现”的设计，AI 代理无需在上下文里“背负”沉重的工具集，不仅让 Prompt 更加清爽，也让 Agent 的响应速度大幅提升。

原文链接：http://slim.tools

#AIAgents #MCP #开发者工具 #效率工具
Slim Tools

Slim Tools | Tool Orchestration Runtime for AI Agents

Move MCP and OpenAPI tool orchestration out of model context and into one sandboxed runtime.

20:18 · 2026年5月23日 · 周六
AIAgents MCP 开发者工具效率工具
面条的草稿箱
Flue：构建下一代 AI Agent 的 TypeScript 架构框架Flue 提出了一个核心公式：Agent = Model + Harness
18:03 · 2026年5月11日 · 周一
Flue：构建下一代 AI Agent 的 TypeScript 架构框架

Flue 提出了一个核心公式：Agent = Model + Harness。它不仅仅是一个简单的 SDK，而是一个专为构建自主 Agent 设计的“可编程治理框架”（Harness），旨在让开发者能够轻松打造像 Claude Code 或 Codex 这样具备规划、环境感知和执行能力的强力工具。

核心特性：

• 高度可编程： 使用 TypeScript 编写 Agent 逻辑，支持定义复杂的技能（Skills）、工作流和多 Session 管理。
• 自带沙箱环境： 提供内置的虚拟沙箱或连接远程沙箱（如 Daytona），让 Agent 安全地执行 Bash 命令、读写文件或运行代码。
• 安全与隐私： 采用精细的权限控制，确保敏感的 API Token 不会被模型或沙箱环境直接接触。
• 跨平台部署： 编写一次逻辑，即可部署为 HTTP 服务，或在 CLI、GitHub Actions、Cloudflare Workers 等多种环境运行。

与其使用通用的成品 AI 工具，Flue 鼓励开发者根据特定的产品需求、数据和工作流，构建完全属于自己的定制化 Agent。

https://flueframework.com/

#AI #Agent #TypeScript #开发工具 #开源项目
Flue

Flue — The Open Agent Framework

Build durable AI agents and workflows with Flue's programmable TypeScript harness. Write once, deploy anywhere, use any LLM.

18:03 · 2026年5月11日 · 周一
AI Agent TypeScript 开发工具开源项目
面条的草稿箱
Obscura：专为 AI Agent 和大规模爬虫打造的 Rust 无头浏览器如果你觉得传统的 Headless Chrome 过于臃肿且容易被反爬虫识别，那么 Obscura 绝对值得一试
09:13 · 2026年4月25日 · 周六
Obscura：专为 AI Agent 和大规模爬虫打造的 Rust 无头浏览器

如果你觉得传统的 Headless Chrome 过于臃肿且容易被反爬虫识别，那么 Obscura 绝对值得一试。这是一个基于 Rust 编写的开源无头浏览器引擎，旨在为 AI Agent 和网页抓取提供极速、轻量且隐形的自动化体验。

核心优势

• 轻量化：内存占用仅需约 30MB（相比 Chrome 的 200MB+），二进制文件仅 70MB。
• 极致速度：启动几乎是瞬间完成，页面加载速度比 Headless Chrome 快约 6 倍。
• 内置隐身模式：默认支持反指纹识别、随机化 GPU/Canvas/Audio 等硬件信息，并自动拦截 3500+ 个追踪器。
• 兼容性强：支持 Chrome DevTools Protocol (CDP)，可以作为 Puppeteer 和 Playwright 的无缝替代品。
• Rust 驱动：利用 V8 引擎运行真实 JavaScript，确保执行环境的高性能与安全性。

快速上手

Obscura 提供单二进制文件，无需安装 Node.js 或 Chrome 即可运行。你可以通过简单的命令行直接抓取动态内容，或者启动一个 CDP 服务器供自动化脚本调用：
```
# 获取网页标题
./obscura fetch https://example.com --eval "document.title"

# 启动 CDP 服务
./obscura serve --port 9222 --stealth
```
对于追求性能和隐匿性的开发者来说，Obscura 是构建下一代 AI 自动化工具的理想底层引擎。

https://github.com/h4ckf0r0day/obscura

#开源项目 #无头浏览器 #Rust #AI工具 #爬虫技术
GitHub

GitHub - h4ckf0r0day/obscura: The headless browser for AI agents and web scraping

The headless browser for AI agents and web scraping - h4ckf0r0day/obscura
09:13 · 2026年4月25日 · 周六
开源项目无头浏览器 Rust AI工具爬虫技术
面条的草稿箱
Paseo：随时随地指挥你的 AI 编程助手想要在离开工位时也能继续推进代码进度？Paseo 是一款开源、自托管的 AI 编程 Agent 调度平台，让你能够从手机、桌面或终端轻松管理和运行 AI 助手
16:44 · 2026年4月11日 · 周六
Paseo：随时随地指挥你的 AI 编程助手

想要在离开工位时也能继续推进代码进度？Paseo 是一款开源、自托管的 AI 编程 Agent 调度平台，让你能够从手机、桌面或终端轻松管理和运行 AI 助手。

主要功能亮点：

• 全平台覆盖：支持 iOS、Android、桌面端及 Web，甚至可以直接通过 CLI 脚本化运行，实现多端无缝衔接。
• 集成主流 Agent：完美支持 Claude Code、Codex 和 OpenCode 等主流 AI 编程助手，保留原有的技能和配置。
• 隐私与安全：代码始终保留在你的本地机器上，支持端到端加密中继，确保远程连接时的代码安全。
• 本地语音交互：内置完全本地化的语音识别与合成技术，无需将语音数据上传云端即可实现指令下达。
• 开发者友好：支持键盘快捷键优先操作、Git 工作流隔离（Worktrees）以及全方位的命令行支持。

Paseo 是一款纯粹的开源工具，不直接调用推理 API，而是作为官方 CLI 的透明调度层，既自由又强大。

https://paseo.sh/

#AI编程 #开源项目 #Paseo #开发者工具 #人工智能
Paseo

Paseo – Run Claude Code, Codex, Copilot, OpenCode from anywhere

Self-hosted daemon for Claude Code, Codex, Copilot, OpenCode, and Pi. Agents run on your machine with your full dev environment. Connect from phone, desktop, or web.

16:44 · 2026年4月11日 · 周六
AI编程开源项目 Paseo 开发者工具人工智能
面条的草稿箱
CursorBench：Cursor 如何更贴近真实开发来评估模型质量开发者正在把更长、更复杂的编程任务交给智能体：跨多个文件、工具和步骤
14:03 · 2026年3月13日 · 周五
CursorBench：Cursor 如何更贴近真实开发来评估模型质量

开发者正在把更长、更复杂的编程任务交给智能体：跨多个文件、工具和步骤。Cursor 认为，评测方式也必须随之升级，才能真实反映“好用与否”。

Cursor 的做法是 线上 + 线下 的混合评测闭环：

• 线下：CursorBench（内部基准）
基于工程团队的真实 Cursor 会话构建，而不是从公开代码库抽题。因为更贴近实际工作流、信息更不充分且常带歧义，CursorBench 往往能更好地区分前沿模型，并衡量多维能力（正确性、代码质量、效率、交互行为等）。

• 线上：真实流量的受控实验
用于捕捉线下评测遗漏的退化：例如线下评分器判“正确”，但开发者实际体验变差。Cursor 会用多类代理指标（交互信号 + 输出质量信号）综合观察，并通过消融实验归因（如移除语义搜索工具来定位其关键场景）。

为什么不太依赖公开基准？Cursor 指出三类常见问题：

1. 任务不匹配：许多基准仍偏向“修 bug”或“解谜题”，与真实开发请求脱节。
2. 评分困难：真实请求常有多种正确解，固定答案容易误伤合理方案。
3. 数据污染：公开仓库题目容易进入训练数据，分数被抬高；甚至出现“记忆补丁”与测试缺陷等问题。

下一步，Cursor 预计开发会更多转向“长时运行智能体”。他们也计划让 CursorBench 适配更长任务，并解决成本、可复现性、以及离线结果与真实体验之间的差距。

原文链接：https://cursor.com/cn/blog/cursorbench

#模型评测 #编程智能体 #基准测试 #Cursor #开发者体验
Cursor

How we compare model quality in Cursor · Cursor

We use a hybrid online-offline eval process to keep our understanding of model quality aligned with what developers actually do.

14:03 · 2026年3月13日 · 周五
模型评测编程智能体基准测试 Cursor 开发者体验
面条的草稿箱
Stripe「Minions」：一键生成、端到端交付的无人值守编码代理Stripe 在内部打造了一套名为 Minions 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入
22:31 · 2026年2月10日 · 周二
Stripe「Minions」：一键生成、端到端交付的无人值守编码代理

Stripe 在内部打造了一套名为 Minions 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入。现在，Stripe 每周有超过 1000 个合并的 PR 是由 Minions 从头到尾生成的（人类负责 Review，但不写代码）。

为什么要自研？

在 Stripe 这种超大规模、强约束的工程环境里，“从零写个原型”和“在成熟巨型代码库里安全改动”完全不是一回事：

• 代码库规模巨大（数亿行），栈也相对小众：大量后端是 Ruby + Sorbet，还有大量 Stripe 自研库，LLM 天然不熟
• 业务风险极高：Stripe 的代码承载着 每年超过 1 万亿美元 的支付规模，并受金融合规与监管约束
• 既要让代理“会写”，也要让它“按规矩写、能跑通、能过 CI”，并与既有研发流程深度结合

工程师怎么用？

最常见的入口是 Slack：

• 在讨论线程里 @Slack App 就能发起 Minion，它会读取整个线程与相关链接作为上下文
• 也集成到内部系统里：文档平台、Feature Flag、工单系统等
例如 CI 发现 flaky tests，会生成工单，直接提供按钮让 Minion 去修

完成后，Minion 会：

• 创建分支 → 推送 → 跑 CI → 按模板生成 PR

如果效果不理想，人类可以补充指令让它再改；即使不完美，也常常是很好的“可用起点”。

Minions 背后怎么运作（要点版）

Stripe 的思路是：把“创意生成”交给 LLM，把“必须可靠执行的步骤”交给确定性工具链。

• 运行环境：在隔离的 devbox 中执行（10 秒内可启动，预热并预载代码与服务），与生产与公网隔离，便于并行
• Agent 框架：基于 Block 的开源编码代理 goose 的 fork，并做了强定制
• 规则与上下文：读取各类 agent rule 文件，但多为“按目录条件生效”，避免全局死规则拖累
• 工具调用：接入 MCP（函数调用通用协议），并建设内部 MCP 服务 Toolshed，提供 400+ 工具（文档、工单、构建状态、Sourcegraph 搜索等）
• 反馈与质量闸门：
• 首先跑本地启发式 lint/检查（通常 <5 秒）
• 再跑选择性的 CI（Stripe 有 300 万+ 测试），部分失败可自动修复
• 为控制成本与等待时间：最多两轮 CI，强调“能本地提前发现就不要拖到 CI”

接下来

这篇是系列 Part 1，主要讲“怎么用、能做什么”；Part 2 会深入实现细节。整体信号很明确：当“开发者注意力”成为稀缺资源时，无人值守、可并行的编码代理正在改变工程协作方式。

原文链接：https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents

#AI工程化 #编码代理 #开发者效率 #CI实践 #Stripe
stripe.dev

Minions: Stripe’s one-shot, end-to-end coding agents

Minions are Stripe’s homegrown coding agents, responsible for more than a thousand pull requests merged each week. Though humans review the code, minions write it from start to finish. Learn how they work, and how we built them.

22:31 · 2026年2月10日 · 周二
AI工程化编码代理开发者效率 CI实践 Stripe
面条的草稿箱
VM0：用自然语言搭建 AI Agent，并在云端 24/7 运行VM0 主打的是「面向 AI Agent 的基础设施」，让你用自然语言定义工作流、在云端沙盒环境里持续运行，并且能完整观测每次执行过程
10:19 · 2026年2月1日 · 周日
VM0：用自然语言搭建 AI Agent，并在云端 24/7 运行

VM0 主打的是「面向 AI Agent 的基础设施」，让你用自然语言定义工作流、在云端沙盒环境里持续运行，并且能完整观测每次执行过程。

它能做什么

• 一键运行 Agent：支持按需执行或定时调度，适合做日报、监控、内容汇总等自动化任务。
• 自然语言构建工作流：在 Claude Code 里描述目标，协作编辑 AGENTS.md，快速拼出可执行的 Agent 指令与流程。
• 云端隔离沙盒：本地开发、云端运行，环境隔离，适合让 Agent 长时间稳定跑任务。
• 全链路可观测：实时日志、产物输出、执行回放（checkpoint），便于排查与迭代。

示例场景（官网展示）

• HackerNews 摘要 Agent：自动读 Top 文章，筛选 AI 相关内容并生成可发布的总结。
• TikTok 达人筛选 Agent：搜索与筛选创作者，输出分析报告。
• 日报 Agent：聚合多源数据与 API，总结后写入 Notion。
• 博客生成 Agent：结合多个 API 自动产出内容。

快速开始（官网命令）

npm install -g @vm0/cli && vm0 onboard

原链接：https://www.vm0.ai/

#AI代理 #自动化工作流 #云端沙盒 #可观测性 #开发者工具
www.vm0.ai

VM0 - Your Trustworthy AI Teammate

Zero connects to 100+ tools and does the work. Reports, triage, outreach, research. In Slack or on the web.

10:19 · 2026年2月1日 · 周日
AI代理自动化工作流云端沙盒可观测性开发者工具
面条的草稿箱
Moltbook：面向 AI Agent 的“社交广场”Moltbook 把“社交网络”做成了 AI Agent 的主场：Agent 在这里发布内容、讨论、点赞投票；人类也可以围观、了解它们都在做什么
11:09 · 2026年1月31日 · 周六
Moltbook：面向 AI Agent 的“社交广场”

Moltbook 把“社交网络”做成了 AI Agent 的主场：Agent 在这里发布内容、讨论、点赞投票；人类也可以围观、了解它们都在做什么。

你能在 Moltbook 看到什么？

• 海量 Agent 与社区分区（Submolts）：按主题聚合讨论与内容流
• 动态广场（Posts）：从自动化工作流、工具技巧，到各类实验与想法分享
• 人机配对（Top Pairings）：展示 Agent 与其绑定的人类账号/身份影响力（平台内视角）

如果你想“把 Agent 送进去”

• 官方给了一个简单的上手方式：把指令发给你的 Agent，让它按说明注册并生成认领链接，再通过社交平台验证归属。

面向开发者

• Moltbook 也在推进开发者平台：允许应用通过 Moltbook 身份与 Agent 做认证与集成（当前以申请早期访问为主）。

链接：https://www.moltbook.com/

#AI智能体 #社交网络 #开发者平台 #AI应用 #社区观察
moltbook

moltbook - the front page of the agent internet

A social network built exclusively for AI agents. Where AI agents share, discuss, and upvote. 🦞🤖

11:09 · 2026年1月31日 · 周六
AI智能体社交网络开发者平台 AI应用社区观察
面条的草稿箱
Vercel AI Gateway 现已支持 Claude Code Max：订阅直连、统一观测Vercel 宣布其 AI Gateway 现已支持在 Claude Code CLI 中使用 Claude Code Max 订阅
23:23 · 2026年1月28日 · 周三
Vercel AI Gateway 现已支持 Claude Code Max：订阅直连、统一观测

Vercel 宣布其 AI Gateway 现已支持在 Claude Code CLI 中使用 Claude Code Max 订阅。对开发者来说，这意味着：你可以继续用自己已有的 Anthropic 订阅，不增加额外费用，同时把 Claude Code 的调用统一接入 Vercel 平台，获得更完整的可观测性、用量追踪与监控能力。

你能获得什么

• 沿用现有 Claude Code Max 订阅：照常用 Anthropic 模型，无需额外开销
• 统一观测与用量管理：通过 Vercel 平台查看请求、监控使用模式与成本趋势
• 更灵活的路由能力：AI Gateway 可作为直通 Anthropic 的代理；必要时也可作为路由器切换到其他提供方（fallback）

快速配置（核心步骤）

在你的 shell 配置文件（如 ~/.zshrc 或 ~/.bashrc）加入环境变量：

• 将 Anthropic 入口指向 AI Gateway
• 用独立的 x-ai-gateway-api-key 做网关鉴权（与 Claude 订阅鉴权并存）

启动 Claude Code：

• 运行 claude
• 登录时选择 Option 1 - Claude account with subscription（使用带订阅的 Claude 账号）
• 若遇到问题，可先 claude /logout 再重新登录

工作原理（简述）

Claude Code 仍然使用 Anthropic 的订阅凭证进行认证，并携带 Authorization 头。由于该头用于 Claude 订阅身份，AI Gateway 采用单独的 x-ai-gateway-api-key 进行自身认证，从而实现两套鉴权机制同时生效。

原文链接：https://vercel.com/changelog/claude-code-max-via-ai-gateway-available-now-for-claude-code

#Vercel #AIGateway #ClaudeCode #可观测性 #开发者工具
Vercel

Claude Code Max via AI Gateway, available now for Claude Code - Vercel

You can use your Claude Code Max subscription through Vercel's AI Gateway. This lets you leverage your existing subscription while gaining centralized observability, usage tracking, and monitoring capabilities for all your Claude Code requests.

23:23 · 2026年1月28日 · 周三
Vercel AIGateway ClaudeCode 可观测性开发者工具
面条的草稿箱
CoreSpeed：为 AI Agent 打造的容器运行时基础设施CoreSpeed 主打把「Agent 运行」这件事做成开箱即用的基础设施：你可以像部署普通容器一样部署 AI Agent，并获得更快启动、更强隔离和更易扩展的体验
08:51 · 2026年1月22日 · 周四
CoreSpeed：为 AI Agent 打造的容器运行时基础设施

CoreSpeed 主打把「Agent 运行」这件事做成开箱即用的基础设施：你可以像部署普通容器一样部署 AI Agent，并获得更快启动、更强隔离和更易扩展的体验。

它解决的核心问题：把 Agent 从 Demo 变成可上线的系统。

关键能力一览

• 127ms 级别快速启动：通过内置 Warm Pool，让容器接近“秒开/毫秒开”，减少冷启动等待。
• 按用户隔离的安全沙箱：一人一容器，降低数据串扰与安全风险。
• 无限水平扩展 + 可缩到 0：按需分配资源，空闲可降到零成本运行。
• AI & MCP Gateway：统一接入 AI 模型与 MCP Server，提供可观测性与安全防护（例如减少 API Key 泄露风险），并支持按调用计费。

配套：Zypher（TypeScript Agent Runtime）

同时他们提供 Zypher SDK，强调：

• 不是固定工作流，而是「真 Agent」的反应式循环
• 模型/供应商无关（Claude、GPT 等）
• 多 Agent 协作架构
• 丰富工具与 MCP 协议支持
• 更节省 Token 的上下文加载与执行策略

原文链接：https://www.corespeed.io/

#AI代理 #容器基础设施 #MCP #AgentRuntime #开发者工具
www.corespeed.io

CoreSpeed — Your AI agent is smart. Now give it access.

CoreSpeed connects your AI agent to the apps you use, adds built-in tools and memory, and lets you control what it can do — in one setup, with any agent. No per-service API applications.

08:51 · 2026年1月22日 · 周四
AI代理容器基础设施 MCP AgentRuntime 开发者工具
面条的草稿箱
Amp 宣布下线 Amp Tab：Tab 补全时代正在退场Amp 团队宣布将移除 Amp Tab（内联 Tab 补全功能），理由很直接：这不再符合他们看到的未来
08:51 · 2026年1月22日 · 周四
Amp 宣布下线 Amp Tab：Tab 补全时代正在退场

Amp 团队宣布将移除 Amp Tab（内联 Tab 补全功能），理由很直接：这不再符合他们看到的未来。

他们的判断基于一个变化——AI 写代码的占比正在迅速上升：

• 一年前，代码大多还是人手写
• 2025 年 6 月发布 Amp Tab 时，Amp 已经在写大部分代码
• 现在，Amp 负责了他们 90% 的交付代码

Amp 认为，Tab 补全与传统补全引擎来自“人写为主、AI 辅助”的时代；但这个时代正在结束。越来越多用户的工作方式变成：几天不打开编辑器，也能持续交付代码。瓶颈不再是“写得快不快”，而是“把代码产出、落地得快不快”。

因此，Amp 将把资源投入到“后补全时代”的方向：默认由智能体（agents）完成大部分编码工作，而不是在输入时做局部补全。

时间安排：

• Amp Tab 将继续可用至 2026 年 1 月底
• 之后如果仍需要内联补全，可考虑：Cursor / GitHub Copilot / Zed

原文链接：https://ampcode.com/news/tab-tab-dead

#AI编程 #代码补全 #开发者工具 #智能体 #Amp
Ampcode

Tab, Tab, Dead

We're removing Amp Tab. It is not part of the future we see.

08:51 · 2026年1月22日 · 周四
AI编程代码补全开发者工具智能体 Amp
面条的草稿箱
以“推理速度”交付：AI 编程把瓶颈从写代码变成了等模型这篇文章的核心观点很直接：AI 编程代理的能力跃迁后，作者交付软件的速度越来越不取决于“敲代码”，而更受限于两件事——模型推理时间（inference time）和少数真正需要深度思考的设计决策
10:00 · 2026年1月18日 · 周日
以“推理速度”交付：AI 编程把瓶颈从写代码变成了等模型

这篇文章的核心观点很直接：AI 编程代理的能力跃迁后，作者交付软件的速度越来越不取决于“敲代码”，而更受限于两件事——模型推理时间（inference time）和少数真正需要深度思考的设计决策。

作者回顾了今年的变化：从最初“有些提示能一次跑通就很惊喜”，到现在“默认就该一次跑通”。在这种前提下，他甚至不再逐行读代码，而是看执行/修改流，关注系统结构是否合理、关键组件在哪里、整体是否按预期运转。

文章也给了不少可复用的工作方法：

• 先从 CLI 做起：任何产品先做命令行版本，方便代理直接运行验证，形成闭环；核心逻辑稳了再上 UI（比如扩展、App）。
• 关键决策是生态与依赖：语言/框架/依赖选对了，代理更容易一次完成；作者常用 TypeScript（Web）、Go（CLI）、Swift（macOS/iOS）。
• 更偏向“对话式协作”，而不是复杂流程：先和模型聊清楚、让它探索代码、共创方案，满意后再让它开干；他认为“Plan mode”更像旧时代不得已的手段。
• 对比 codex 与 Opus：codex 常会先长时间读代码再动手，虽然更慢但更稳，尤其适合大型功能和重构；Opus 更“急”，适合小改动但更容易漏上下文。
• 迭代式构建，不依赖回滚：不喜欢 checkpoint/频繁 revert，更多是让模型继续改、继续朝更好的方向“绕山而上”。
• 自动化与多项目并行：同时推进多个项目，用队列把想法排进去；瓶颈往往是人而不是编排系统。
• 配置思路：提高工具输出 token 上限、合理设置自动压缩阈值，让模型能一次读更多文件；作者强调新压缩机制更可靠，甚至像一次“复查”。

如果用一句话总结：当“写代码”越来越像可并行外包给代理的体力活，工程师的价值更集中在选型、架构、数据流、约束定义与验收标准上；而真正影响交付速度的，往往是推理等待时间和你是否想清楚要做什么。

原链接：https://steipete.me/posts/2025/shipping-at-inference-speed
#AI编程 #Codex #开发工作流 #效率工具 #软件工程
steipete.me

Shipping at Inference-Speed | Peter Steinberger

Why I stopped reading code and started watching it stream by.

10:00 · 2026年1月18日 · 周日
AI编程 Codex 开发工作流效率工具软件工程
面条的草稿箱
Open Responses：让 LLM 接口真正“可互通”的开放规范Open Responses 是一个开源规范与生态，目标是基于 OpenAI Responses API 的理念，建立多模型提供方可互操作的统一接口层
13:36 · 2026年1月16日 · 周五
Open Responses：让 LLM 接口真正“可互通”的开放规范

Open Responses 是一个开源规范与生态，目标是基于 OpenAI Responses API 的理念，建立多模型提供方可互操作的统一接口层。它通过共享 Schema 和配套工具，让开发者能用同一种请求/输出结构，跨不同提供方调用模型、处理流式返回，并组合更复杂的 Agent 工作流。

为什么需要它？
现在各家 LLM API 的核心组件越来越相似（消息、工具调用、流式、多模态等），但细节编码方式不同，迁移与兼容成本高。Open Responses 希望把“共同部分”沉淀成稳定规范，减少重复适配。

它强调的设计方向：

• 默认多提供方：一套 Schema 映射多家模型/平台
• 更贴近真实 Agent 工作流：统一的流式事件、工具调用模式，以及以“items”作为输出与工具使用的原子单元
• 可扩展但不碎片化：核心稳定，同时允许在必要时容纳提供方特性

如何开始：

• 阅读规范，理解 items、流式事件、工具使用等核心概念
• 查看 OpenAPI 参考，掌握完整类型与接口面
• 用官方的验收测试验证你的 API 实现一致性

原链接：https://www.openresponses.org/

#LLM #开放规范 #多模型 #互操作 #API设计
www.openresponses.org

Open Responses

Open Responses documentation overview.

13:36 · 2026年1月16日 · 周五
LLM 开放规范多模型互操作 API设计

Search: #开发者工具