#Agent标准化

面条的草稿箱
GitAgent：用 Git 仓库定义 AI Agent 的开放标准AI Agent 框架百花齐放，但每个框架都有自己的结构，Agent 定义无法跨平台复用
09:48 · 2026年3月25日 · 周三
GitAgent：用 Git 仓库定义 AI Agent 的开放标准

AI Agent 框架百花齐放，但每个框架都有自己的结构，Agent 定义无法跨平台复用。GitAgent 提出了一种框架无关、基于 Git 的 Agent 定义标准——克隆一个仓库，就能获得一个 Agent。

核心理念

• Git 原生：版本控制、分支管理、Diff 比较、协作能力开箱即用
• 框架无关：通过适配器导出到 Claude Code、OpenAI、CrewAI、Cursor 等任意框架
• 合规就绪：内置 FINRA、美联储、SEC 等金融监管合规支持
• 可组合：Agent 之间可以继承、依赖和委托

怎么用？

一个仓库只需两个文件即可成为 Agent：

• agent.yaml：清单文件，定义名称、版本、模型、技能、工具等
• SOUL.md：身份文件，定义人格、沟通风格和价值观

可选添加 RULES.md（硬约束）、DUTIES.md（职责分离）、skills/（技能模块）、workflows/（工作流）等目录，按需扩展。

亮点设计

• 12 种架构模式：包括人类审批（Human-in-the-Loop）、Agent 版本管理、分支部署、Agent Fork 与混用、CI/CD 集成、生命周期钩子等
• 职责分离（SOD）：定义角色权限和冲突矩阵，确保关键流程不被单一 Agent 端到端控制
• SkillsFlow：用 YAML 定义确定性多步工作流，支持步骤依赖和模板数据流
• 11 个导出适配器：覆盖 system-prompt、Claude Code、OpenAI、CrewAI、Cursor、Lyzr 等主流平台

快速开始
```
npm install -g gitagent
gitagent init --template standard
gitagent validate
gitagent export --format system-prompt
```
项目目前已获 1.1k Star，MIT 开源协议。

🔗 https://github.com/open-gitagent/gitagent

#AIAgent #GitAgent #开源 #Agent标准化 #框架无关
GitHub

GitHub - open-gitagent/gitagent: A universal git-native AI agent framework. Your agent lives inside a git repo — identity, rules…

A universal git-native AI agent framework. Your agent lives inside a git repo — identity, rules, memory, tools, and skills are all version-controlled files. - open-gitagent/gitagent
09:48 · 2026年3月25日 · 周三
AIAgent GitAgent 开源 Agent标准化框架无关
面条的草稿箱
Tool Search Tool：让大规模工具库“按需加载”当你的系统里有上百甚至上千个工具时，把所有工具定义一次性塞进上下文，会带来两个典型问题：既浪费上下文窗口（50 个工具就可能吃掉 1–2 万 token），也会让模型在 30–50 个工具以上更容易选错工具
14:42 · 2026年1月15日 · 周四
Tool Search Tool：让大规模工具库“按需加载”

当你的系统里有上百甚至上千个工具时，把所有工具定义一次性塞进上下文，会带来两个典型问题：既浪费上下文窗口（50 个工具就可能吃掉 1–2 万 token），也会让模型在 30–50 个工具以上更容易选错工具。Tool Search Tool 的思路是：先只暴露“搜索工具的工具”，其余工具标记为延迟加载；模型需要时先搜索，再把最相关的少量工具定义加载进来使用。

核心机制（7 步）

• 请求里先放入工具搜索工具（Regex 或 BM25 版本）+ 少量常用非延迟工具
• 其余工具定义加上 defer_loading: true（不立即进上下文）
• 模型需要更多工具时，先调用 tool search
• 服务端返回 3–5 个最相关的 tool_reference
• 这些引用会被自动展开成完整工具定义
• 模型再从“已发现”的工具里选择并调用
• 这样既省上下文，又保持工具选择准确率

两种搜索方式怎么选

• Regex 版（tool_search_tool_regex_20251119）：查询是 Python 正则，不是自然语言；适合你希望可控匹配（如 get_.*_data、(?i)slack）。限制：模式最长 200 字符。
• BM25 版（tool_search_tool_bm25_20251119）：查询用自然语言；更适合“我想做什么”式的描述。

两种方式都会搜索：工具名、描述、参数名、参数描述。

延迟加载的最佳实践

• 工具搜索工具本身不要设置 defer_loading: true
• 保留 3–5 个最常用工具为非延迟（提升命中与体验）
• 工具命名与描述尽量贴近用户常用说法（提升可检索性）
• 适合场景：工具 >10 个、工具定义 >10K token、工具选择准确率下降、MCP 多服务器（200+ 工具）等
• 不太适合：工具 <10 个且几乎每次都要用、工具定义非常短

响应与错误处理要点

• 响应里会出现 server_tool_use（触发工具搜索）与 tool_search_tool_result（返回引用列表）
• 常见 400 错误：
• 全部工具都 deferred：至少要有 1 个非延迟工具
• 引用的工具缺少定义：tool_reference 指向的工具必须在顶层 tools 里有对应定义（并通常设为 deferred）
• 工具搜索执行期错误（仍返回 200）：如 invalid_pattern、pattern_too_long、too_many_requests、unavailable

与 MCP、缓存、流式的配合

• 可与 MCP toolset 结合：用 default_config.defer_loading 控制 MCP 工具默认延迟加载，并可对特定工具覆盖
• 支持 prompt caching：已发现的工具可在后续轮次复用，不必每次重新搜索
• 流式返回会把搜索调用与结果作为事件发出，便于前端展示“正在搜索/已找到工具”

原文链接：https://platform.claude.com/docs/en/agents-and-tools/tool-use/tool-search-tool

#工具调用 #Agent开发 #上下文优化 #MCP #API设计
Claude Platform Docs

Tool search tool

Scale to hundreds or thousands of tools by letting Claude search your tool catalog and load only the tools it needs.

14:42 · 2026年1月15日 · 周四
工具调用 Agent开发上下文优化 MCP API设计
面条的草稿箱
AI SDK 6：从“调用模型”到“构建可复用智能体”Vercel 发布 AI SDK 6，把 TypeScript AI 应用的开发重心从函数式调用（generateText/streamText）进一步推进到可复用、可维护、可观测的 **Agent（智能体）**体系，并补齐了安全审批、MCP 全能力支持、调试工具等关键环节
22:27 · 2025年12月24日 · 周三
AI SDK 6：从“调用模型”到“构建可复用智能体”

Vercel 发布 AI SDK 6，把 TypeScript AI 应用的开发重心从函数式调用（generateText/streamText）进一步推进到可复用、可维护、可观测的 **Agent（智能体）**体系，并补齐了安全审批、MCP 全能力支持、调试工具等关键环节。

这次更新最值得关注的点

• Agents / ToolLoopAgent：用 Agent 抽象把 模型、指令、工具 固化成可复用单元；ToolLoopAgent 提供“模型调用 → 工具执行 → 回填结果 → 继续推理”的生产级循环（默认最多 20 步），同一套定义可在 UI、API、后台任务复用。
• 工具执行审批（Human-in-the-loop）：工具支持 needsApproval，可按输入内容动态决定是否需要人工确认，适合删除文件、支付、修改生产数据等高风险操作。
• 工具能力增强：
• Strict Mode 可按工具粒度开启，避免某个工具 schema 不兼容导致整次请求失败。
• Input Examples 用“正确示例”提升模型生成工具入参的稳定性。
• toModelOutput 将“应用拿到的完整结果”和“发回模型的 token 内容”分离，减少大文本/二进制（截图、图片）带来的上下文浪费。
• MCP（Model Context Protocol）更完整且稳定：新增/完善 OAuth 认证、Resources、Prompts、Elicitation，并在 @ai-sdk/mcp 中以稳定形态提供，便于对接远程 MCP 服务与第一方数据源。
• 工具调用 + 结构化输出：generateText 与 generateObject 能力统一，支持在多步工具链路后直接生成最终结构化结果（通过 Output.* 声明输出形态）。
• DevTools 可观测性：通过中间件记录并可视化每一步的输入输出、工具调用、token 消耗、耗时与原始请求/响应，解决多步 agent 调试“黑盒”问题。
• Reranking（重排序）：新增 rerank，把检索结果按相关性排序，只喂最相关上下文给模型（当前支持 Cohere、Amazon Bedrock、Together.ai）。
• 标准 JSON Schema 生态：支持实现 Standard JSON Schema 接口的任意 schema 库，降低与特定校验库的绑定成本。
• 图像编辑：generateImage 支持带参考图的编辑（如修补/扩展/风格迁移等），不再只限于文生图。
• 更细的返回原因与用量统计：新增 rawFinishReason，并扩展 usage 的输入/输出细分，方便成本优化与兼容不同供应商行为。
• LangChain 适配器重写：更贴合现代 LangChain/LangGraph，支持流式事件转换、工具调用部分输入流等能力。
• 更多 Provider Tools：围绕 Anthropic/OpenAI/Google/xAI 等提供平台特性工具（如代码执行、文件搜索、Web/X 搜索、MCP 工具等）。

升级提示

从 v5 升级到 v6，可先跑官方 codemod：npx @ai-sdk/codemod v6（文中也提供迁移指南链接）。

原文链接：https://vercel.com/blog/ai-sdk-6
#Vercel #AISDK #Agent #MCP #TypeScript
Vercel

AI SDK 6

Introducing agents, tool execution approval, DevTools, full MCP support, reranking, image editing, and more.

22:27 · 2025年12月24日 · 周三
Vercel AISDK Agent MCP TypeScript
面条的草稿箱
MiniMax M2.1 发布：面向真实复杂任务的多语言编程升级MiniMax 发布新一代文本模型 MiniMax M2.1，目标从“可用、低成本”进一步走向“能解决真实世界的复杂任务”，重点补齐多语言工程协作与办公场景执行力
21:52 · 2025年12月23日 · 周二
MiniMax M2.1 发布：面向真实复杂任务的多语言编程升级

MiniMax 发布新一代文本模型 MiniMax M2.1，目标从“可用、低成本”进一步走向“能解决真实世界的复杂任务”，重点补齐多语言工程协作与办公场景执行力。

这次重点提升了什么？

• 多语言编程能力系统增强：覆盖 Rust / Java / Go / C++ / Kotlin / Objective‑C / TypeScript / JavaScript 等，更贴近真实项目的多语言栈协作。
• Web & App 开发更强、更好看：强化原生 Android / iOS 开发，同时提升设计理解与审美表达，支持复杂交互、3D 场景模拟与高质量可视化。
• 更适合办公场景的“复合指令”执行：在多约束条件下做端到端任务推进，更强调“按要求完成”而不是只写对代码。
• 更简洁、更高效的输出：相较 M2，响应更精炼、速度更快、token 消耗更低，适配持续式 AI Coding / Agent 工作流。
• 更强的 Agent / 工具泛化：官方称在多种编码工具与 Agent 框架中表现稳定，并兼容常见的上下文管理约定。
• 对话与写作质量同步提升：不仅是“更会写代码”，也更擅长技术文档与日常写作的结构化表达。

基准与展示

• 在多项软件工程评测上相对 M2 有明显提升，并强调多语言场景竞争力；同时引入 VIBE（含 Web/Simulation/Android/iOS/Backend）评测体系，用更接近真实运行环境的方式验证“能跑、能交付”。

如何使用

• API：已上线 MiniMax Open Platform
• 产品：基于 M2.1 的 MiniMax Agent 已开放
• 开源：模型权重提供本地部署，推荐 SGLang / vLLM 等推理框架

原文链接：https://www.minimax.io/news/minimax-m21

#MiniMax #开源大模型 #AI编程 #多语言开发 #Agent工作流
MiniMax

MiniMax M2.1: Significantly Enhanced Multi-Language Programming, Built for Real-World Complex Tasks

21:52 · 2025年12月23日 · 周二
MiniMax 开源大模型 AI编程多语言开发 Agent工作流

Search: #Agent标准化

GitAgent：用 Git 仓库定义 AI Agent 的开放标准AI Agent 框架百花齐放，但每个框架都有自己的结构，Agent 定义无法跨平台复用

MiniMax M2.1 发布：面向真实复杂任务的多语言编程升级MiniMax 发布新一代文本模型 MiniMax M2.1，目标从“可用、低成本”进一步走向“能解决真实世界的复杂任务”，重点补齐多语言工程协作与办公场景执行力