Skip to main content

Search: #Agent标准化

无原创,纯转发
  1. GitAgent:用 Git 仓库定义 AI Agent 的开放标准

    AI Agent 框架百花齐放,但每个框架都有自己的结构,Agent 定义无法跨平台复用。GitAgent 提出了一种框架无关、基于 Git 的 Agent 定义标准——克隆一个仓库,就能获得一个 Agent。

    核心理念

    Git 原生:版本控制、分支管理、Diff 比较、协作能力开箱即用
    框架无关:通过适配器导出到 Claude Code、OpenAI、CrewAI、Cursor 等任意框架
    合规就绪:内置 FINRA、美联储、SEC 等金融监管合规支持
    可组合:Agent 之间可以继承、依赖和委托

    怎么用?

    一个仓库只需两个文件即可成为 Agent:

    agent.yaml:清单文件,定义名称、版本、模型、技能、工具等
    SOUL.md:身份文件,定义人格、沟通风格和价值观

    可选添加 RULES.md(硬约束)、DUTIES.md(职责分离)、skills/(技能模块)、workflows/(工作流)等目录,按需扩展。

    亮点设计

    12 种架构模式:包括人类审批(Human-in-the-Loop)、Agent 版本管理、分支部署、Agent Fork 与混用、CI/CD 集成、生命周期钩子等
    职责分离(SOD):定义角色权限和冲突矩阵,确保关键流程不被单一 Agent 端到端控制
    SkillsFlow:用 YAML 定义确定性多步工作流,支持步骤依赖和模板数据流
    11 个导出适配器:覆盖 system-prompt、Claude Code、OpenAI、CrewAI、Cursor、Lyzr 等主流平台

    快速开始

    npm install -g gitagent
    gitagent init --template standard
    gitagent validate
    gitagent export --format system-prompt
    


    项目目前已获 1.1k Star,MIT 开源协议。

    🔗 https://github.com/open-gitagent/gitagent

    #AIAgent #GitAgent #开源 #Agent标准化 #框架无关 GitHub - open-gitagent/gitagent: A universal git-native AI agent framework. Your agent lives inside a git repo — identity, rules…
  2. Tool Search Tool:让大规模工具库“按需加载”

    当你的系统里有上百甚至上千个工具时,把所有工具定义一次性塞进上下文,会带来两个典型问题:既浪费上下文窗口(50 个工具就可能吃掉 1–2 万 token),也会让模型在 30–50 个工具以上更容易选错工具。Tool Search Tool 的思路是:先只暴露“搜索工具的工具”,其余工具标记为延迟加载;模型需要时先搜索,再把最相关的少量工具定义加载进来使用。

    核心机制(7 步)

    • 请求里先放入工具搜索工具(Regex 或 BM25 版本)+ 少量常用非延迟工具
    • 其余工具定义加上 defer_loading: true(不立即进上下文)
    • 模型需要更多工具时,先调用 tool search
    • 服务端返回 3–5 个最相关tool_reference
    • 这些引用会被自动展开成完整工具定义
    • 模型再从“已发现”的工具里选择并调用
    • 这样既省上下文,又保持工具选择准确率

    两种搜索方式怎么选

    Regex 版tool_search_tool_regex_20251119):查询是 Python 正则,不是自然语言;适合你希望可控匹配(如 get_.*_data(?i)slack)。限制:模式最长 200 字符。
    BM25 版tool_search_tool_bm25_20251119):查询用自然语言;更适合“我想做什么”式的描述。

    两种方式都会搜索:工具名、描述、参数名、参数描述。

    延迟加载的最佳实践

    • 工具搜索工具本身不要设置 defer_loading: true
    • 保留 3–5 个最常用工具为非延迟(提升命中与体验)
    • 工具命名与描述尽量贴近用户常用说法(提升可检索性)
    • 适合场景:工具 >10 个、工具定义 >10K token、工具选择准确率下降、MCP 多服务器(200+ 工具)等
    • 不太适合:工具 <10 个且几乎每次都要用、工具定义非常短

    响应与错误处理要点

    • 响应里会出现 server_tool_use(触发工具搜索)与 tool_search_tool_result(返回引用列表)
    • 常见 400 错误:
    全部工具都 deferred:至少要有 1 个非延迟工具
    引用的工具缺少定义tool_reference 指向的工具必须在顶层 tools 里有对应定义(并通常设为 deferred)
    • 工具搜索执行期错误(仍返回 200):如 invalid_patternpattern_too_longtoo_many_requestsunavailable

    与 MCP、缓存、流式的配合

    • 可与 MCP toolset 结合:用 default_config.defer_loading 控制 MCP 工具默认延迟加载,并可对特定工具覆盖
    • 支持 prompt caching:已发现的工具可在后续轮次复用,不必每次重新搜索
    • 流式返回会把搜索调用与结果作为事件发出,便于前端展示“正在搜索/已找到工具”

    原文链接:https://platform.claude.com/docs/en/agents-and-tools/tool-use/tool-search-tool

    #工具调用 #Agent开发 #上下文优化 #MCP #API设计 Tool search tool
  3. AI SDK 6:从“调用模型”到“构建可复用智能体”

    Vercel 发布 AI SDK 6,把 TypeScript AI 应用的开发重心从函数式调用(generateText/streamText)进一步推进到可复用、可维护、可观测的 **Agent(智能体)**体系,并补齐了安全审批、MCP 全能力支持、调试工具等关键环节。

    这次更新最值得关注的点

    Agents / ToolLoopAgent:用 Agent 抽象把 模型、指令、工具 固化成可复用单元;ToolLoopAgent 提供“模型调用 → 工具执行 → 回填结果 → 继续推理”的生产级循环(默认最多 20 步),同一套定义可在 UI、API、后台任务复用。
    工具执行审批(Human-in-the-loop):工具支持 needsApproval,可按输入内容动态决定是否需要人工确认,适合删除文件、支付、修改生产数据等高风险操作。
    工具能力增强
    Strict Mode 可按工具粒度开启,避免某个工具 schema 不兼容导致整次请求失败。
    Input Examples 用“正确示例”提升模型生成工具入参的稳定性。
    toModelOutput 将“应用拿到的完整结果”和“发回模型的 token 内容”分离,减少大文本/二进制(截图、图片)带来的上下文浪费。
    MCP(Model Context Protocol)更完整且稳定:新增/完善 OAuth 认证、Resources、Prompts、Elicitation,并在 @ai-sdk/mcp 中以稳定形态提供,便于对接远程 MCP 服务与第一方数据源。
    工具调用 + 结构化输出generateTextgenerateObject 能力统一,支持在多步工具链路后直接生成最终结构化结果(通过 Output.* 声明输出形态)。
    DevTools 可观测性:通过中间件记录并可视化每一步的输入输出、工具调用、token 消耗、耗时与原始请求/响应,解决多步 agent 调试“黑盒”问题。
    Reranking(重排序):新增 rerank,把检索结果按相关性排序,只喂最相关上下文给模型(当前支持 Cohere、Amazon Bedrock、Together.ai)。
    标准 JSON Schema 生态:支持实现 Standard JSON Schema 接口的任意 schema 库,降低与特定校验库的绑定成本。
    图像编辑generateImage 支持带参考图的编辑(如修补/扩展/风格迁移等),不再只限于文生图。
    更细的返回原因与用量统计:新增 rawFinishReason,并扩展 usage 的输入/输出细分,方便成本优化与兼容不同供应商行为。
    LangChain 适配器重写:更贴合现代 LangChain/LangGraph,支持流式事件转换、工具调用部分输入流等能力。
    更多 Provider Tools:围绕 Anthropic/OpenAI/Google/xAI 等提供平台特性工具(如代码执行、文件搜索、Web/X 搜索、MCP 工具等)。

    升级提示

    从 v5 升级到 v6,可先跑官方 codemod:npx @ai-sdk/codemod v6(文中也提供迁移指南链接)。

    原文链接:https://vercel.com/blog/ai-sdk-6
    #Vercel #AISDK #Agent #MCP #TypeScript AI SDK 6
  4. MiniMax M2.1 发布:面向真实复杂任务的多语言编程升级

    MiniMax 发布新一代文本模型 MiniMax M2.1,目标从“可用、低成本”进一步走向“能解决真实世界的复杂任务”,重点补齐多语言工程协作与办公场景执行力。

    这次重点提升了什么?

    多语言编程能力系统增强:覆盖 Rust / Java / Go / C++ / Kotlin / Objective‑C / TypeScript / JavaScript 等,更贴近真实项目的多语言栈协作。
    Web & App 开发更强、更好看:强化原生 Android / iOS 开发,同时提升设计理解与审美表达,支持复杂交互、3D 场景模拟与高质量可视化。
    更适合办公场景的“复合指令”执行:在多约束条件下做端到端任务推进,更强调“按要求完成”而不是只写对代码。
    更简洁、更高效的输出:相较 M2,响应更精炼、速度更快、token 消耗更低,适配持续式 AI Coding / Agent 工作流。
    更强的 Agent / 工具泛化:官方称在多种编码工具与 Agent 框架中表现稳定,并兼容常见的上下文管理约定。
    对话与写作质量同步提升:不仅是“更会写代码”,也更擅长技术文档与日常写作的结构化表达。

    基准与展示

    • 在多项软件工程评测上相对 M2 有明显提升,并强调多语言场景竞争力;同时引入 VIBE(含 Web/Simulation/Android/iOS/Backend)评测体系,用更接近真实运行环境的方式验证“能跑、能交付”。

    如何使用

    API:已上线 MiniMax Open Platform
    产品:基于 M2.1 的 MiniMax Agent 已开放
    开源:模型权重提供本地部署,推荐 SGLang / vLLM 等推理框架

    原文链接:https://www.minimax.io/news/minimax-m21

    #MiniMax #开源大模型 #AI编程 #多语言开发 #Agent工作流
1px