<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>开源模型 | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>omp：直接集成 IDE 能力的终端 AI 编码助手oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体</title><link>https://localhost/posts/138</link><guid isPermaLink="true">https://localhost/posts/138</guid><pubDate>Mon, 15 Jun 2026 15:52:13 GMT</pubDate><content:encoded>omp：直接集成 IDE 能力的终端 AI 编码助手&lt;br /&gt;&lt;br /&gt;oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体。它不仅是一个代码生成器，更是一个深度集成 IDE 工具的“全能型选手”，旨在为开发者提供开箱即用、无缝连接的终端开发体验。&lt;br /&gt;&lt;br /&gt;核心亮点：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;深度集成 IDE 工具链&lt;/b&gt;：内置 LSP（Language Server Protocol），AI 能够像在 IDE 中一样精准进行跨文件重命名与格式化；同时支持 DAP（Debug Adapter Protocol），可以直接启动调试器（如 lldb, dlv, debugpy）进行单步调试和堆栈排查。&lt;br /&gt;•   &lt;b&gt;创新的 Snapcompact 图像压缩&lt;/b&gt;：当对话历史过长时，omp 不使用 LLM 进行文本总结，而是将历史记录渲染成极其微小的像素字体 PNG 图像，并发送给多模态模型读取。这一技术能够确保上下文细节不丢失，且仅消耗约 1/3 的 Token 成本。&lt;br /&gt;•   &lt;b&gt;强悍的 Rust 原生引擎&lt;/b&gt;：核心由约 5.5 万行 Rust 代码构建，搜索、shell、AST 分析等高频操作均在进程内完成，避免频繁 fork 子进程，效率极高。&lt;br /&gt;•   &lt;b&gt;本地化记忆与离线整理&lt;/b&gt;：使用本地 SQLite 矢量记忆库，并使用本地的小模型（如 Qwen-1.7B / Gemma-1B）在本地整理记忆与会话标题，数据不离设备。&lt;br /&gt;•   &lt;b&gt;强大的协作与扩展性&lt;/b&gt;：支持通过 &lt;code&gt;/collab&lt;/code&gt; 实现端到端加密的实时会话共享；兼容多种主流编辑器规则（如 Cursor, Cline, Copilot），甚至可以通过 ACP 协议直接在 Zed 编辑器中驱动终端中的同一个 omp 实例。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://omp.sh/&quot; target=&quot;_blank&quot;&gt;https://omp.sh/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A0%81%E5%8A%A9%E6%89%8B&quot;&gt;#AI编码助手&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B%E5%B7%A5%E5%85%B7&quot;&gt;#编程工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Rust&quot;&gt;#Rust&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE&quot;&gt;#开源项目&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%99%BA%E8%83%BD%E5%BC%80%E5%8F%91&quot;&gt;#智能开发&lt;/a&gt;&lt;a href=&quot;https://omp.sh/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;omp&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;omp — a coding agent with the IDE wired in&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/OIp_uPjy8j57e8jFQ1EAHhDS4v_1ipZ5Hr_c3LzsU_WeVFLL0_N2oOCfVHMaFEy7q363DDSN-TkFGJ6K1cJNzemHtQtxCtEses5g2rTtw3vct34VT0BQwiYlR6wxHDS5LSOiWujruVXiBtCa5P-X5RNdpHgWwgAoIqKLkuSYE58adDMmTqIEV-xW3lSaGS3MdMLtnX22Hps3Ztzieaih_UfI05kKrw0ikTtMuWsyiHnNQMXwv5Ec2iRaQl0MtuJyCTFCXlihL8kVRKVJVcH-SrS_fCiwI_PMaV7IZWmpK1KPdoeIZy0_C8J1dUZTbAQpVtpZseIWUh54kj0ZerxGZw.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;lazy&quot; /&gt;
  &lt;div&gt;omp — a coding agent with the IDE wired in&lt;/div&gt;
  &lt;div&gt;Subagents, plan mode, LSP, DAP, hindsight memory, hashline edits, time-traveling rules — with a native Rust engine doing the heavy lifting.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Flue：构建下一代 AI Agent 的 TypeScript 架构框架Flue 提出了一个核心公式：Agent = Model + Harness</title><link>https://localhost/posts/130</link><guid isPermaLink="true">https://localhost/posts/130</guid><pubDate>Mon, 11 May 2026 10:03:02 GMT</pubDate><content:encoded>Flue：构建下一代 AI Agent 的 TypeScript 架构框架&lt;br /&gt;&lt;br /&gt;Flue 提出了一个核心公式：&lt;b&gt;Agent = Model + Harness&lt;/b&gt;。它不仅仅是一个简单的 SDK，而是一个专为构建自主 Agent 设计的“可编程治理框架”（Harness），旨在让开发者能够轻松打造像 Claude Code 或 Codex 这样具备规划、环境感知和执行能力的强力工具。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心特性：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;高度可编程：&lt;/b&gt; 使用 TypeScript 编写 Agent 逻辑，支持定义复杂的技能（Skills）、工作流和多 Session 管理。&lt;br /&gt;•   &lt;b&gt;自带沙箱环境：&lt;/b&gt; 提供内置的虚拟沙箱或连接远程沙箱（如 Daytona），让 Agent 安全地执行 Bash 命令、读写文件或运行代码。&lt;br /&gt;•   &lt;b&gt;安全与隐私：&lt;/b&gt; 采用精细的权限控制，确保敏感的 API Token 不会被模型或沙箱环境直接接触。&lt;br /&gt;•   &lt;b&gt;跨平台部署：&lt;/b&gt; 编写一次逻辑，即可部署为 HTTP 服务，或在 CLI、GitHub Actions、Cloudflare Workers 等多种环境运行。&lt;br /&gt;&lt;br /&gt;与其使用通用的成品 AI 工具，Flue 鼓励开发者根据特定的产品需求、数据和工作流，构建完全属于自己的定制化 Agent。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://flueframework.com/&quot; target=&quot;_blank&quot;&gt;https://flueframework.com/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI&quot;&gt;#AI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Agent&quot;&gt;#Agent&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23TypeScript&quot;&gt;#TypeScript&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E5%B7%A5%E5%85%B7&quot;&gt;#开发工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE&quot;&gt;#开源项目&lt;/a&gt;&lt;a href=&quot;https://flueframework.com/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Flue&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Flue — The Agent Harness Framework&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/bSLr_mz-PbMp4em9djVO1KyhUTZnuU6W6ZkZL2xUrt6Ksdyfn1dzf100D6rdzMWa5bpfW9vW8WAotdhQZu_D_0hlMRuOSb55nBzeFTQJYZ-ylE7pd2rKh19upPQRc17lcJGowOAeyWMS4fw0EvVC1iej7BuY-7PhvTRnH3ty1DlVxFevs3kd5XUPY_Vx-Yh2fwLN8nbQMxTnnytkivGj5qcoAGBrB9MC22M9iamjBKpRZ2DkAi5usc6IFdjqdD5y8qMs4IkhEx6LfGBdsx_vP3tFZfgqF-ZOeHPw9Jo7g7AW6XKbt7UGh2kgiL3KJfZHWdIBJQHi47tTAJ6yPDwgCQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;lazy&quot; /&gt;
  &lt;div&gt;Flue — The Agent Harness Framework&lt;/div&gt;
  &lt;div&gt;Agent = Model + Harness. Build autonomous agents and powerful AI workflows with Flue&apos;s programmable TypeScript harness. Write once, deploy anywhere.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Gemma 4 图解指南：Google DeepMind 开源模型家族全面解析Google DeepMind 发布了 Gemma 4 系列模型，作者 Maarten Grootendorst（刚入职 Google DeepMind）以丰富的可视化方式详细拆解了这一系列模型的架构设计</title><link>https://localhost/posts/123</link><guid isPermaLink="true">https://localhost/posts/123</guid><pubDate>Mon, 06 Apr 2026 10:24:46 GMT</pubDate><content:encoded>&lt;b&gt;Gemma 4 图解指南：Google DeepMind 开源模型家族全面解析&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Google DeepMind 发布了 Gemma 4 系列模型，作者 Maarten Grootendorst（刚入职 Google DeepMind）以丰富的可视化方式详细拆解了这一系列模型的架构设计。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;四款模型，覆盖多种场景&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Gemma 4 E2B&lt;/b&gt; — 密集模型，等效 20 亿参数，适合端侧部署&lt;br /&gt;•   &lt;b&gt;Gemma 4 E4B&lt;/b&gt; — 密集模型，等效 40 亿参数，适合端侧部署&lt;br /&gt;•   &lt;b&gt;Gemma 4 31B&lt;/b&gt; — 310 亿参数的密集模型&lt;br /&gt;•   &lt;b&gt;Gemma 4 26B A4B&lt;/b&gt; — MoE 架构，总参数 260 亿，推理时仅激活 40 亿参数，兼顾性能与效率&lt;br /&gt;&lt;br /&gt;所有模型均为&lt;b&gt;多模态&lt;/b&gt;，支持图像输入；小模型（E2B/E4B）还额外支持&lt;b&gt;音频输入&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心架构亮点&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;注意力机制优化：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   局部注意力（滑动窗口）与全局注意力交替堆叠（5:1 或 4:1），最后一层始终为全局注意力&lt;br /&gt;•   全局注意力层采用 8 个 Query 共享 1 个 KV 头的分组查询注意力（GQA）&lt;br /&gt;•   &lt;b&gt;K=V 技巧&lt;/b&gt;：全局注意力层中 Key 等于 Value，进一步压缩 KV 缓存&lt;br /&gt;•   &lt;b&gt;p-RoPE&lt;/b&gt;：仅对前 25% 维度施加旋转位置编码，避免低频维度引入噪声，提升长上下文处理能力&lt;br /&gt;&lt;br /&gt;&lt;b&gt;视觉编码器：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   基于 Vision Transformer（ViT），支持可变宽高比和可变分辨率&lt;br /&gt;•   通过 2D RoPE 编码 patch 的二维位置信息&lt;br /&gt;•   引入 soft token budget（70/140/280/560/1120），用户可按任务需求灵活选择分辨率&lt;br /&gt;&lt;br /&gt;&lt;b&gt;MoE 架构（26B A4B）：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   128 个专家中每次激活 8 个 + 1 个始终激活的共享专家（3 倍大小）&lt;br /&gt;•   虽然总参数 260 亿，推理速度接近 40 亿参数模型&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Per-Layer Embeddings（E2B/E4B）：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   每一层都有独立的 token embedding 查找表，存储在闪存而非显存中&lt;br /&gt;•   让小模型在有限 RAM 下也能获得更强的表达能力，非常适合手机等端侧设备&lt;br /&gt;&lt;br /&gt;&lt;b&gt;音频编码器（E2B/E4B）：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   基于 Conformer 架构，通过梅尔频谱图提取特征并下采样为 soft token&lt;br /&gt;•   支持语音识别和翻译等任务&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4&quot; target=&quot;_blank&quot;&gt;https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23Gemma4&quot;&gt;#Gemma4&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23GoogleDeepMind&quot;&gt;#GoogleDeepMind&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%9A%E6%A8%A1%E6%80%81&quot;&gt;#多模态&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MoE&quot;&gt;#MoE&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt;&lt;a href=&quot;https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Maartengrootendorst&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;A Visual Guide to Gemma 4&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/FACIuiyNybxMxr_qN1wgPGgB5ZlMM93UDrcmr5R6kRgM8J8Mb5wORe8AL7FPpts134BQcsTnCuT5j8MTMNIXkLgEDWoYSs_QWCwTeYucc8qkdJcy9C4kY3G43Eiu1g7L671-17Cs9cF19kxjIlEhNk6voKK1jkBe4pbCjWfuWRCZt9BZm_nE9KFmyxJPPdDkBa1fqhorcZDiJvm8Xg7szSOiQWwsNq63-ykXurikoKKnZivIIfBeZgEwHgHsFsfLvG3gv1Jlan2gGyWN8pXULFKrkz9tO6NRXXLLnzYW4FuNy9LBLWQKz2cRAzfNoZD5sxgR7J8pFY3j-Z8_1AuQ_Q.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;lazy&quot; /&gt;
  &lt;div&gt;A Visual Guide to Gemma 4&lt;/div&gt;
  &lt;div&gt;A great start to a new job ;)&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>GitAgent：用 Git 仓库定义 AI Agent 的开放标准AI Agent 框架百花齐放，但每个框架都有自己的结构，Agent 定义无法跨平台复用</title><link>https://localhost/posts/121</link><guid isPermaLink="true">https://localhost/posts/121</guid><pubDate>Wed, 25 Mar 2026 01:48:08 GMT</pubDate><content:encoded>&lt;b&gt;GitAgent：用 Git 仓库定义 AI Agent 的开放标准&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;AI Agent 框架百花齐放，但每个框架都有自己的结构，Agent 定义无法跨平台复用。&lt;b&gt;GitAgent&lt;/b&gt; 提出了一种框架无关、基于 Git 的 Agent 定义标准——克隆一个仓库，就能获得一个 Agent。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心理念&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Git 原生&lt;/b&gt;：版本控制、分支管理、Diff 比较、协作能力开箱即用&lt;br /&gt;•   &lt;b&gt;框架无关&lt;/b&gt;：通过适配器导出到 Claude Code、OpenAI、CrewAI、Cursor 等任意框架&lt;br /&gt;•   &lt;b&gt;合规就绪&lt;/b&gt;：内置 FINRA、美联储、SEC 等金融监管合规支持&lt;br /&gt;•   &lt;b&gt;可组合&lt;/b&gt;：Agent 之间可以继承、依赖和委托&lt;br /&gt;&lt;br /&gt;&lt;b&gt;怎么用？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;一个仓库只需两个文件即可成为 Agent：&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;agent.yaml&lt;/code&gt;：清单文件，定义名称、版本、模型、技能、工具等&lt;br /&gt;•   &lt;code&gt;SOUL.md&lt;/code&gt;：身份文件，定义人格、沟通风格和价值观&lt;br /&gt;&lt;br /&gt;可选添加 &lt;code&gt;RULES.md&lt;/code&gt;（硬约束）、&lt;code&gt;DUTIES.md&lt;/code&gt;（职责分离）、&lt;code&gt;skills/&lt;/code&gt;（技能模块）、&lt;code&gt;workflows/&lt;/code&gt;（工作流）等目录，按需扩展。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;亮点设计&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;12 种架构模式&lt;/b&gt;：包括人类审批（Human-in-the-Loop）、Agent 版本管理、分支部署、Agent Fork 与混用、CI/CD 集成、生命周期钩子等&lt;br /&gt;•   &lt;b&gt;职责分离（SOD）&lt;/b&gt;：定义角色权限和冲突矩阵，确保关键流程不被单一 Agent 端到端控制&lt;br /&gt;•   &lt;b&gt;SkillsFlow&lt;/b&gt;：用 YAML 定义确定性多步工作流，支持步骤依赖和模板数据流&lt;br /&gt;•   &lt;b&gt;11 个导出适配器&lt;/b&gt;：覆盖 system-prompt、Claude Code、OpenAI、CrewAI、Cursor、Lyzr 等主流平台&lt;br /&gt;&lt;br /&gt;&lt;b&gt;快速开始&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;pre&gt;&lt;code&gt;npm install &lt;span&gt;-&lt;/span&gt;g gitagent
gitagent init &lt;span&gt;--template standard&lt;/span&gt;
gitagent validate
gitagent export &lt;span&gt;--format system-prompt&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;项目目前已获 1.1k Star，MIT 开源协议。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://github.com/open-gitagent/gitagent&quot; target=&quot;_blank&quot;&gt;https://github.com/open-gitagent/gitagent&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AIAgent&quot;&gt;#AIAgent&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23GitAgent&quot;&gt;#GitAgent&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90&quot;&gt;#开源&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Agent%E6%A0%87%E5%87%86%E5%8C%96&quot;&gt;#Agent标准化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%A1%86%E6%9E%B6%E6%97%A0%E5%85%B3&quot;&gt;#框架无关&lt;/a&gt;&lt;a href=&quot;https://github.com/open-gitagent/gitagent&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;GitHub&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;GitHub - open-gitagent/gitagent: A universal git-native AI agent framework. Your agent lives inside a git repo — identity, rules…&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/V-lWrKqEF6ToNn_roAaPTrHHpqinjEG0HQC56TpbOGtE-fv1ZU4POqXmfnY0Q_mRwhMlSqvG7IqXtEm1KRAevezbhJMcWA__rouydyWN-AVFY5UpeE7q1GCBSqURMqI3BLLUItcve4pYnDBJTViDiUM2ZU3Kz_hVccJko1bs0_9fQ-q0M_PIg_kQYPLTrwtRTgZsL16G0r2zZFDteAwoPUF3jaq7gSh8r3mvYWm7rBuXONSN9KqzmmyLupwCf2h9OptkEoSjEh2zR21YGOIwb3hso0pPiU5jmPy49B97T3ltjLTdTJnakkmlYidgb8P7OwINFU3aDfaL-7qrwnIFLg.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;lazy&quot; /&gt;
  &lt;div&gt;GitHub - open-gitagent/gitagent: A universal git-native AI agent framework. Your agent lives inside a git repo — identity, rules…&lt;/div&gt;
  &lt;div&gt;A universal git-native AI agent framework. Your agent lives inside a git repo — identity, rules, memory, tools, and skills are all version-controlled files. - open-gitagent/gitagent&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>GitHub Agentic Workflows：用自然语言写 GitHub Actions 的“智能工作流”GitHub 开源项目 gh-aw（GitHub Agentic Workflows），主打一个思路：用自然语言 Markdown 编写“代理式（agentic）工作流”，然后直接在 GitHub Actions 里运行，让 AI 代你完成仓库中的重复性任务</title><link>https://localhost/posts/118</link><guid isPermaLink="true">https://localhost/posts/118</guid><pubDate>Thu, 12 Feb 2026 00:19:29 GMT</pubDate><content:encoded>&lt;b&gt;GitHub Agentic Workflows：用自然语言写 GitHub Actions 的“智能工作流”&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;GitHub 开源项目 &lt;b&gt;gh-aw（GitHub Agentic Workflows）&lt;/b&gt;，主打一个思路：&lt;b&gt;用自然语言 Markdown 编写“代理式（agentic）工作流”&lt;/b&gt;，然后直接在 &lt;b&gt;GitHub Actions&lt;/b&gt; 里运行，让 AI 代你完成仓库中的重复性任务。&lt;br /&gt;&lt;br /&gt;它提供的核心价值包括：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;更低门槛的工作流编写方式&lt;/b&gt;：用 Markdown 描述要做什么，而不是从零写复杂的 YAML/脚本&lt;br /&gt;•   &lt;b&gt;更强调安全的执行模型（Guardrails）&lt;/b&gt;：默认只读权限；写入操作需要通过经过清洗的 &lt;code&gt;safe-outputs&lt;/code&gt;；并配套多层防护（输入净化、工具白名单、编译期校验、网络隔离、供应链安全等）&lt;br /&gt;•   &lt;b&gt;完善的文档与上手路径&lt;/b&gt;：官方提供 Quick Start 与完整文档，方便快速跑通示例并理解整体机制&lt;br /&gt;•   &lt;b&gt;生态配套&lt;/b&gt;：&lt;br /&gt;    •   &lt;b&gt;AWF（Agent Workflow Firewall）&lt;/b&gt;：限制与记录代理的网络访问（出站控制）&lt;br /&gt;    •   &lt;b&gt;MCP Gateway&lt;/b&gt;：统一转发 MCP（Model Context Protocol）服务调用，便于集中管理访问&lt;br /&gt;&lt;br /&gt;适合关注 AI + DevOps、希望把“AI 介入仓库日常操作”做得更可控、更工程化的团队参考与尝试（同时也要保持必要的人类监督）。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://github.com/github/gh-aw&quot; target=&quot;_blank&quot;&gt;https://github.com/github/gh-aw&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23GitHubActions&quot;&gt;#GitHubActions&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E8%87%AA%E5%8A%A8%E5%8C%96&quot;&gt;#AI自动化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%B7%A5%E4%BD%9C%E6%B5%81&quot;&gt;#工作流&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%AE%89%E5%85%A8%E5%B7%A5%E7%A8%8B&quot;&gt;#安全工程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE&quot;&gt;#开源项目&lt;/a&gt;&lt;a href=&quot;https://github.com/github/gh-aw&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;GitHub&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;GitHub - github/gh-aw: GitHub Agentic Workflows&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/gFmbJk_6zcyFDauYyCN_hY0V2WY6mYqHQEMHj8Auj-GII-frHV0iC0eAWyjAu1shPmccwG5PMk0rm8_ns2NH6FRU3e1zTySKSOc97VGveF-hGrvm-d9AbjpFppBRfJybt50CZvMiijN1VQTYq4Lf45ERGWW4X97I99DMK5_MLp1OzU4zxI6DxtDMEB3dXmi_SOCpFvO5vr6ceY7GDkS96gIGmdiFrSMCNhtagHsSL3XnDbSf0Kc4CiNxL6dhdaTf26-9QbXrOkGTeCDxofMhffd-qcmNbQcXazjVRomeqhAHs3M6BpQnJXGM0cao81njFo5R5SS1fMqgm1NdEyBozg.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;GitHub - github/gh-aw: GitHub Agentic Workflows&lt;/div&gt;
  &lt;div&gt;GitHub Agentic Workflows. Contribute to github/gh-aw development by creating an account on GitHub.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Stripe「Minions」：一键生成、端到端交付的无人值守编码代理Stripe 在内部打造了一套名为 Minions 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入</title><link>https://localhost/posts/116</link><guid isPermaLink="true">https://localhost/posts/116</guid><pubDate>Tue, 10 Feb 2026 14:31:52 GMT</pubDate><content:encoded>&lt;b&gt;Stripe「Minions」：一键生成、端到端交付的无人值守编码代理&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Stripe 在内部打造了一套名为 &lt;b&gt;Minions&lt;/b&gt; 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入。现在，Stripe &lt;b&gt;每周有超过 1000 个合并的 PR&lt;/b&gt; 是由 Minions 从头到尾生成的（人类负责 Review，但不写代码）。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么要自研？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;在 Stripe 这种超大规模、强约束的工程环境里，“从零写个原型”和“在成熟巨型代码库里安全改动”完全不是一回事：&lt;br /&gt;&lt;br /&gt;•   代码库规模巨大（数亿行），栈也相对小众：大量后端是 &lt;b&gt;Ruby + Sorbet&lt;/b&gt;，还有大量 &lt;b&gt;Stripe 自研库&lt;/b&gt;，LLM 天然不熟&lt;br /&gt;•   业务风险极高：Stripe 的代码承载着 &lt;b&gt;每年超过 1 万亿美元&lt;/b&gt; 的支付规模，并受金融合规与监管约束&lt;br /&gt;•   既要让代理“会写”，也要让它“按规矩写、能跑通、能过 CI”，并与既有研发流程深度结合&lt;br /&gt;&lt;br /&gt;&lt;b&gt;工程师怎么用？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;最常见的入口是 &lt;b&gt;Slack&lt;/b&gt;：&lt;br /&gt;&lt;br /&gt;•   在讨论线程里 &lt;a href=&quot;https://t.me/Slack&quot; target=&quot;_blank&quot;&gt;@Slack&lt;/a&gt; App 就能发起 Minion，它会读取整个线程与相关链接作为上下文&lt;br /&gt;•   也集成到内部系统里：文档平台、Feature Flag、工单系统等&lt;br /&gt;    例如 CI 发现 flaky tests，会生成工单，直接提供按钮让 Minion 去修&lt;br /&gt;&lt;br /&gt;完成后，Minion 会：&lt;br /&gt;&lt;br /&gt;•   创建分支 → 推送 → 跑 CI → 按模板生成 PR&lt;br /&gt;&lt;br /&gt;如果效果不理想，人类可以补充指令让它再改；即使不完美，也常常是很好的“可用起点”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Minions 背后怎么运作（要点版）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Stripe 的思路是：&lt;b&gt;把“创意生成”交给 LLM，把“必须可靠执行的步骤”交给确定性工具链&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;•   运行环境：在隔离的 &lt;b&gt;devbox&lt;/b&gt; 中执行（10 秒内可启动，预热并预载代码与服务），与生产与公网隔离，便于并行&lt;br /&gt;•   Agent 框架：基于 Block 的开源编码代理 &lt;b&gt;goose&lt;/b&gt; 的 fork，并做了强定制&lt;br /&gt;•   规则与上下文：读取各类 agent rule 文件，但多为“按目录条件生效”，避免全局死规则拖累&lt;br /&gt;•   工具调用：接入 &lt;b&gt;MCP&lt;/b&gt;（函数调用通用协议），并建设内部 MCP 服务 &lt;b&gt;Toolshed&lt;/b&gt;，提供 &lt;b&gt;400+&lt;/b&gt; 工具（文档、工单、构建状态、Sourcegraph 搜索等）&lt;br /&gt;•   反馈与质量闸门：&lt;br /&gt;    •   首先跑本地启发式 lint/检查（通常 &amp;lt;5 秒）&lt;br /&gt;    •   再跑选择性的 CI（Stripe 有 300 万+ 测试），部分失败可自动修复&lt;br /&gt;    •   为控制成本与等待时间：&lt;b&gt;最多两轮 CI&lt;/b&gt;，强调“能本地提前发现就不要拖到 CI”&lt;br /&gt;&lt;br /&gt;&lt;b&gt;接下来&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;这篇是系列 Part 1，主要讲“怎么用、能做什么”；Part 2 会深入实现细节。整体信号很明确：当“开发者注意力”成为稀缺资源时，无人值守、可并行的编码代理正在改变工程协作方式。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&quot; target=&quot;_blank&quot;&gt;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E7%A8%8B%E5%8C%96&quot;&gt;#AI工程化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A0%81%E4%BB%A3%E7%90%86&quot;&gt;#编码代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E6%95%88%E7%8E%87&quot;&gt;#开发者效率&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23CI%E5%AE%9E%E8%B7%B5&quot;&gt;#CI实践&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Stripe&quot;&gt;#Stripe&lt;/a&gt;&lt;a href=&quot;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;stripe.dev&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Minions: Stripe’s one-shot, end-to-end coding agents&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/H18ir4W7Yx5_y3FWZkpWcsbvq3tjwyhUR2cnF0H8zvQEMEA5hDDuzmWhlJMBqLt1a6rwdrjM7EZks3PRwzG5fKWcZuteGl6cCISlgkoPdBPluHLb1_LdSjq6sK5TIAJHPGzIQTidPEeuFE6bVyc0l3mw_bMwoWgKu09iX7PfPbW9ljEhh8D-CGo_juWvKyLQmO48TL5Q5XsCiS413KHYyOlbRUUGBa98Kl6-avUPqjDOLvvaeC9oSmqqtLOfYFQjLGy4bVo0e9spukFV3F-ffYVjVQ_tOJbmFuVBiJVZJEKaHDk9lOZov2-h9GuQJYKBehz65LkdCb4g-TepDOBhIQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Minions: Stripe’s one-shot, end-to-end coding agents&lt;/div&gt;
  &lt;div&gt;Minions are Stripe’s homegrown coding agents, responsible for more than a thousand pull requests merged each week. Though humans review the code, minions write it from start to finish. Learn how they work, and how we built them.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Agent Trace：为 AI 写的代码建立“可追溯”标准Agent Trace 是一个开放规范，用来记录代码中哪些部分来自 AI、哪些来自人类，并把相关的模型信息、对话链接等“出处”一并纳入版本控制工作流中</title><link>https://localhost/posts/106</link><guid isPermaLink="true">https://localhost/posts/106</guid><pubDate>Sat, 31 Jan 2026 03:11:52 GMT</pubDate><content:encoded>&lt;b&gt;Agent Trace：为 AI 写的代码建立“可追溯”标准&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Agent Trace 是一个开放规范，用来记录&lt;b&gt;代码中哪些部分来自 AI、哪些来自人类&lt;/b&gt;，并把相关的模型信息、对话链接等“出处”一并纳入版本控制工作流中。它强调&lt;b&gt;厂商中立&lt;/b&gt;，让不同工具都能读写同一套归因数据。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心想解决什么&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   随着 Agent/代码助手产出越来越多代码，团队需要更清楚地知道：哪些改动是 AI 生成、用的是什么模型、对应哪次对话/会话。&lt;br /&gt;•   这不是法律意义的“所有权”或“版权”判定，而是工程层面的&lt;b&gt;来源记录&lt;/b&gt;与&lt;b&gt;可审计性&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;主要目标&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;互操作性&lt;/b&gt;：任何兼容工具都能写入/读取归因记录&lt;br /&gt;•   &lt;b&gt;细粒度&lt;/b&gt;：支持到**文件级、行号范围（line range）**的归因&lt;br /&gt;•   &lt;b&gt;可扩展&lt;/b&gt;：允许各家在不破坏兼容的情况下增加自定义元数据&lt;br /&gt;•   &lt;b&gt;人和 Agent 都能读懂&lt;/b&gt;：尽量不依赖特定 UI 才能理解&lt;br /&gt;&lt;br /&gt;&lt;b&gt;不做什么（边界很明确）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   不处理代码法律归属、版权问题&lt;br /&gt;•   不追踪训练数据来源&lt;br /&gt;•   不做质量评估（不判断 AI 代码“好或坏”）&lt;br /&gt;•   不绑定任何界面或产品形态&lt;br /&gt;&lt;br /&gt;&lt;b&gt;规范长什么样（概念速览）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Agent Trace 的基本单位是 &lt;b&gt;Trace Record&lt;/b&gt;（JSON 记录），典型字段包括：&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;version / id / timestamp&lt;/code&gt;：规范版本、记录 ID、时间戳&lt;br /&gt;•   &lt;code&gt;vcs&lt;/code&gt;：版本控制信息（如 git commit SHA；也支持 jj/hg/svn）&lt;br /&gt;•   &lt;code&gt;tool&lt;/code&gt;：生成该记录的工具及版本&lt;br /&gt;•   &lt;code&gt;files&lt;/code&gt;：文件列表；每个文件下按 &lt;b&gt;conversation&lt;/b&gt; 分组&lt;br /&gt;•   &lt;code&gt;conversations.url&lt;/code&gt;：指向产生这段代码的对话链接&lt;br /&gt;•   &lt;code&gt;ranges&lt;/code&gt;：该对话贡献的&lt;b&gt;行号范围&lt;/b&gt;（可选 &lt;code&gt;content_hash&lt;/code&gt; 用于跨移动追踪）&lt;br /&gt;•   &lt;code&gt;metadata&lt;/code&gt;：自定义扩展字段（建议用反向域名避免冲突，如 &lt;code&gt;dev.cursor&lt;/code&gt;）&lt;br /&gt;&lt;br /&gt;&lt;b&gt;实现与落地&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   规范本身不规定 traces 存哪：可以是本地文件、git notes、数据库等。&lt;br /&gt;•   提供了一个参考实现（含存储层、hook 集成），示范如何在文件变更时自动捕获归因信息。&lt;br /&gt;&lt;br /&gt;链接：&lt;a href=&quot;https://agent-trace.dev/&quot; target=&quot;_blank&quot;&gt;https://agent-trace.dev/&lt;/a&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B&quot;&gt;#AI编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%BB%A3%E7%A0%81%E5%BD%92%E5%9B%A0&quot;&gt;#代码归因&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%B7%A5%E7%A8%8B%E8%A7%84%E8%8C%83&quot;&gt;#工程规范&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%8F%AF%E8%BF%BD%E6%BA%AF%E6%80%A7&quot;&gt;#可追溯性&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E5%B7%A5%E5%85%B7&quot;&gt;#开发工具&lt;/a&gt;&lt;a href=&quot;https://agent-trace.dev/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;agent-trace.dev&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Agent Trace&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/Dbn82kUo1Qy_jiyekCFPRk2Vv72IRJiDpL0ojccJ4iWX3Eoa3RuRdjrbWtADB4fJRsxfjTOUT06v3l_tunmFxm_Xwuhu0O44aQpY1Lo55fUc5tNpd7j6sBNi2vRc-uedx5K3XzoLl_A5phGBwPSBKaMmtI5uFQ1jahSqpRIQoh2pZSZuWZL8XG6WNzv8nCseZTyW7rIOtNkFHEg8aZRkIHt681pY_ImVCG568r6oMYS4ykmRUOvUqwUtg-Ehk7mF1IcSoh0utNKjkh8qTgv1cQlFklKa86G02H6EaoyBm-8wwBG_3mEj_rXGQdjA0NdlxqDHSfWUGDBFdKIvwZ39eQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Agent Trace&lt;/div&gt;
  &lt;div&gt;A standard format for tracking AI-generated code.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>OpenClaw 正式亮相：把 AI 助手带到你常用的聊天软件里OpenClaw 宣布品牌更名，并明确了项目定位：一个运行在你自己的机器上的开源 Agent 平台，可从你日常使用的聊天应用直接调用（WhatsApp、Telegram、Discord、Slack、Teams 等），让 AI 助手“跟着你走”</title><link>https://localhost/posts/105</link><guid isPermaLink="true">https://localhost/posts/105</guid><pubDate>Sat, 31 Jan 2026 03:09:59 GMT</pubDate><content:encoded>&lt;b&gt;OpenClaw 正式亮相：把 AI 助手带到你常用的聊天软件里&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;OpenClaw 宣布品牌更名，并明确了项目定位：一个运行在&lt;b&gt;你自己的机器&lt;/b&gt;上的开源 Agent 平台，可从你日常使用的聊天应用直接调用（WhatsApp、Telegram、Discord、Slack、Teams 等），让 AI 助手“跟着你走”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么改名：从 Clawd / Moltbot 到 OpenClaw&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;团队经历了多次命名迭代：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Clawd&lt;/b&gt;：好记但涉及商标/法务问题，被建议更换&lt;br /&gt;•   &lt;b&gt;Moltbot&lt;/b&gt;：寓意“蜕壳成长”，但不够顺口&lt;br /&gt;•   &lt;b&gt;OpenClaw&lt;/b&gt;：已完成商标检索、域名与迁移准备，强调两点：&lt;br /&gt;    •   &lt;b&gt;Open&lt;/b&gt;：开源、开放、社区驱动&lt;br /&gt;    •   &lt;b&gt;Claw&lt;/b&gt;：延续“龙虾”项目起源与文化&lt;br /&gt;&lt;br /&gt;&lt;b&gt;OpenClaw 是什么：你的助手，你的规则&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;核心主张很直接：&lt;b&gt;Your assistant. Your machine. Your rules.&lt;/b&gt;&lt;br /&gt;不同于把数据放在第三方服务器上的 SaaS 助手，OpenClaw 允许你把系统跑在本地电脑、家用服务器或 VPS 上：&lt;b&gt;基础设施你掌控、密钥你掌控、数据也由你掌控&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;本次发布更新亮点&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;随更名一起上线的更新包括：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;新渠道&lt;/b&gt;：新增 Twitch、Google Chat 插件&lt;br /&gt;•   &lt;b&gt;模型支持&lt;/b&gt;：新增 KIMI K2.5、Xiaomi MiMo-V2-Flash&lt;br /&gt;•   &lt;b&gt;Web Chat&lt;/b&gt;：支持像聊天软件一样发送图片&lt;br /&gt;•   &lt;b&gt;安全加固&lt;/b&gt;：累计 34 个与安全相关的提交，并发布可机器验证的安全模型；同时提醒 prompt injection 仍是行业难题，建议参考安全最佳实践&lt;br /&gt;&lt;br /&gt;&lt;b&gt;接下来：安全优先 + 维护体系建设&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;团队表示下一阶段会继续把&lt;b&gt;安全&lt;/b&gt;作为最高优先级，同时提升网关稳定性、体验打磨，并扩展更多模型与提供商支持。由于项目增长迅猛，也在引入更多维护者并建立流程，鼓励社区参与贡献或赞助维护工作。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://openclaw.ai/blog/introducing-openclaw&quot; target=&quot;_blank&quot;&gt;https://openclaw.ai/blog/introducing-openclaw&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90&quot;&gt;#开源&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E4%BB%A3%E7%90%86&quot;&gt;#AI代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E9%9A%90%E7%A7%81%E5%AE%89%E5%85%A8&quot;&gt;#隐私安全&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%87%AA%E6%89%98%E7%AE%A1&quot;&gt;#自托管&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%81%8A%E5%A4%A9%E6%9C%BA%E5%99%A8%E4%BA%BA&quot;&gt;#聊天机器人&lt;/a&gt;&lt;a href=&quot;https://openclaw.ai/blog/introducing-openclaw&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;openclaw.ai&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Introducing OpenClaw - OpenClaw Blog&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/loolDlOduMG0-2oFrysR60C0voA41FMxOCp5L51Qt5w8JMO2LK8w7PnGPPbVS-j_12gdEWjKzxB10EJFoKO7xEnIuJ8Rt76L-YI1rER-Id7xufWFmMWTESxd4UANuPzoYVCrfY69W44oAMEcQvu6czdQ5BiVQsRGCkw5unVXBvTDydOMzkv1lyabQgrDbRR_LwhrT90T4KVr3vkm8xn_Znl9lVbyWpp41XxTQCOX3Q_F-AHdt4b6R1MilinSTly34PcsGEkMf3WPaUXlhy_YuAQgTelxBK_wFQXPJgezZoky4i-XAJLssGbaMQSBEtMh7bEyiB_cFlCFJMbn8TT1wg.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Introducing OpenClaw - OpenClaw Blog&lt;/div&gt;
  &lt;div&gt;The journey from Clawd to Moltbot to OpenClaw—and why this name is here to stay.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Clawdbot：运行在你自己电脑上的个人 AI 助手Clawdbot 主打“AI 真的能做事”：它不是一个被托管在平台里的聊天机器人，而是运行在你的 Mac/Windows/Linux 上，能连接常用通讯工具与各类服务，把对话变成可执行的任务流</title><link>https://localhost/posts/101</link><guid isPermaLink="true">https://localhost/posts/101</guid><pubDate>Sun, 25 Jan 2026 05:59:16 GMT</pubDate><content:encoded>&lt;b&gt;Clawdbot：运行在你自己电脑上的个人 AI 助手&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Clawdbot 主打“AI 真的能做事”：它不是一个被托管在平台里的聊天机器人，而是运行在你的 Mac/Windows/Linux 上，能连接常用通讯工具与各类服务，把对话变成可执行的任务流。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;它能做什么&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;本地运行、隐私优先&lt;/b&gt;：在你的设备上工作，数据默认留在你手里；可接入 Anthropic / OpenAI，也支持本地模型。&lt;br /&gt;•   &lt;b&gt;任意聊天软件对话&lt;/b&gt;：WhatsApp、Telegram、Discord、Slack、Signal、iMessage 等都能用（支持私聊和群聊）。&lt;br /&gt;•   &lt;b&gt;持久记忆&lt;/b&gt;：能记住你的偏好与上下文，越用越“懂你”。&lt;br /&gt;•   &lt;b&gt;浏览器自动化&lt;/b&gt;：可浏览网页、填表、抓取信息。&lt;br /&gt;•   &lt;b&gt;系统级能力&lt;/b&gt;：读写文件、运行命令、执行脚本（可全权限或沙箱化）。&lt;br /&gt;•   &lt;b&gt;技能/插件机制&lt;/b&gt;：用社区技能扩展，也可以让它帮你写自己的技能。&lt;br /&gt;•   &lt;b&gt;集成丰富&lt;/b&gt;：官方列出 50+ 集成（如 Gmail、GitHub、Obsidian、Spotify、Hue 等）。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;快速上手（官方提供的一键方式）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   一键安装：&lt;code&gt;curl -fsSL https://clawd.bot/install.sh | bash&lt;/code&gt;&lt;br /&gt;•   安装 CLI：&lt;code&gt;npm i -g clawdbot&lt;/code&gt;&lt;br /&gt;•   开始引导：&lt;code&gt;clawdbot onboard&lt;/code&gt;&lt;br /&gt;•   另有 &lt;b&gt;macOS 菜单栏 Companion App（Beta）&lt;/b&gt;，适合和 CLI 搭配使用。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://clawd.bot/&quot; target=&quot;_blank&quot;&gt;https://clawd.bot/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E5%8A%A9%E6%89%8B&quot;&gt;#AI助手&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E5%B7%A5%E5%85%B7&quot;&gt;#开源工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%87%AA%E5%8A%A8%E5%8C%96&quot;&gt;#自动化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%B8%AA%E4%BA%BA%E6%95%88%E7%8E%87&quot;&gt;#个人效率&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%99%BA%E8%83%BD%E4%BD%93&quot;&gt;#智能体&lt;/a&gt;&lt;a href=&quot;https://clawd.bot/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;openclaw.ai&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;OpenClaw — Personal AI Assistant&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/sTOqUkfxgT-UUJqnuseC-l1wXYZERp5eaqNQHq1eIgtC4RZBG3-IJwRxDbNgdt8y1lAFBa1Y2fAfY8Y6MdhA-9VGY3WCz6NUW-kMoZ0d7PsfQuQl8RivzTJkRqkaqfpCfLx4gbq3NVm-SJoiq7u9jvA4HZYoOexkG-5KWjHmk6RVlqs5Fw3ij55u6MZvaR3Q-bLWHA9bsJF-DDQAjeT4HcRsygW0z4hO3N3LIhZ7CfsQz7kNFl88rtktZJ5Xx597xnxgxxeThdCRBBF4GR5yYpua0TJgU31Rf4R4Tt6JnwlmIF2ZJIdu9xRUuqnULKqAtqo2LrsEIs_MkFOYepe-rQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;OpenClaw — Personal AI Assistant&lt;/div&gt;
  &lt;div&gt;OpenClaw — The AI that actually does things. Your personal assistant on any platform.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>CoreSpeed：为 AI Agent 打造的容器运行时基础设施CoreSpeed 主打把「Agent 运行」这件事做成开箱即用的基础设施：你可以像部署普通容器一样部署 AI Agent，并获得更快启动、更强隔离和更易扩展的体验</title><link>https://localhost/posts/99</link><guid isPermaLink="true">https://localhost/posts/99</guid><pubDate>Thu, 22 Jan 2026 00:51:52 GMT</pubDate><content:encoded>&lt;b&gt;CoreSpeed：为 AI Agent 打造的容器运行时基础设施&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;CoreSpeed 主打把「Agent 运行」这件事做成开箱即用的基础设施：你可以像部署普通容器一样部署 AI Agent，并获得更快启动、更强隔离和更易扩展的体验。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;它解决的核心问题：把 Agent 从 Demo 变成可上线的系统。&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;关键能力一览&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;127ms 级别快速启动&lt;/b&gt;：通过内置 Warm Pool，让容器接近“秒开/毫秒开”，减少冷启动等待。&lt;br /&gt;•   &lt;b&gt;按用户隔离的安全沙箱&lt;/b&gt;：一人一容器，降低数据串扰与安全风险。&lt;br /&gt;•   &lt;b&gt;无限水平扩展 + 可缩到 0&lt;/b&gt;：按需分配资源，空闲可降到零成本运行。&lt;br /&gt;•   &lt;b&gt;AI &amp;amp; MCP Gateway&lt;/b&gt;：统一接入 AI 模型与 MCP Server，提供可观测性与安全防护（例如减少 API Key 泄露风险），并支持按调用计费。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;配套：Zypher（TypeScript Agent Runtime）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;同时他们提供 &lt;b&gt;Zypher SDK&lt;/b&gt;，强调：&lt;br /&gt;&lt;br /&gt;•   不是固定工作流，而是「真 Agent」的反应式循环&lt;br /&gt;•   模型/供应商无关（Claude、GPT 等）&lt;br /&gt;•   多 Agent 协作架构&lt;br /&gt;•   丰富工具与 MCP 协议支持&lt;br /&gt;•   更节省 Token 的上下文加载与执行策略&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://www.corespeed.io/&quot; target=&quot;_blank&quot;&gt;https://www.corespeed.io/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E4%BB%A3%E7%90%86&quot;&gt;#AI代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%AE%B9%E5%99%A8%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD&quot;&gt;#容器基础设施&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MCP&quot;&gt;#MCP&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AgentRuntime&quot;&gt;#AgentRuntime&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7&quot;&gt;#开发者工具&lt;/a&gt;</content:encoded></item><item><title>Open Responses：让 LLM 接口真正“可互通”的开放规范Open Responses 是一个开源规范与生态，目标是基于 OpenAI Responses API 的理念，建立多模型提供方可互操作的统一接口层</title><link>https://localhost/posts/94</link><guid isPermaLink="true">https://localhost/posts/94</guid><pubDate>Fri, 16 Jan 2026 05:36:14 GMT</pubDate><content:encoded>&lt;b&gt;Open Responses：让 LLM 接口真正“可互通”的开放规范&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Open Responses 是一个开源规范与生态，目标是基于 OpenAI Responses API 的理念，建立&lt;b&gt;多模型提供方可互操作&lt;/b&gt;的统一接口层。它通过共享 Schema 和配套工具，让开发者能用同一种请求/输出结构，跨不同提供方调用模型、处理流式返回，并组合更复杂的 Agent 工作流。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么需要它？&lt;/b&gt;&lt;br /&gt;现在各家 LLM API 的核心组件越来越相似（消息、工具调用、流式、多模态等），但细节编码方式不同，迁移与兼容成本高。Open Responses 希望把“共同部分”沉淀成稳定规范，减少重复适配。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;它强调的设计方向：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;默认多提供方&lt;/b&gt;：一套 Schema 映射多家模型/平台&lt;br /&gt;•   &lt;b&gt;更贴近真实 Agent 工作流&lt;/b&gt;：统一的流式事件、工具调用模式，以及以“items”作为输出与工具使用的原子单元&lt;br /&gt;•   &lt;b&gt;可扩展但不碎片化&lt;/b&gt;：核心稳定，同时允许在必要时容纳提供方特性&lt;br /&gt;&lt;br /&gt;&lt;b&gt;如何开始：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   阅读规范，理解 items、流式事件、工具使用等核心概念&lt;br /&gt;•   查看 OpenAPI 参考，掌握完整类型与接口面&lt;br /&gt;•   用官方的验收测试验证你的 API 实现一致性&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://www.openresponses.org/&quot; target=&quot;_blank&quot;&gt;https://www.openresponses.org/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23LLM&quot;&gt;#LLM&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%94%BE%E8%A7%84%E8%8C%83&quot;&gt;#开放规范&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%9A%E6%A8%A1%E5%9E%8B&quot;&gt;#多模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%BA%92%E6%93%8D%E4%BD%9C&quot;&gt;#互操作&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23API%E8%AE%BE%E8%AE%A1&quot;&gt;#API设计&lt;/a&gt;&lt;a href=&quot;https://www.openresponses.org/&quot; target=&quot;_blank&quot;&gt;
  &lt;i&gt;&lt;/i&gt;
  &lt;div&gt;www.openresponses.org&lt;/div&gt;
  
  &lt;div&gt;Open Responses&lt;/div&gt;
  &lt;div&gt;Open Responses documentation overview.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Claude Opus 4.5：让“能做”突然变得很容易作者分享了一个明显的转折：三个月前他还不相信“AI 代理能替代开发者”，但在体验 Claude Opus 4.5 后，他开始认为这件事正在发生——至少在相当一部分软件开发场景里</title><link>https://localhost/posts/90</link><guid isPermaLink="true">https://localhost/posts/90</guid><pubDate>Mon, 12 Jan 2026 09:21:00 GMT</pubDate><content:encoded>&lt;b&gt;Claude Opus 4.5：让“能做”突然变得很容易&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;作者分享了一个明显的转折：三个月前他还不相信“AI 代理能替代开发者”，但在体验 Claude Opus 4.5 后，他开始认为这件事正在发生——至少在相当一部分软件开发场景里。&lt;br /&gt;&lt;br /&gt;他用几个真实项目说明差异不在“会写代码”，而在于&lt;b&gt;一次成功率、能自我迭代、能把复杂系统拼起来&lt;/b&gt;：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Windows 右键图片格式转换工具&lt;/b&gt;：从文件资源管理器菜单到打包、安装/卸载脚本、发布网站、GitHub Actions 自动发布，整体接近“一次成型”。遇到报错会自己用 &lt;code&gt;dotnet&lt;/code&gt; 构建、读错误、再修复。&lt;br /&gt;•   &lt;b&gt;录屏与简单剪辑工具&lt;/b&gt;：从类似 LICEcap 的录制开始，持续加到视频/图片编辑、裁剪、模糊、标注等功能，作者感叹“几小时就推进到很远”。&lt;br /&gt;•   &lt;b&gt;AI 发帖工具（给小生意用）&lt;/b&gt;：iOS 端批量上传照片→AI 生成文案→定时发到 Facebook。后端涉及认证、存储、云函数、日志排错等一堆“胶水活”，但模型能通过 CLI 自己创建资源、查日志并修问题，还顺手做了管理后台。&lt;br /&gt;•   &lt;b&gt;订单与路线追踪&lt;/b&gt;：解析 Gmail 订单、规划路线、统计行驶时间（用于税务），作者强调：这种“手写很痛苦”的 Google/Firebase 集成，Opus 4.5 反而很顺。&lt;br /&gt;&lt;br /&gt;文章也没有回避争议点：&lt;br /&gt;作者承认自己并不完全理解这些应用“内部怎么搭起来的”（比如 Swift 不熟），但他的焦虑在减轻——因为当问题出现时，模型往往能定位并修复自己的 bug。于是他提出一个更激进的想法：&lt;b&gt;代码也许不必主要面向人类可读，而是面向 LLM 可推理、可重写、可调试&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;他甚至分享了一份自用的“AI-first 编码”提示词要点（概念层面）：&lt;br /&gt;&lt;br /&gt;•   追求&lt;b&gt;可预测、可调试、低耦合、入口清晰、控制流线性&lt;/b&gt;&lt;br /&gt;•   少炫技抽象，减少层级与间接性&lt;br /&gt;•   该删就删；重构也要分高/中/低优先级&lt;br /&gt;•   安全需要更谨慎：API key、登录流程、敏感数据存储等不能盲信&lt;br /&gt;&lt;br /&gt;结尾的态度是复杂的：既兴奋于“几小时能做出过去要几周/月的东西”，也沮丧于技能壁垒被压平。但他给出的建议很朴素：&lt;b&gt;别等“都懂了”再开始，继续做东西，只是更快了；同时一定盯紧安全与密钥。&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://burkeholland.github.io/posts/opus-4-5-change-everything/&quot; target=&quot;_blank&quot;&gt;https://burkeholland.github.io/posts/opus-4-5-change-everything/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B&quot;&gt;#AI编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7&quot;&gt;#开发者工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Claude&quot;&gt;#Claude&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B&quot;&gt;#软件工程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%94%9F%E4%BA%A7%E5%8A%9B&quot;&gt;#生产力&lt;/a&gt;&lt;a href=&quot;https://burkeholland.github.io/posts/opus-4-5-change-everything/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Burke Holland&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Opus 4.5 is going to change everything&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/jKAXnnOfMIbh6EezeTBOeaAzrTuDXMEt99CnWqvoTq-qX-N9guCo1QMDSxwW02nVH4qtxNgbd9tTegM4Y5h0BXIckWCEnnYfeG1NtAEwvsFOIG1MfUpvvHf_poDErytHXBMzSpoHqI3e12iQBtWvSVSB4bXu3KjRI6Kv1Jj5Os1YYUV4d4CPD9drqIMiL7Dmb1BIeP3PzVx1Xks6KeuBg7A-AnTWM_5EL74wXSEEIv37pNU8ddt4iTHDfpiTQ-E1Lr9XuyLN3NljhhTDmzAJF6FkU9sw4LGLz7zLjqwaMNPbu028DnlxSVIrnAAmgArDI2KMGq7U9WqVWyfJezSOew.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Opus 4.5 is going to change everything&lt;/div&gt;
  &lt;div&gt;Three months ago I would have dismissed claims that AI could replace developers. Today, after using Claude Opus 4.5, I believe AI coding agents can absolutely replace developers.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Steel：为 AI Agent 打造的开源云端浏览器基础设施Steel 是一个开源的浏览器 API，用来在云端按需启动并控制“浏览器集群”，让 AI Agent、自动化脚本把能力真正带到网页上运行</title><link>https://localhost/posts/87</link><guid isPermaLink="true">https://localhost/posts/87</guid><pubDate>Thu, 01 Jan 2026 07:43:43 GMT</pubDate><content:encoded>&lt;b&gt;Steel：为 AI Agent 打造的开源云端浏览器基础设施&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Steel 是一个开源的浏览器 API，用来在云端按需启动并控制“浏览器集群”，让 AI Agent、自动化脚本把能力真正带到网页上运行。&lt;br /&gt;&lt;br /&gt;它适合做什么？&lt;br /&gt;&lt;br /&gt;•   大规模网页抓取与数据采集（也支持更稳定的反爬配置）&lt;br /&gt;•   自主 Web Agent（下单、订票、填写表单等真实操作流程）&lt;br /&gt;•   模型训练数据采集、AI 购物助手、RPA/销售自动化、QA 测试、客服自动化&lt;br /&gt;&lt;br /&gt;核心能力概览&lt;br /&gt;&lt;br /&gt;•   Sessions API：一行调用启动浏览器会话&lt;br /&gt;•   自动 CAPTCHA 处理：减少流程中断&lt;br /&gt;•   代理与指纹控制：降低被识别为机器人的概率&lt;br /&gt;•   快速启动：平均会话启动时间低于 1 秒（同区域更快）&lt;br /&gt;•   长会话：单个会话最长可跑 24 小时&lt;br /&gt;•   上下文复用：保存/注入 Cookies 与本地存储，续跑更顺畅&lt;br /&gt;•   低改动迁移：Puppeteer/Playwright/Selenium 通过少量改动即可上云&lt;br /&gt;•   可观测性：提供会话查看器，支持实时/录制回放调试&lt;br /&gt;•   安全登录：帮助自动化访问需要登录的站点&lt;br /&gt;&lt;br /&gt;价格与开源&lt;br /&gt;&lt;br /&gt;•   提供免费档起步（按浏览器小时/代理带宽/CAPTCHA 计量），也有从个人到企业的多档套餐&lt;br /&gt;•   项目开源，可本地运行或用 Docker 自托管（官方 GitHub 仓库提供）&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://steel.dev/&quot; target=&quot;_blank&quot;&gt;https://steel.dev/&lt;/a&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E6%B5%8F%E8%A7%88%E5%99%A8%E8%87%AA%E5%8A%A8%E5%8C%96&quot;&gt;#浏览器自动化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E4%BB%A3%E7%90%86&quot;&gt;#AI代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Web%E6%8A%93%E5%8F%96&quot;&gt;#Web抓取&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E5%B7%A5%E5%85%B7&quot;&gt;#开源工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%BA%91%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD&quot;&gt;#云基础设施&lt;/a&gt;&lt;a href=&quot;https://steel.dev/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;steel.dev&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Steel | Open-source Headless Browser API&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/KoC0RXd591dcfASZtG3f92VwrKtMGzHwXeSjiVaiWFRQ1NbY223ubExycnzIK2K_sMSQPyzc-A9QtPvpfS6yGuLVs2VSNz7eGRcGoxzC8aPwY0h-j_GRHX_c-g_oAj32OQ-6UcbFdO32H2gq5zGXczhASgzqM1DmH_AgA6i8Gp3xP1tM5oyUYj5wDvgka_cKbpa48vL2t8eOjaCcnvK7qGys45zAwu3lfqw5kwdZKxJmyZoQnIOt2BrTa7yI3AjntpCVZe56JIX5OLf_kNk0oWv3j0YLq33X7a3oA49pYHzYhMBUHOlwTSyowaQAgBqu3xVlLUz4cDrasSIDqoD02g.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Steel | Open-source Headless Browser API&lt;/div&gt;
  &lt;div&gt;Steel is an open-source browser API purpose-built for AI agents.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>MiniMax M2.1 发布：面向真实复杂任务的多语言编程升级MiniMax 发布新一代文本模型 MiniMax M2.1，目标从“可用、低成本”进一步走向“能解决真实世界的复杂任务”，重点补齐多语言工程协作与办公场景执行力</title><link>https://localhost/posts/78</link><guid isPermaLink="true">https://localhost/posts/78</guid><pubDate>Tue, 23 Dec 2025 13:52:08 GMT</pubDate><content:encoded>&lt;b&gt;MiniMax M2.1 发布：面向真实复杂任务的多语言编程升级&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;MiniMax 发布新一代文本模型 &lt;b&gt;MiniMax M2.1&lt;/b&gt;，目标从“可用、低成本”进一步走向“能解决真实世界的复杂任务”，重点补齐多语言工程协作与办公场景执行力。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;这次重点提升了什么？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;多语言编程能力系统增强&lt;/b&gt;：覆盖 Rust / Java / Go / C++ / Kotlin / Objective‑C / TypeScript / JavaScript 等，更贴近真实项目的多语言栈协作。&lt;br /&gt;•   &lt;b&gt;Web &amp;amp; App 开发更强、更好看&lt;/b&gt;：强化原生 Android / iOS 开发，同时提升设计理解与审美表达，支持复杂交互、3D 场景模拟与高质量可视化。&lt;br /&gt;•   &lt;b&gt;更适合办公场景的“复合指令”执行&lt;/b&gt;：在多约束条件下做端到端任务推进，更强调“按要求完成”而不是只写对代码。&lt;br /&gt;•   &lt;b&gt;更简洁、更高效的输出&lt;/b&gt;：相较 M2，响应更精炼、速度更快、token 消耗更低，适配持续式 AI Coding / Agent 工作流。&lt;br /&gt;•   &lt;b&gt;更强的 Agent / 工具泛化&lt;/b&gt;：官方称在多种编码工具与 Agent 框架中表现稳定，并兼容常见的上下文管理约定。&lt;br /&gt;•   &lt;b&gt;对话与写作质量同步提升&lt;/b&gt;：不仅是“更会写代码”，也更擅长技术文档与日常写作的结构化表达。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;基准与展示&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   在多项软件工程评测上相对 M2 有明显提升，并强调多语言场景竞争力；同时引入 VIBE（含 Web/Simulation/Android/iOS/Backend）评测体系，用更接近真实运行环境的方式验证“能跑、能交付”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;如何使用&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;API&lt;/b&gt;：已上线 MiniMax Open Platform&lt;br /&gt;•   &lt;b&gt;产品&lt;/b&gt;：基于 M2.1 的 MiniMax Agent 已开放&lt;br /&gt;•   &lt;b&gt;开源&lt;/b&gt;：模型权重提供本地部署，推荐 SGLang / vLLM 等推理框架&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://www.minimax.io/news/minimax-m21&quot; target=&quot;_blank&quot;&gt;https://www.minimax.io/news/minimax-m21&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23MiniMax&quot;&gt;#MiniMax&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E5%A4%A7%E6%A8%A1%E5%9E%8B&quot;&gt;#开源大模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B&quot;&gt;#AI编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%9A%E8%AF%AD%E8%A8%80%E5%BC%80%E5%8F%91&quot;&gt;#多语言开发&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Agent%E5%B7%A5%E4%BD%9C%E6%B5%81&quot;&gt;#Agent工作流&lt;/a&gt;&lt;a href=&quot;https://www.minimax.io/news/minimax-m21&quot; target=&quot;_blank&quot;&gt;
  &lt;i&gt;&lt;/i&gt;
  &lt;div&gt;MiniMax&lt;/div&gt;
  
  &lt;div&gt;MiniMax M2.1: Significantly Enhanced Multi-Language Programming, Built for Real-World Complex Tasks&lt;/div&gt;
  
&lt;/a&gt;</content:encoded></item><item><title>Bloom：自动化生成“行为评估”的开源框架前沿模型的对齐研究离不开高质量的行为评估，但传统评估往往开发周期长、容易“过时”（被训练数据污染或被能力提升绕过）</title><link>https://localhost/posts/76</link><guid isPermaLink="true">https://localhost/posts/76</guid><pubDate>Sun, 21 Dec 2025 00:57:48 GMT</pubDate><content:encoded>&lt;b&gt;Bloom：自动化生成“行为评估”的开源框架&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;前沿模型的对齐研究离不开高质量的行为评估，但传统评估往往开发周期长、容易“过时”（被训练数据污染或被能力提升绕过）。Anthropic 发布了 &lt;b&gt;Bloom&lt;/b&gt;：一个开源的“代理式”评估生成框架，用更快、更可扩展的方式衡量模型是否出现特定不对齐行为。&lt;br /&gt;&lt;br /&gt;Bloom 的核心思路是：&lt;b&gt;研究者只需定义要测的行为&lt;/b&gt;（并可提供少量示例与配置），Bloom 就能自动生成大量情境并运行对话，最后给出该行为在不同模型上的&lt;b&gt;出现频率与严重程度&lt;/b&gt;。官方结果显示，Bloom 的评分与人工标注有较强一致性，也能把“正常模型”和被刻意设计成异常行为的“模型个体”区分开。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Bloom 怎么做评估（四阶段流水线）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;理解（Understanding）&lt;/b&gt;：分析研究者的行为描述与示例，明确“要测什么、为什么测”。&lt;br /&gt;•   &lt;b&gt;构思（Ideation）&lt;/b&gt;：自动生成一批用于诱发目标行为的评估场景（含系统提示、用户设定、环境等）。&lt;br /&gt;•   &lt;b&gt;执行（Rollout）&lt;/b&gt;：并行跑场景，对话中还会模拟用户与工具响应，以更真实地触发目标行为。&lt;br /&gt;•   &lt;b&gt;判定（Judgment）&lt;/b&gt;：评审模型为每段对话打分，并输出套件级总结指标（如诱发率、平均行为强度）。&lt;br /&gt;&lt;br /&gt;与固定题库不同，Bloom &lt;b&gt;每次运行可生成不同场景&lt;/b&gt;，但通过“seed 配置”保持可复现；研究者还能调节模型选择、对话长度、是否使用工具、场景多样性，以及增加如“真实感”“诱发难度”等副指标。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;已发布的基准与一个案例&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Anthropic 同时发布了对 16 个模型的基准结果，覆盖四类对齐相关行为：&lt;br /&gt;&lt;br /&gt;•   迎合性妄想（delusional sycophancy）&lt;br /&gt;•   受指令驱动的长程破坏（instructed long-horizon sabotage）&lt;br /&gt;•   自我保存（self-preservation）&lt;br /&gt;•   自我偏好偏差（self-preferential bias）&lt;br /&gt;&lt;br /&gt;在“自我偏好偏差”案例中，Bloom 复现了系统卡里的模型排序，并进一步发现：在某些模型上，提高推理强度会降低偏差（更多体现为识别利益冲突后拒绝自评）。&lt;br /&gt;&lt;br /&gt;开源地址与技术细节见原文与报告：&lt;br /&gt;&lt;a href=&quot;https://www.anthropic.com/research/bloom&quot; target=&quot;_blank&quot;&gt;https://www.anthropic.com/research/bloom&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E5%AE%89%E5%85%A8&quot;&gt;#AI安全&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%AF%B9%E9%BD%90%E7%A0%94%E7%A9%B6&quot;&gt;#对齐研究&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%A8%A1%E5%9E%8B%E8%AF%84%E4%BC%B0&quot;&gt;#模型评估&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E5%B7%A5%E5%85%B7&quot;&gt;#开源工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E6%A8%A1%E5%9E%8B&quot;&gt;#大模型&lt;/a&gt;&lt;a href=&quot;https://www.anthropic.com/research/bloom&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Anthropic&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Introducing Bloom: an open source tool for automated behavioral evaluations&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/aVmNiNMnW6XL7qOZSiwFsBJuo2eV5QC8olS0-Uf2DBAos1xufwe4biuWeznQPo0kbyzJt8ZXvb-e9cJuKtA2KUvsu1og6WtSUAxiIw8SKQg7trIigiVIEm6tXPCZZHJrksgZ2eZIuBeIINCM7iXvAkdIj6swc3yaIiwxIo8EzkJ3NvdP99SIEPJwXm5q3qkqQkqiyiww8x34ry8Bnc62l50Xe08DIzqMj5zja5pO7hw5tyxQy7UXboI94oYRdX_X9E2kkUYgcbpGOK-h7g430Xz0oYt3NkeqJ6081m3JILN_JW7mY3wgdI9iZ5MbNs8-OjAfQbZbQ-lkXcu2S-g37w.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Introducing Bloom: an open source tool for automated behavioral evaluations&lt;/div&gt;
  &lt;div&gt;Anthropic is an AI safety and research company that&apos;s working to build reliable, interpretable, and steerable AI systems.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>用 OpenRouter 接入 Claude Code：更稳、更可控的开发体验在 Claude Code 里把请求走 OpenRouter，本质上是给 Anthropic API 加一层“可靠性与管理”中间层</title><link>https://localhost/posts/75</link><guid isPermaLink="true">https://localhost/posts/75</guid><pubDate>Sat, 20 Dec 2025 13:52:09 GMT</pubDate><content:encoded>&lt;b&gt;用 OpenRouter 接入 Claude Code：更稳、更可控的开发体验&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;在 Claude Code 里把请求走 OpenRouter，本质上是给 Anthropic API 加一层“可靠性与管理”中间层。需要注意：&lt;b&gt;官方只保证与 Anthropic 第一方（1P）提供商完全兼容&lt;/b&gt;；为了最佳兼容性，建议将 &lt;b&gt;Anthropic 1P 设为最高优先级&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么要这样接入？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;自动故障切换（高可用）&lt;/b&gt;：遇到 Anthropic API 宕机或限流时，OpenRouter 可在多个 Anthropic 提供商间自动切换，减少编码被打断的概率。&lt;br /&gt;•   &lt;b&gt;团队预算管理&lt;/b&gt;：集中设置额度、分配成员用量、避免成本失控。&lt;br /&gt;•   &lt;b&gt;用量可视化&lt;/b&gt;：在 OpenRouter 的 Activity Dashboard 里实时查看消耗、项目/成员用量等。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;快速上手（核心步骤）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;1）安装 Claude Code&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   macOS / Linux / WSL：&lt;br /&gt;    •   &lt;code&gt;curl -fsSL https://claude.ai/install.sh | bash&lt;/code&gt;&lt;br /&gt;•   Windows PowerShell：&lt;br /&gt;    •   &lt;code&gt;irm https://claude.ai/install.ps1 | iex&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;2）把 Claude Code 指到 OpenRouter&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;关键点只有三个：&lt;br /&gt;&lt;br /&gt;1.  Base URL 用：&lt;code&gt;https://openrouter.ai/api&lt;/code&gt;&lt;br /&gt;2.  Auth token 用你的 &lt;b&gt;OpenRouter API Key&lt;/b&gt;&lt;br /&gt;3.  &lt;b&gt;必须把 &lt;/b&gt;&lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;&lt;b&gt; 显式设为空字符串&lt;/b&gt;（避免与默认 Anthropic 登录冲突）&lt;br /&gt;&lt;br /&gt;把下面环境变量写进你的 shell 配置（例如 &lt;code&gt;~/.zshrc&lt;/code&gt; / &lt;code&gt;~/.bashrc&lt;/code&gt;）：&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;export OPENROUTER_API_KEY=&quot;&amp;lt;your-openrouter-api-key&amp;gt;&quot;&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;export ANTHROPIC_BASE_URL=&quot;https://openrouter.ai/api&quot;&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;export ANTHROPIC_AUTH_TOKEN=&quot;$OPENROUTER_API_KEY&quot;&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;export ANTHROPIC_API_KEY=&quot;&quot;&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;补充提醒：&lt;br /&gt;&lt;br /&gt;•   不要放在项目级 &lt;code&gt;.env&lt;/code&gt; 里：Claude Code 原生安装器不会读常见 &lt;code&gt;.env&lt;/code&gt;。&lt;br /&gt;•   若之前用 Anthropic 账号登录过 Claude Code，先在会话里执行 &lt;code&gt;/logout&lt;/code&gt; 清掉缓存凭据。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;3）启动并验证&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   进入项目目录运行：&lt;code&gt;claude&lt;/code&gt;&lt;br /&gt;•   在 Claude Code 内用 &lt;code&gt;/status&lt;/code&gt; 查看是否生效，应该能看到：&lt;br /&gt;    •   &lt;code&gt;Auth token: ANTHROPIC_AUTH_TOKEN&lt;/code&gt;&lt;br /&gt;    •   &lt;code&gt;Anthropic base URL: https://openrouter.ai/api&lt;/code&gt;&lt;br /&gt;•   也可去 OpenRouter Activity Dashboard 看请求是否实时出现。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;进阶：Agent SDK 与 GitHub Action&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Anthropic Agent SDK&lt;/b&gt;（Python / TypeScript）：由于它以 Claude Code 为运行时，同样使用上述环境变量即可接入 OpenRouter。&lt;br /&gt;•   &lt;b&gt;Claude Code GitHub Action&lt;/b&gt;：在 action step 里&lt;br /&gt;    •   &lt;code&gt;anthropic_api_key&lt;/code&gt; 传入 &lt;code&gt;secrets.OPENROUTER_API_KEY&lt;/code&gt;&lt;br /&gt;    •   环境变量加 &lt;code&gt;ANTHROPIC_BASE_URL: https://openrouter.ai/api&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;成本跟踪 Statusline（可选）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;可以给 Claude Code 加自定义 statusline，实时显示 provider、模型、累计成本、缓存折扣等信息；脚本来自 openrouter-examples 仓库，并通过 &lt;code&gt;~/.claude/settings.json&lt;/code&gt; 配置 &lt;code&gt;statusLine.command&lt;/code&gt; 启用。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;常见排错&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;认证报错&lt;/b&gt;：确认 &lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt; 是 &lt;code&gt;&quot;&quot;&lt;/code&gt;（空字符串），而不是未设置；否则 Claude Code 可能回退到默认 Anthropic 认证流程。&lt;br /&gt;•   &lt;b&gt;上下文长度错误&lt;/b&gt;：拆分任务或新开会话。&lt;br /&gt;•   &lt;b&gt;隐私&lt;/b&gt;：OpenRouter 默认不记录你的源码 prompts，除非你在账号设置里明确选择开启日志。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://openrouter.ai/docs/guides/guides/claude-code-integration&quot; target=&quot;_blank&quot;&gt;https://openrouter.ai/docs/guides/guides/claude-code-integration&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23ClaudeCode&quot;&gt;#ClaudeCode&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23OpenRouter&quot;&gt;#OpenRouter&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Anthropic&quot;&gt;#Anthropic&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E5%B7%A5%E5%85%B7&quot;&gt;#开发工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%88%90%E6%9C%AC%E7%AE%A1%E7%90%86&quot;&gt;#成本管理&lt;/a&gt;</content:encoded></item><item><title>小米发布 MiMo-V2-Flash：高效推理模型开源小米于 2025 年 12 月 16 日发布并开源了 MiMo-V2-Flash，这是一款高效、超快的基础语言模型，在推理、编码和智能体场景表现尤为出色，同时也可作为日常任务的通用助手</title><link>https://localhost/posts/72</link><guid isPermaLink="true">https://localhost/posts/72</guid><pubDate>Wed, 17 Dec 2025 02:16:20 GMT</pubDate><content:encoded>&lt;b&gt;小米发布 MiMo-V2-Flash：高效推理模型开源&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;小米于 2025 年 12 月 16 日发布并开源了 MiMo-V2-Flash，这是一款高效、超快的基础语言模型，在推理、编码和智能体场景表现尤为出色，同时也可作为日常任务的通用助手。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心亮点&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;u&gt;模型架构&lt;/u&gt;：采用混合专家（MoE）架构，总参数 309B，激活参数仅 15B，结合滑动窗口与全注意力的混合注意力机制，支持 256K 超长上下文。&lt;br /&gt;&lt;br /&gt;&lt;u&gt;性能表现&lt;/u&gt;：&lt;br /&gt;• AIME 2025、GPQA-Diamond 等推理测试中位列开源模型前二&lt;br /&gt;• SWE-bench Verified 达 73.4%，SWE-bench Multilingual 达 71.7%，软件工程能力领先所有开源模型&lt;br /&gt;• 推理速度达 150 tokens/秒，成本仅 $0.1/百万输入 token&lt;br /&gt;&lt;br /&gt;&lt;u&gt;技术创新&lt;/u&gt;：&lt;br /&gt;• 多 Token 预测（MTP）：通过自推测解码实现 2.0-2.6 倍加速&lt;br /&gt;• MOPD 训练范式：多教师在线策略蒸馏，训练效率提升 50 倍以上&lt;br /&gt;&lt;br /&gt;&lt;u&gt;开源资源&lt;/u&gt;：模型权重以 MIT 协议开放于 Hugging Face，推理代码已贡献至 SGLang，技术报告同步发布。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://mimo.xiaomi.com/zh/blog/mimo-v2-flash&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E5%B0%8F%E7%B1%B3&quot;&gt;#小米&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MiMo&quot;&gt;#MiMo&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B&quot;&gt;#大语言模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E6%8E%A8%E7%90%86&quot;&gt;#AI推理&lt;/a&gt;</content:encoded></item><item><title>Android Use：让 AI 代理能控制原生 Android 应用的开源库📱 这是一款专为移动设备设计的 AI 代理工具，解决了一个核心问题：笔记本电脑无法在卡车驾驶室、送货途中等场景使用</title><link>https://localhost/posts/67</link><guid isPermaLink="true">https://localhost/posts/67</guid><pubDate>Fri, 12 Dec 2025 16:03:19 GMT</pubDate><content:encoded>Android Use：让 AI 代理能控制原生 Android 应用的开源库&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;📱&lt;/b&gt;&lt;/i&gt; 这是一款专为移动设备设计的 AI 代理工具，解决了一个核心问题：笔记本电脑无法在卡车驾驶室、送货途中等场景使用。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心亮点：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;• 利用 Android 无障碍 API 获取结构化 UI 数据，无需昂贵的视觉模型&lt;br /&gt;• 相比 Anthropic Computer Use，成本降低 95%（每次操作 $0.01 vs $0.15）&lt;br /&gt;• 延迟低于 1 秒，准确率超 99%&lt;br /&gt;• 核心代码不到 200 行，简洁可扩展&lt;br /&gt;&lt;br /&gt;&lt;b&gt;应用场景：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🚛&lt;/b&gt;&lt;/i&gt; 物流：卡车司机在驾驶室内提交发票&lt;br /&gt;&lt;i&gt;&lt;b&gt;🚗&lt;/b&gt;&lt;/i&gt; 零工经济：Uber/DoorDash 司机多应用切换&lt;br /&gt;&lt;i&gt;&lt;b&gt;📦&lt;/b&gt;&lt;/i&gt; 快递：自动扫描包裹并标记送达&lt;br /&gt;&lt;i&gt;&lt;b&gt;🏦&lt;/b&gt;&lt;/i&gt; 移动银行：自动化对账和交易处理&lt;br /&gt;&lt;br /&gt;&lt;b&gt;工作原理：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;1. 感知 - 通过 ADB 获取无障碍树（XML）&lt;br /&gt;2. 推理 - GPT-4 分析屏幕状态并决策&lt;br /&gt;3. 执行 - 通过 ADB 命令操作设备&lt;br /&gt;&lt;br /&gt;项目发布 24 小时内在 X 上获得 70 万+ 浏览，已有多家物流公司启动试点。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://github.com/actionstatelabs/android-action-kernel&quot; target=&quot;_blank&quot;&gt;GitHub 项目地址&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23Android&quot;&gt;#Android&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E4%BB%A3%E7%90%86&quot;&gt;#AI代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%87%AA%E5%8A%A8%E5%8C%96&quot;&gt;#自动化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%89%A9%E6%B5%81%E7%A7%91%E6%8A%80&quot;&gt;#物流科技&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90&quot;&gt;#开源&lt;/a&gt;&lt;a href=&quot;https://github.com/actionstatelabs/android-action-kernel&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;GitHub&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;GitHub - Action-State-Labs/android-action-kernel&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/J2wi-KmzDKrDPNJfiJpjkESOAdBP8E-z8nCv61zzCEFeOdVnNjTXcHYKYMpLfUDYTk0OGkIfGqXtkR6_ICdolz4GOA9J8Qa1oOCZFPANf1WAGsTLDgvc-BjWdndg9bMer8_NbEoCQK-9v8cbUNh0v_blzJtLZSuBrrzI_Hi-2_JhTJ4x0iTr5UJmu8EK7j46WJnExXpD3ZhscvkMUuJu2xcN5az8ltA1QIsUjUANPW7VaYu6dUhrYjqx0gYnkKgnjlEHmNAdiNntQ6X9dLnLIIW9pxIUlEr5qxwwl-ajdQP0nyP_cAcqaIITkC9U97GFLqcjFYznKzxm1FjWkhGk-w.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;GitHub - Action-State-Labs/android-action-kernel&lt;/div&gt;
  &lt;div&gt;Contribute to Action-State-Labs/android-action-kernel development by creating an account on GitHub.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Linux Foundation 宣布成立 Agentic AI 基金会 (AAIF)Linux Foundation 正式宣布成立 Agentic AI Foundation (AAIF)，由 Anthropic、Block 和 OpenAI 联合发起，旨在为智能体 AI 的发展提供开放、透明、协作的治理平台</title><link>https://localhost/posts/63</link><guid isPermaLink="true">https://localhost/posts/63</guid><pubDate>Tue, 09 Dec 2025 23:56:44 GMT</pubDate><content:encoded>Linux Foundation 宣布成立 Agentic AI 基金会 (AAIF)&lt;br /&gt;&lt;br /&gt;Linux Foundation 正式宣布成立 Agentic AI Foundation (AAIF)，由 Anthropic、Block 和 OpenAI 联合发起，旨在为智能体 AI 的发展提供开放、透明、协作的治理平台。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心项目贡献：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;• MCP (Model Context Protocol) — Anthropic 贡献，已成为连接 AI 模型与工具、数据和应用的通用标准协议，发布一年内已有超过 10,000 个 MCP 服务器，被 Claude、Cursor、ChatGPT、Gemini、VS Code 等主流平台采用&lt;br /&gt;&lt;br /&gt;• goose — Block 贡献，开源本地优先的 AI 智能体框架，结合语言模型、可扩展工具和 MCP 集成&lt;br /&gt;&lt;br /&gt;• &lt;a href=&quot;http://AGENTS.md/&quot; target=&quot;_blank&quot;&gt;AGENTS.md&lt;/a&gt; — OpenAI 贡献，为 AI 编码智能体提供项目级指导的通用标准，已被超过 60,000 个开源项目采用&lt;br /&gt;&lt;br /&gt;&lt;b&gt;重量级成员阵容：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;白金会员包括 AWS、Anthropic、Block、Bloomberg、Cloudflare、Google、Microsoft 和 OpenAI；黄金会员包括 IBM、JetBrains、Oracle、Salesforce、SAP 等；白银会员包括 Hugging Face、Uber、Zapier 等知名公司。&lt;br /&gt;&lt;br /&gt;Linux Foundation 执行董事 Jim Zemlin 表示：&quot;AI 正从对话系统转向可协作的自主智能体，这是 AI 发展的新阶段。将这些项目纳入 AAIF 确保它们在开放治理下持续发展。&quot;&lt;br /&gt;&lt;br /&gt;下一届 MCP Dev Summit 将于 2026 年 4 月 2-3 日在纽约举行。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://aaif.io/press/linux-foundation-announces-the-formation-of-the-agentic-ai-foundation-aaif-anchored-by-new-project-contributions-including-model-context-protocol-mcp-goose-and-agents-md/&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AgenticAI&quot;&gt;#AgenticAI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MCP&quot;&gt;#MCP&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23LinuxFoundation&quot;&gt;#LinuxFoundation&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90&quot;&gt;#开源&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E5%9F%BA%E9%87%91%E4%BC%9A&quot;&gt;#AI基金会&lt;/a&gt;</content:encoded></item><item><title>AI 现状：来自 100 万亿 Token 的实证研究a16z 与 OpenRouter 合作，通过分析超过 100 万亿 Token 的真实世界交互数据，揭示了大型语言模型(LLM)的实际使用情况</title><link>https://localhost/posts/55</link><guid isPermaLink="true">https://localhost/posts/55</guid><pubDate>Fri, 05 Dec 2025 11:51:22 GMT</pubDate><content:encoded>&lt;b&gt;AI 现状：来自 100 万亿 Token 的实证研究&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;a16z 与 OpenRouter 合作，通过分析超过 100 万亿 Token 的真实世界交互数据，揭示了大型语言模型(LLM)的实际使用情况。这项研究为我们提供了关于模型生态、用户行为和未来趋势的深刻洞见。&lt;br /&gt;&lt;br /&gt;以下是几个核心发现：&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt;&lt;b&gt;开源模型的崛起&lt;/b&gt;&lt;br /&gt;开源模型已占据约三分之一的市场份额，其中来自中国的模型增长尤为迅猛。在开源领域，&lt;b&gt;创意角色扮演&lt;/b&gt;和&lt;b&gt;编程辅助&lt;/b&gt;是两大主要应用场景。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;智能体推理成为新常态&lt;/b&gt;&lt;br /&gt;LLM 的使用正从简单的单轮问答转向集成了工具调用、具备多步规划能力的“智能体推理”。更长的上下文输入和对推理模型的偏爱都证明了这一趋势。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;编程与角色扮演：两大支柱&lt;/b&gt;&lt;br /&gt;在所有模型中，“编程”是增长最快的专业应用，而“角色扮演”则是一个体量惊人的消费级应用，其使用量几乎与专业任务相当。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;“灰姑娘的水晶鞋”效应&lt;/b&gt;&lt;br /&gt;研究发现，当一个新模型率先完美解决了某个特定高价值问题时，其早期用户会表现出极高的忠诚度和留存率，形成稳固的“基础用户群”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;价值驱动，而非价格&lt;/b&gt;&lt;br /&gt;LLM 市场尚未商品化，需求对价格相对不敏感。用户愿意为高可靠性的闭源模型支付溢价以完成关键任务，而开源模型则在成本敏感的高容量场景中占据优势。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;AI 使用的全球化&lt;/b&gt;&lt;br /&gt;AI 的使用日益全球化，北美地区支出已低于总额的一半，亚洲市场份额则翻倍增长至近三分之一，显示出强劲的消费和创新能力。&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;报告揭示了一个多元、动态且竞争激烈的 LLM 生态系统。实际的用户行为往往超出传统认知，从智能体的兴起到角色扮演的流行，都预示着 AI 应用的未来充满了更多可能性。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://openrouter.ai/state-of-ai&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E8%B6%8B%E5%8A%BF&quot;&gt;#AI趋势&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B&quot;&gt;#大语言模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90&quot;&gt;#数据分析&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%99%BA%E8%83%BD%E4%BD%93&quot;&gt;#智能体&lt;/a&gt;&lt;a href=&quot;https://openrouter.ai/state-of-ai&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;OpenRouter&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;State of AI 2025: 100T Token LLM Usage Study | OpenRouter&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/mz4k59yLSQM3RZ1RjAe2TogZHkXEj7Lid1NcwV15GVPYk-rq6SuHoS4RklPpa5eLkPgbt1XgQ_zZN6qrjK7mBgb3ATrOHI9EL5AfTWBgdcnSn8rTFd7UhVqus4QQIK0GtXF1J5fTQA8HKBg11J7w-uGbapcac3ilZhOXnmflwSzqZFZ3o2fMiKjNlZkka-UXdsdpqYbC4z_wGlYxfb8WIIupUVbbiffomR9v2bAJSF0OsqyyCW9p9y6p8ugf0agnRFXMX5pABTX_Dp-wGAuHs7K_3TKm0KvaE3dWeWId5knlP51UoryPgErixe2W6ywbhvcbKEpImghMBzPgB9EYZA.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;State of AI 2025: 100T Token LLM Usage Study | OpenRouter&lt;/div&gt;
  &lt;div&gt;Read OpenRouter&apos;s 2025 State of AI report — an empirical 100 trillion token study of real LLM usage, model trends, and developer insights.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item></channel></rss>