<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>开发效率 | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>omp：直接集成 IDE 能力的终端 AI 编码助手oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体</title><link>https://localhost/posts/138</link><guid isPermaLink="true">https://localhost/posts/138</guid><pubDate>Mon, 15 Jun 2026 15:52:13 GMT</pubDate><content:encoded>omp：直接集成 IDE 能力的终端 AI 编码助手&lt;br /&gt;&lt;br /&gt;oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体。它不仅是一个代码生成器，更是一个深度集成 IDE 工具的“全能型选手”，旨在为开发者提供开箱即用、无缝连接的终端开发体验。&lt;br /&gt;&lt;br /&gt;核心亮点：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;深度集成 IDE 工具链&lt;/b&gt;：内置 LSP（Language Server Protocol），AI 能够像在 IDE 中一样精准进行跨文件重命名与格式化；同时支持 DAP（Debug Adapter Protocol），可以直接启动调试器（如 lldb, dlv, debugpy）进行单步调试和堆栈排查。&lt;br /&gt;•   &lt;b&gt;创新的 Snapcompact 图像压缩&lt;/b&gt;：当对话历史过长时，omp 不使用 LLM 进行文本总结，而是将历史记录渲染成极其微小的像素字体 PNG 图像，并发送给多模态模型读取。这一技术能够确保上下文细节不丢失，且仅消耗约 1/3 的 Token 成本。&lt;br /&gt;•   &lt;b&gt;强悍的 Rust 原生引擎&lt;/b&gt;：核心由约 5.5 万行 Rust 代码构建，搜索、shell、AST 分析等高频操作均在进程内完成，避免频繁 fork 子进程，效率极高。&lt;br /&gt;•   &lt;b&gt;本地化记忆与离线整理&lt;/b&gt;：使用本地 SQLite 矢量记忆库，并使用本地的小模型（如 Qwen-1.7B / Gemma-1B）在本地整理记忆与会话标题，数据不离设备。&lt;br /&gt;•   &lt;b&gt;强大的协作与扩展性&lt;/b&gt;：支持通过 &lt;code&gt;/collab&lt;/code&gt; 实现端到端加密的实时会话共享；兼容多种主流编辑器规则（如 Cursor, Cline, Copilot），甚至可以通过 ACP 协议直接在 Zed 编辑器中驱动终端中的同一个 omp 实例。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://omp.sh/&quot; target=&quot;_blank&quot;&gt;https://omp.sh/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A0%81%E5%8A%A9%E6%89%8B&quot;&gt;#AI编码助手&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B%E5%B7%A5%E5%85%B7&quot;&gt;#编程工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Rust&quot;&gt;#Rust&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE&quot;&gt;#开源项目&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%99%BA%E8%83%BD%E5%BC%80%E5%8F%91&quot;&gt;#智能开发&lt;/a&gt;&lt;a href=&quot;https://omp.sh/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;omp&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;omp — a coding agent with the IDE wired in&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/OIp_uPjy8j57e8jFQ1EAHhDS4v_1ipZ5Hr_c3LzsU_WeVFLL0_N2oOCfVHMaFEy7q363DDSN-TkFGJ6K1cJNzemHtQtxCtEses5g2rTtw3vct34VT0BQwiYlR6wxHDS5LSOiWujruVXiBtCa5P-X5RNdpHgWwgAoIqKLkuSYE58adDMmTqIEV-xW3lSaGS3MdMLtnX22Hps3Ztzieaih_UfI05kKrw0ikTtMuWsyiHnNQMXwv5Ec2iRaQl0MtuJyCTFCXlihL8kVRKVJVcH-SrS_fCiwI_PMaV7IZWmpK1KPdoeIZy0_C8J1dUZTbAQpVtpZseIWUh54kj0ZerxGZw.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;omp — a coding agent with the IDE wired in&lt;/div&gt;
  &lt;div&gt;Subagents, plan mode, LSP, DAP, hindsight memory, hashline edits, time-traveling rules — with a native Rust engine doing the heavy lifting.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Slim Tools：为 AI 智能体减负的统一 MCP 工具网关在使用 AI Agent（如 Claude、Cursor 等）时，你是否遇到过因为加载了太多 MCP 或 OpenAPI 工具，导致上下文窗口（Context Window）被严重占用、Token 消耗飞涨的情况？Slim Tools 提供了一个巧妙的解决方案：它将所有上游工具统一封装进一个极简的 MCP 接口中</title><link>https://localhost/posts/131</link><guid isPermaLink="true">https://localhost/posts/131</guid><pubDate>Sat, 23 May 2026 12:18:47 GMT</pubDate><content:encoded>Slim Tools：为 AI 智能体减负的统一 MCP 工具网关&lt;br /&gt;&lt;br /&gt;在使用 AI Agent（如 Claude、Cursor 等）时，你是否遇到过因为加载了太多 MCP 或 OpenAPI 工具，导致上下文窗口（Context Window）被严重占用、Token 消耗飞涨的情况？&lt;br /&gt;&lt;br /&gt;Slim Tools 提供了一个巧妙的解决方案：它将所有上游工具统一封装进一个极简的 MCP 接口中。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心特性：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;统一入口&lt;/b&gt;：无需向 AI 暴露所有工具，只需提供一个 Slim Tools 的 MCP URL（&lt;code&gt;https://slim.tools/mcp&lt;/code&gt;）。&lt;br /&gt;•   &lt;b&gt;按需探索&lt;/b&gt;：AI 代理在运行阶段仅能看到 &lt;code&gt;discover_tools&lt;/code&gt;（工具搜索）和 &lt;code&gt;execute_code&lt;/code&gt;（沙盒代码执行）两个核心能力。&lt;br /&gt;•   &lt;b&gt;高效联动&lt;/b&gt;：AI 通过搜索找到匹配的工具，然后在沙盒中运行代码来组合并调用这些上游 API（如 GitHub、Notion、Slack、Figma 等）。&lt;br /&gt;•   &lt;b&gt;简化授权&lt;/b&gt;：统一管理所有上游服务的 OAuth 授权，无需重复配置。&lt;br /&gt;&lt;br /&gt;通过这种“运行时发现”的设计，AI 代理无需在上下文里“背负”沉重的工具集，不仅让 Prompt 更加清爽，也让 Agent 的响应速度大幅提升。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;http://slim.tools/&quot; target=&quot;_blank&quot;&gt;http://slim.tools&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AIAgents&quot;&gt;#AIAgents&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MCP&quot;&gt;#MCP&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7&quot;&gt;#开发者工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%95%88%E7%8E%87%E5%B7%A5%E5%85%B7&quot;&gt;#效率工具&lt;/a&gt;&lt;a href=&quot;https://slim.tools/?utm_source=mcpservers&amp;amp;utm_medium=floating_ad&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Slim Tools&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Slim Tools | Tool Orchestration Runtime for AI Agents&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/hd9IhSVI3IBs0xFIft5FTErGi-TfxLlG73pQ3KdtmwEOdbdbU8jl0_aCochTIxP84OUyGGlwAvT8SnQaSSGdJnlPrhDTUGC7YUhIczvjYTxrYECr27L3ZTMkvlBRSL9DvU5lruKhxxSwW78FSmNKS3PNrGJk_aGkpT6GNSXpwg9SVVCgnyb-VfherOydr7bWiQMVuxjKVI23bim8kHJr4kmQbacHl5AFRfq5TGmYLjrAgy-LAJOdoSADd55TnvriLycr8eKJ00Sw51dp4uVf1JlIx5owefAZOlwaD-mJRgdOydhUhCEb3mnngpxBDlBa1cvJrFTaWJ4zbmTo80sNrw.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Slim Tools | Tool Orchestration Runtime for AI Agents&lt;/div&gt;
  &lt;div&gt;Move MCP and OpenAPI tool orchestration out of model context and into one sandboxed runtime.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Gemma 4 图解指南：Google DeepMind 开源模型家族全面解析Google DeepMind 发布了 Gemma 4 系列模型，作者 Maarten Grootendorst（刚入职 Google DeepMind）以丰富的可视化方式详细拆解了这一系列模型的架构设计</title><link>https://localhost/posts/123</link><guid isPermaLink="true">https://localhost/posts/123</guid><pubDate>Mon, 06 Apr 2026 10:24:46 GMT</pubDate><content:encoded>&lt;b&gt;Gemma 4 图解指南：Google DeepMind 开源模型家族全面解析&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Google DeepMind 发布了 Gemma 4 系列模型，作者 Maarten Grootendorst（刚入职 Google DeepMind）以丰富的可视化方式详细拆解了这一系列模型的架构设计。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;四款模型，覆盖多种场景&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Gemma 4 E2B&lt;/b&gt; — 密集模型，等效 20 亿参数，适合端侧部署&lt;br /&gt;•   &lt;b&gt;Gemma 4 E4B&lt;/b&gt; — 密集模型，等效 40 亿参数，适合端侧部署&lt;br /&gt;•   &lt;b&gt;Gemma 4 31B&lt;/b&gt; — 310 亿参数的密集模型&lt;br /&gt;•   &lt;b&gt;Gemma 4 26B A4B&lt;/b&gt; — MoE 架构，总参数 260 亿，推理时仅激活 40 亿参数，兼顾性能与效率&lt;br /&gt;&lt;br /&gt;所有模型均为&lt;b&gt;多模态&lt;/b&gt;，支持图像输入；小模型（E2B/E4B）还额外支持&lt;b&gt;音频输入&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心架构亮点&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;注意力机制优化：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   局部注意力（滑动窗口）与全局注意力交替堆叠（5:1 或 4:1），最后一层始终为全局注意力&lt;br /&gt;•   全局注意力层采用 8 个 Query 共享 1 个 KV 头的分组查询注意力（GQA）&lt;br /&gt;•   &lt;b&gt;K=V 技巧&lt;/b&gt;：全局注意力层中 Key 等于 Value，进一步压缩 KV 缓存&lt;br /&gt;•   &lt;b&gt;p-RoPE&lt;/b&gt;：仅对前 25% 维度施加旋转位置编码，避免低频维度引入噪声，提升长上下文处理能力&lt;br /&gt;&lt;br /&gt;&lt;b&gt;视觉编码器：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   基于 Vision Transformer（ViT），支持可变宽高比和可变分辨率&lt;br /&gt;•   通过 2D RoPE 编码 patch 的二维位置信息&lt;br /&gt;•   引入 soft token budget（70/140/280/560/1120），用户可按任务需求灵活选择分辨率&lt;br /&gt;&lt;br /&gt;&lt;b&gt;MoE 架构（26B A4B）：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   128 个专家中每次激活 8 个 + 1 个始终激活的共享专家（3 倍大小）&lt;br /&gt;•   虽然总参数 260 亿，推理速度接近 40 亿参数模型&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Per-Layer Embeddings（E2B/E4B）：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   每一层都有独立的 token embedding 查找表，存储在闪存而非显存中&lt;br /&gt;•   让小模型在有限 RAM 下也能获得更强的表达能力，非常适合手机等端侧设备&lt;br /&gt;&lt;br /&gt;&lt;b&gt;音频编码器（E2B/E4B）：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   基于 Conformer 架构，通过梅尔频谱图提取特征并下采样为 soft token&lt;br /&gt;•   支持语音识别和翻译等任务&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4&quot; target=&quot;_blank&quot;&gt;https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23Gemma4&quot;&gt;#Gemma4&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23GoogleDeepMind&quot;&gt;#GoogleDeepMind&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%9A%E6%A8%A1%E6%80%81&quot;&gt;#多模态&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MoE&quot;&gt;#MoE&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt;&lt;a href=&quot;https://newsletter.maartengrootendorst.com/p/a-visual-guide-to-gemma-4&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Maartengrootendorst&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;A Visual Guide to Gemma 4&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/FACIuiyNybxMxr_qN1wgPGgB5ZlMM93UDrcmr5R6kRgM8J8Mb5wORe8AL7FPpts134BQcsTnCuT5j8MTMNIXkLgEDWoYSs_QWCwTeYucc8qkdJcy9C4kY3G43Eiu1g7L671-17Cs9cF19kxjIlEhNk6voKK1jkBe4pbCjWfuWRCZt9BZm_nE9KFmyxJPPdDkBa1fqhorcZDiJvm8Xg7szSOiQWwsNq63-ykXurikoKKnZivIIfBeZgEwHgHsFsfLvG3gv1Jlan2gGyWN8pXULFKrkz9tO6NRXXLLnzYW4FuNy9LBLWQKz2cRAzfNoZD5sxgR7J8pFY3j-Z8_1AuQ_Q.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;A Visual Guide to Gemma 4&lt;/div&gt;
  &lt;div&gt;A great start to a new job ;)&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>CursorBench：Cursor 如何更贴近真实开发来评估模型质量开发者正在把更长、更复杂的编程任务交给智能体：跨多个文件、工具和步骤</title><link>https://localhost/posts/120</link><guid isPermaLink="true">https://localhost/posts/120</guid><pubDate>Fri, 13 Mar 2026 06:03:11 GMT</pubDate><content:encoded>&lt;b&gt;CursorBench：Cursor 如何更贴近真实开发来评估模型质量&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;开发者正在把更长、更复杂的编程任务交给智能体：跨多个文件、工具和步骤。Cursor 认为，评测方式也必须随之升级，才能真实反映“好用与否”。&lt;br /&gt;&lt;br /&gt;Cursor 的做法是 &lt;b&gt;线上 + 线下&lt;/b&gt; 的混合评测闭环：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;线下：CursorBench（内部基准）&lt;/b&gt;&lt;br /&gt;    基于工程团队的真实 Cursor 会话构建，而不是从公开代码库抽题。因为更贴近实际工作流、信息更不充分且常带歧义，CursorBench 往往能更好地区分前沿模型，并衡量多维能力（正确性、代码质量、效率、交互行为等）。&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;线上：真实流量的受控实验&lt;/b&gt;&lt;br /&gt;    用于捕捉线下评测遗漏的退化：例如线下评分器判“正确”，但开发者实际体验变差。Cursor 会用多类代理指标（交互信号 + 输出质量信号）综合观察，并通过消融实验归因（如移除语义搜索工具来定位其关键场景）。&lt;br /&gt;&lt;br /&gt;为什么不太依赖公开基准？Cursor 指出三类常见问题：&lt;br /&gt;&lt;br /&gt;1.  &lt;b&gt;任务不匹配&lt;/b&gt;：许多基准仍偏向“修 bug”或“解谜题”，与真实开发请求脱节。&lt;br /&gt;2.  &lt;b&gt;评分困难&lt;/b&gt;：真实请求常有多种正确解，固定答案容易误伤合理方案。&lt;br /&gt;3.  &lt;b&gt;数据污染&lt;/b&gt;：公开仓库题目容易进入训练数据，分数被抬高；甚至出现“记忆补丁”与测试缺陷等问题。&lt;br /&gt;&lt;br /&gt;下一步，Cursor 预计开发会更多转向“长时运行智能体”。他们也计划让 CursorBench 适配更长任务，并解决成本、可复现性、以及离线结果与真实体验之间的差距。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://cursor.com/cn/blog/cursorbench&quot; target=&quot;_blank&quot;&gt;https://cursor.com/cn/blog/cursorbench&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E6%A8%A1%E5%9E%8B%E8%AF%84%E6%B5%8B&quot;&gt;#模型评测&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B%E6%99%BA%E8%83%BD%E4%BD%93&quot;&gt;#编程智能体&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%9F%BA%E5%87%86%E6%B5%8B%E8%AF%95&quot;&gt;#基准测试&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Cursor&quot;&gt;#Cursor&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E4%BD%93%E9%AA%8C&quot;&gt;#开发者体验&lt;/a&gt;&lt;a href=&quot;https://cursor.com/cn/blog/cursorbench&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Cursor&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;How we compare model quality in Cursor · Cursor&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/QRvICVn9snfzukg82oFNZXywk4nurNWHeEwJrrPLmFAO7IZZHlo7sEP_qI_acKG1_RPMpo7Lfm88ritWi6KP78DNBgac4qbTzAiVDEtUTR_7NEL6WmTe2O8lmNRtdhifXCW31XhvLvk8X8jHBOycBh1ztir-qVYthNrpbL1DYK4UMtpJhYHAfb4N_hH7EO3NmZQ2n_YNq9KDTRVyocV4ORVIPzFwoynkGakSxLab1gFHzk860MJ_JmRhC47fVUVijcu3bswc_P62gdWXIUfGd-WCCiZiQVLxKMZxq061REs2e5Ts1omkAiPEOMcwXWhhUsUjBB2BBMWBWn7ugDTCzA.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;How we compare model quality in Cursor · Cursor&lt;/div&gt;
  &lt;div&gt;We use a hybrid online-offline eval process to keep our understanding of model quality aligned with what developers actually do.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Entire：把 AI 编程对话“写进”每一次 Git 提交用 AI 写代码时，最容易丢的不是代码，而是“为什么这么写”的上下文</title><link>https://localhost/posts/117</link><guid isPermaLink="true">https://localhost/posts/117</guid><pubDate>Wed, 11 Feb 2026 03:03:14 GMT</pubDate><content:encoded>&lt;b&gt;Entire：把 AI 编程对话“写进”每一次 Git 提交&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;用 AI 写代码时，最容易丢的不是代码，而是“为什么这么写”的上下文。Entire 提供一个思路：在你正常的 git 工作流里，把每次 AI agent 会话自动记录下来，并与对应的 commit 绑定，形成可搜索的历史记录。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;它能做什么？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;自动捕获会话&lt;/b&gt;：在每次 push 时记录 AI agent 的会话内容，并和提交一起关联。&lt;br /&gt;•   &lt;b&gt;不改变你的工作方式&lt;/b&gt;：通过 CLI 接入现有工具链，尽量减少上下文切换。&lt;br /&gt;•   &lt;b&gt;支持多种 agent&lt;/b&gt;：目前支持 &lt;b&gt;Claude Code&lt;/b&gt;、&lt;b&gt;Google Gemini&lt;/b&gt;；OpenAI Codex 等集成在路上。&lt;br /&gt;•   &lt;b&gt;把“意图”留在仓库里&lt;/b&gt;：官方强调记录会直接存进 git 历史，不依赖额外托管服务或外部数据库。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;安装方式（官网给出的命令）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;curl -fsSL https://entire.io/install.sh | bash&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;适合希望团队更容易复盘决策、追踪 AI 产出过程、减少重复踩坑的工程项目。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;http://entire.io/&quot; target=&quot;_blank&quot;&gt;http://entire.io/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23Git&quot;&gt;#Git&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B&quot;&gt;#AI编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E5%B7%A5%E5%85%B7&quot;&gt;#开发工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%B7%A5%E7%A8%8B%E6%95%88%E7%8E%87&quot;&gt;#工程效率&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23CLI&quot;&gt;#CLI&lt;/a&gt;&lt;a href=&quot;https://entire.io/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Entire&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Entire · A new developer platform is coming&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/rA16oAtkRMvejjADxTIxArcpec9872Ftk73hnx0tqZkRiGAiYY_UfECPHCNViL6tAi12e1RZpkVFGJ6dStFvxxtHDR7a1kFmodTZK2ZCLeJREigDRLXtW6CAWeBThvErogXjybyqSCXyu3TyOEouSDjzJX-FfGsawLPLuZDBr9Hgax8IgJSUbGzCYL8uQcvKreuv-A_qB7CPK8BaTkJ64LuwTEJf78r_GKP6kqECnCFD3qeJ9XFODk3RoJfFa16DumTEVTHvY_s2FnYauShcOdd-BhpOTVYggWjDCMacvjDAaOk1FtprE_4ZtQJFsrn59bsdIAupFwcyHr91j606Tg.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Entire · A new developer platform is coming&lt;/div&gt;
  &lt;div&gt;We are going beyond repositories, building a developer platform where agents and humans can collaborate, interact, and grow. The birth of a new galaxy in this universe draws near.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Stripe「Minions」：一键生成、端到端交付的无人值守编码代理Stripe 在内部打造了一套名为 Minions 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入</title><link>https://localhost/posts/116</link><guid isPermaLink="true">https://localhost/posts/116</guid><pubDate>Tue, 10 Feb 2026 14:31:52 GMT</pubDate><content:encoded>&lt;b&gt;Stripe「Minions」：一键生成、端到端交付的无人值守编码代理&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Stripe 在内部打造了一套名为 &lt;b&gt;Minions&lt;/b&gt; 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入。现在，Stripe &lt;b&gt;每周有超过 1000 个合并的 PR&lt;/b&gt; 是由 Minions 从头到尾生成的（人类负责 Review，但不写代码）。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么要自研？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;在 Stripe 这种超大规模、强约束的工程环境里，“从零写个原型”和“在成熟巨型代码库里安全改动”完全不是一回事：&lt;br /&gt;&lt;br /&gt;•   代码库规模巨大（数亿行），栈也相对小众：大量后端是 &lt;b&gt;Ruby + Sorbet&lt;/b&gt;，还有大量 &lt;b&gt;Stripe 自研库&lt;/b&gt;，LLM 天然不熟&lt;br /&gt;•   业务风险极高：Stripe 的代码承载着 &lt;b&gt;每年超过 1 万亿美元&lt;/b&gt; 的支付规模，并受金融合规与监管约束&lt;br /&gt;•   既要让代理“会写”，也要让它“按规矩写、能跑通、能过 CI”，并与既有研发流程深度结合&lt;br /&gt;&lt;br /&gt;&lt;b&gt;工程师怎么用？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;最常见的入口是 &lt;b&gt;Slack&lt;/b&gt;：&lt;br /&gt;&lt;br /&gt;•   在讨论线程里 &lt;a href=&quot;https://t.me/Slack&quot; target=&quot;_blank&quot;&gt;@Slack&lt;/a&gt; App 就能发起 Minion，它会读取整个线程与相关链接作为上下文&lt;br /&gt;•   也集成到内部系统里：文档平台、Feature Flag、工单系统等&lt;br /&gt;    例如 CI 发现 flaky tests，会生成工单，直接提供按钮让 Minion 去修&lt;br /&gt;&lt;br /&gt;完成后，Minion 会：&lt;br /&gt;&lt;br /&gt;•   创建分支 → 推送 → 跑 CI → 按模板生成 PR&lt;br /&gt;&lt;br /&gt;如果效果不理想，人类可以补充指令让它再改；即使不完美，也常常是很好的“可用起点”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Minions 背后怎么运作（要点版）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Stripe 的思路是：&lt;b&gt;把“创意生成”交给 LLM，把“必须可靠执行的步骤”交给确定性工具链&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;•   运行环境：在隔离的 &lt;b&gt;devbox&lt;/b&gt; 中执行（10 秒内可启动，预热并预载代码与服务），与生产与公网隔离，便于并行&lt;br /&gt;•   Agent 框架：基于 Block 的开源编码代理 &lt;b&gt;goose&lt;/b&gt; 的 fork，并做了强定制&lt;br /&gt;•   规则与上下文：读取各类 agent rule 文件，但多为“按目录条件生效”，避免全局死规则拖累&lt;br /&gt;•   工具调用：接入 &lt;b&gt;MCP&lt;/b&gt;（函数调用通用协议），并建设内部 MCP 服务 &lt;b&gt;Toolshed&lt;/b&gt;，提供 &lt;b&gt;400+&lt;/b&gt; 工具（文档、工单、构建状态、Sourcegraph 搜索等）&lt;br /&gt;•   反馈与质量闸门：&lt;br /&gt;    •   首先跑本地启发式 lint/检查（通常 &amp;lt;5 秒）&lt;br /&gt;    •   再跑选择性的 CI（Stripe 有 300 万+ 测试），部分失败可自动修复&lt;br /&gt;    •   为控制成本与等待时间：&lt;b&gt;最多两轮 CI&lt;/b&gt;，强调“能本地提前发现就不要拖到 CI”&lt;br /&gt;&lt;br /&gt;&lt;b&gt;接下来&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;这篇是系列 Part 1，主要讲“怎么用、能做什么”；Part 2 会深入实现细节。整体信号很明确：当“开发者注意力”成为稀缺资源时，无人值守、可并行的编码代理正在改变工程协作方式。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&quot; target=&quot;_blank&quot;&gt;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E7%A8%8B%E5%8C%96&quot;&gt;#AI工程化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A0%81%E4%BB%A3%E7%90%86&quot;&gt;#编码代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E6%95%88%E7%8E%87&quot;&gt;#开发者效率&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23CI%E5%AE%9E%E8%B7%B5&quot;&gt;#CI实践&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Stripe&quot;&gt;#Stripe&lt;/a&gt;&lt;a href=&quot;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;stripe.dev&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Minions: Stripe’s one-shot, end-to-end coding agents&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/H18ir4W7Yx5_y3FWZkpWcsbvq3tjwyhUR2cnF0H8zvQEMEA5hDDuzmWhlJMBqLt1a6rwdrjM7EZks3PRwzG5fKWcZuteGl6cCISlgkoPdBPluHLb1_LdSjq6sK5TIAJHPGzIQTidPEeuFE6bVyc0l3mw_bMwoWgKu09iX7PfPbW9ljEhh8D-CGo_juWvKyLQmO48TL5Q5XsCiS413KHYyOlbRUUGBa98Kl6-avUPqjDOLvvaeC9oSmqqtLOfYFQjLGy4bVo0e9spukFV3F-ffYVjVQ_tOJbmFuVBiJVZJEKaHDk9lOZov2-h9GuQJYKBehz65LkdCb4g-TepDOBhIQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Minions: Stripe’s one-shot, end-to-end coding agents&lt;/div&gt;
  &lt;div&gt;Minions are Stripe’s homegrown coding agents, responsible for more than a thousand pull requests merged each week. Though humans review the code, minions write it from start to finish. Learn how they work, and how we built them.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>dotagents：用一个 .agents 目录统一管理各类 AI 工具配置dotagents 是一个 CLI/TUI 工具，把项目或全局的 .agents 目录作为“唯一真相源”，自动为不同 AI 工具创建软链接，并支持安装技能（skills）和插件（plugins），方便在多环境之间保持一致配置、可重复执行、易维护</title><link>https://localhost/posts/88</link><guid isPermaLink="true">https://localhost/posts/88</guid><pubDate>Sun, 11 Jan 2026 06:08:48 GMT</pubDate><content:encoded>&lt;b&gt;dotagents：用一个 &lt;/b&gt;&lt;code&gt;.agents&lt;/code&gt;&lt;b&gt; 目录统一管理各类 AI 工具配置&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;code&gt;dotagents&lt;/code&gt; 是一个 CLI/TUI 工具，把项目或全局的 &lt;code&gt;.agents&lt;/code&gt; 目录作为“唯一真相源”，自动为不同 AI 工具创建软链接，并支持安装技能（skills）和插件（plugins），方便在多环境之间保持一致配置、可重复执行、易维护。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;你能用它做什么&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   以 &lt;code&gt;.agents&lt;/code&gt; 为中心统一管理：hooks、commands、skills，以及 &lt;code&gt;AGENTS/CLAUDE.md&lt;/code&gt; 等说明文件&lt;br /&gt;•   一键创建软链接，适配多工具（Claude / Codex / Factory）&lt;br /&gt;•   从本地路径、Git URL、HTTPS URL 安装 skills；并支持从 marketplace 安装 plugins&lt;br /&gt;•   可随时重复运行，用于补装、修复链接或更新能力集&lt;br /&gt;&lt;br /&gt;&lt;b&gt;快速开始（要求：Bun 1.3+）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;npx @iannuttall/dotagents&lt;/code&gt;&lt;br /&gt;•   或 &lt;code&gt;bunx @iannuttall/dotagents&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;链接关系示例&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;.agents/AGENTS.md&lt;/code&gt; → &lt;code&gt;~/.claude/CLAUDE.md&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;.agents/commands&lt;/code&gt; → &lt;code&gt;~/.claude/commands&lt;/code&gt; / &lt;code&gt;~/.factory/commands&lt;/code&gt; / &lt;code&gt;~/.codex/prompts&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;.agents/hooks&lt;/code&gt;、&lt;code&gt;.agents/skills&lt;/code&gt; 同步到对应工具目录&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://github.com/iannuttall/dotagents&quot; target=&quot;_blank&quot;&gt;https://github.com/iannuttall/dotagents&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E5%85%B7&quot;&gt;#AI工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E6%95%88%E7%8E%87&quot;&gt;#开发效率&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23CLI&quot;&gt;#CLI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Claude&quot;&gt;#Claude&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Codex&quot;&gt;#Codex&lt;/a&gt;&lt;a href=&quot;https://github.com/iannuttall/dotagents&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;GitHub&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;GitHub - iannuttall/dotagents: One location for all of your hooks, commands, skills, and AGENT/CLAUDE.md files.&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/jXAp1TeHUi_qluSH4bh24VzqtpPw24VeDAZPemaNdrGHCUTXMQD1VHTV1uehTZ4xxgydniCkVUBG6NO-ZgOABJ44IaJwB19RCJrdhjZ83Qzu5XcFGqNhYGl1bwFBrtgp6qzNzWTC9t-keyG-rz4cVW4mqIZtdVYBYp2-02eGkeSR9wD_5zkZbpb8mwIjTB5XcQ-jbi-6Gl1lTM1spmuL5bi3qUEV4BqQGX0_8ICWVhhmur8hbBkQ2zyj2PvDfLcNhodI07_BTyB1SshaO1s6teF-29Kwx-fxQAJjMvLUqJmevyL6l2pqgeoToNZ2jBGC3fshZDkcD5Jn8VLzTfAetQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;GitHub - iannuttall/dotagents: One location for all of your hooks, commands, skills, and AGENT/CLAUDE.md files.&lt;/div&gt;
  &lt;div&gt;One location for all of your hooks, commands, skills, and AGENT/CLAUDE.md files. - iannuttall/dotagents&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>2025 年 AI 编程现状：效率在涨，工具与模型在分化Greptile 发布的《The State of AI Coding 2025》梳理了 AI 编程在 2025 年的关键趋势：工程产出显著提升，开发工具生态快速扩张，而不同大模型在“响应速度、吞吐、成本”上的取舍越来越清晰</title><link>https://localhost/posts/84</link><guid isPermaLink="true">https://localhost/posts/84</guid><pubDate>Fri, 26 Dec 2025 13:19:39 GMT</pubDate><content:encoded>&lt;b&gt;2025 年 AI 编程现状：效率在涨，工具与模型在分化&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Greptile 发布的《The State of AI Coding 2025》梳理了 AI 编程在 2025 年的关键趋势：工程产出显著提升，开发工具生态快速扩张，而不同大模型在“响应速度、吞吐、成本”上的取舍越来越清晰。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;1) 工程效率：PR 更大，个人产出更高&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;PR 规模变大&lt;/b&gt;：2025 年 3 月到 11 月，PR 的中位改动行数从 57 增至 76，约 &lt;b&gt;+33%&lt;/b&gt;。&lt;br /&gt;•   &lt;b&gt;开发者产出上升&lt;/b&gt;：人均代码产出从 4,450 增至 7,839 行，约 &lt;b&gt;+76%&lt;/b&gt;，AI 工具被视为“产能放大器”。&lt;br /&gt;•   &lt;b&gt;中型团队提升更明显&lt;/b&gt;：6–15 人团队的人均产出从 7,005 增至 13,227 行，约 &lt;b&gt;+89%&lt;/b&gt;。&lt;br /&gt;•   &lt;b&gt;单文件改动更密&lt;/b&gt;：每个文件的改动行数中位数从 18 增至 22，约 &lt;b&gt;+20%&lt;/b&gt;，说明 PR 不只变大，也更“集中”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;2) 工具采用：从“能用”到“形成标准层”&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;记忆/Memory 基建&lt;/b&gt;：&lt;code&gt;mem0&lt;/code&gt; 以 &lt;b&gt;59%&lt;/b&gt; 份额领跑（按 PyPI + npm 月下载量口径）。&lt;br /&gt;•   &lt;b&gt;向量数据库&lt;/b&gt;：没有绝对赢家；Weaviate 约 &lt;b&gt;25%&lt;/b&gt;，其余多家在 10–25% 之间拉锯。&lt;br /&gt;•   &lt;b&gt;AI 规则文件&lt;/b&gt;：&lt;code&gt;CLAUDE.md&lt;/code&gt; 使用率 &lt;b&gt;67%&lt;/b&gt;；不少团队多格式并存，且 &lt;b&gt;17% 的仓库三种格式都用&lt;/b&gt;。&lt;br /&gt;•   &lt;b&gt;AI SDK 增长&lt;/b&gt;：Anthropic SDK 以 &lt;b&gt;43M&lt;/b&gt; 下载领先（约 8 倍增长）；Pydantic AI 增长 &lt;b&gt;3.7×&lt;/b&gt; 到 &lt;b&gt;6M&lt;/b&gt;。&lt;br /&gt;•   &lt;b&gt;LLMOps&lt;/b&gt;：LiteLLM 月下载量增长 &lt;b&gt;4×&lt;/b&gt; 至 &lt;b&gt;41M&lt;/b&gt;（LangSmith 与 LangChain 安装存在绑定关系）。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;3) 模型格局：生态差距在收敛&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;SDK 下载量&lt;/b&gt;：OpenAI 约 &lt;b&gt;130M&lt;/b&gt; 领先；Anthropic 自 2023 年 4 月起增长 &lt;b&gt;1,547×&lt;/b&gt;；Google 约 &lt;b&gt;13.6M&lt;/b&gt;。&lt;br /&gt;•   &lt;b&gt;差距缩小&lt;/b&gt;：OpenAI 与 Anthropic 的下载量比从 2024 年 1 月的 &lt;b&gt;47:1&lt;/b&gt;，降至 2025 年 11 月的 &lt;b&gt;4.2:1&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;4) 作为“编程 Agent 后端”，模型各有侧重&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;报告用统一参数对多模型做了延迟、吞吐、成本等基准：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;首 token 响应（TTFT）&lt;/b&gt;：Claude Sonnet/Opus（p50 &amp;lt; 2.5s）明显更快，更利于交互式编程保持“心流”。&lt;br /&gt;•   &lt;b&gt;生成吞吐&lt;/b&gt;：GPT-5 Codex / GPT-5.1 吞吐更高，长输出更快结束，利于并行跑更多 Agent/CI。&lt;br /&gt;•   &lt;b&gt;成本倍率（以 GPT-5 Codex = 1× 归一）&lt;/b&gt;：GPT-5 Codex ≈ GPT-5.1（1×）；Gemini 3 Pro（1.4×）；Sonnet 4.5（2×）；Opus 4.5（3.3×）。&lt;br /&gt;&lt;br /&gt;结论很直接：选型不再是“谁最强”，而是你更在意 &lt;b&gt;响应速度、吞吐效率，还是预算&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;5) 研究方向：规模、上下文与 Agent 的“系统工程”&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;报告还汇总了 2025 年影响工具与应用的一批研究线索，包括：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;MoE 的效率设计&lt;/b&gt;（如 DeepSeek-V3：关注 KV cache、路由与训练信号密度）。&lt;br /&gt;•   &lt;b&gt;长上下文 vs RAG 的边界&lt;/b&gt;（不同数据结构下各有优势；以及 KV 级检索等新思路）。&lt;br /&gt;•   &lt;b&gt;Agent 训练与检索策略&lt;/b&gt;（用 RL 学会“何时搜索”、如何管理长程记忆、如何降低噪声上下文干扰等）。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://www.greptile.com/state-of-ai-coding-2025&quot; target=&quot;_blank&quot;&gt;https://www.greptile.com/state-of-ai-coding-2025&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B&quot;&gt;#AI编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E6%95%88%E7%8E%87&quot;&gt;#开发效率&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23LLM%E5%B7%A5%E5%85%B7%E9%93%BE&quot;&gt;#LLM工具链&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%A8%A1%E5%9E%8B%E8%AF%84%E6%B5%8B&quot;&gt;#模型评测&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B%E8%B6%8B%E5%8A%BF&quot;&gt;#软件工程趋势&lt;/a&gt;&lt;a href=&quot;https://www.greptile.com/state-of-ai-coding-2025&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Greptile&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;AI Code Review | Greptile | Merge 4X Faster, Catch 3X More Bugs&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/hfShrCsZA-0OoEmYsJmgxvHCwj7q7NGihNVTRjjhsIUcVlVFa6z1oktsaeEoWwRd6R-4Q7gRuV4dlLtKxaAdP3U4uL3wB91bMA7xRU1t3a70gtLAK3WXIY10-UiivuYM0aWr0yVBR7tfgkAK-jWHDTmonIw9BCrdGNRoT7SNc-gpTxs1vCEWs9mDMRZpyUEzhIe9qyNSZldinJPkOQpOHB9I7XCz-l0ZaEIRTer6OCcqFQnjnbhV1DNhdZv5TaDmuVWgmGAB1REpUX4tm6TUq2JT0wfnC-0UFCGPsvxDCM5orYESnTVio5sCLQnhNIO9zekb2DSwTzbs1_GlwRKMhw.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;AI Code Review | Greptile | Merge 4X Faster, Catch 3X More Bugs&lt;/div&gt;
  &lt;div&gt;AI Code Reviews that understand your entire codebase. Automate PR reviews, catch bugs faster, improve code quality with AI-driven analysis. Try Greptile free!&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>用 OpenRouter 接入 Claude Code：更稳、更可控的开发体验在 Claude Code 里把请求走 OpenRouter，本质上是给 Anthropic API 加一层“可靠性与管理”中间层</title><link>https://localhost/posts/75</link><guid isPermaLink="true">https://localhost/posts/75</guid><pubDate>Sat, 20 Dec 2025 13:52:09 GMT</pubDate><content:encoded>&lt;b&gt;用 OpenRouter 接入 Claude Code：更稳、更可控的开发体验&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;在 Claude Code 里把请求走 OpenRouter，本质上是给 Anthropic API 加一层“可靠性与管理”中间层。需要注意：&lt;b&gt;官方只保证与 Anthropic 第一方（1P）提供商完全兼容&lt;/b&gt;；为了最佳兼容性，建议将 &lt;b&gt;Anthropic 1P 设为最高优先级&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么要这样接入？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;自动故障切换（高可用）&lt;/b&gt;：遇到 Anthropic API 宕机或限流时，OpenRouter 可在多个 Anthropic 提供商间自动切换，减少编码被打断的概率。&lt;br /&gt;•   &lt;b&gt;团队预算管理&lt;/b&gt;：集中设置额度、分配成员用量、避免成本失控。&lt;br /&gt;•   &lt;b&gt;用量可视化&lt;/b&gt;：在 OpenRouter 的 Activity Dashboard 里实时查看消耗、项目/成员用量等。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;快速上手（核心步骤）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;1）安装 Claude Code&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   macOS / Linux / WSL：&lt;br /&gt;    •   &lt;code&gt;curl -fsSL https://claude.ai/install.sh | bash&lt;/code&gt;&lt;br /&gt;•   Windows PowerShell：&lt;br /&gt;    •   &lt;code&gt;irm https://claude.ai/install.ps1 | iex&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;2）把 Claude Code 指到 OpenRouter&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;关键点只有三个：&lt;br /&gt;&lt;br /&gt;1.  Base URL 用：&lt;code&gt;https://openrouter.ai/api&lt;/code&gt;&lt;br /&gt;2.  Auth token 用你的 &lt;b&gt;OpenRouter API Key&lt;/b&gt;&lt;br /&gt;3.  &lt;b&gt;必须把 &lt;/b&gt;&lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt;&lt;b&gt; 显式设为空字符串&lt;/b&gt;（避免与默认 Anthropic 登录冲突）&lt;br /&gt;&lt;br /&gt;把下面环境变量写进你的 shell 配置（例如 &lt;code&gt;~/.zshrc&lt;/code&gt; / &lt;code&gt;~/.bashrc&lt;/code&gt;）：&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;export OPENROUTER_API_KEY=&quot;&amp;lt;your-openrouter-api-key&amp;gt;&quot;&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;export ANTHROPIC_BASE_URL=&quot;https://openrouter.ai/api&quot;&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;export ANTHROPIC_AUTH_TOKEN=&quot;$OPENROUTER_API_KEY&quot;&lt;/code&gt;&lt;br /&gt;•   &lt;code&gt;export ANTHROPIC_API_KEY=&quot;&quot;&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;补充提醒：&lt;br /&gt;&lt;br /&gt;•   不要放在项目级 &lt;code&gt;.env&lt;/code&gt; 里：Claude Code 原生安装器不会读常见 &lt;code&gt;.env&lt;/code&gt;。&lt;br /&gt;•   若之前用 Anthropic 账号登录过 Claude Code，先在会话里执行 &lt;code&gt;/logout&lt;/code&gt; 清掉缓存凭据。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;3）启动并验证&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   进入项目目录运行：&lt;code&gt;claude&lt;/code&gt;&lt;br /&gt;•   在 Claude Code 内用 &lt;code&gt;/status&lt;/code&gt; 查看是否生效，应该能看到：&lt;br /&gt;    •   &lt;code&gt;Auth token: ANTHROPIC_AUTH_TOKEN&lt;/code&gt;&lt;br /&gt;    •   &lt;code&gt;Anthropic base URL: https://openrouter.ai/api&lt;/code&gt;&lt;br /&gt;•   也可去 OpenRouter Activity Dashboard 看请求是否实时出现。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;进阶：Agent SDK 与 GitHub Action&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Anthropic Agent SDK&lt;/b&gt;（Python / TypeScript）：由于它以 Claude Code 为运行时，同样使用上述环境变量即可接入 OpenRouter。&lt;br /&gt;•   &lt;b&gt;Claude Code GitHub Action&lt;/b&gt;：在 action step 里&lt;br /&gt;    •   &lt;code&gt;anthropic_api_key&lt;/code&gt; 传入 &lt;code&gt;secrets.OPENROUTER_API_KEY&lt;/code&gt;&lt;br /&gt;    •   环境变量加 &lt;code&gt;ANTHROPIC_BASE_URL: https://openrouter.ai/api&lt;/code&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;成本跟踪 Statusline（可选）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;可以给 Claude Code 加自定义 statusline，实时显示 provider、模型、累计成本、缓存折扣等信息；脚本来自 openrouter-examples 仓库，并通过 &lt;code&gt;~/.claude/settings.json&lt;/code&gt; 配置 &lt;code&gt;statusLine.command&lt;/code&gt; 启用。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;常见排错&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;认证报错&lt;/b&gt;：确认 &lt;code&gt;ANTHROPIC_API_KEY&lt;/code&gt; 是 &lt;code&gt;&quot;&quot;&lt;/code&gt;（空字符串），而不是未设置；否则 Claude Code 可能回退到默认 Anthropic 认证流程。&lt;br /&gt;•   &lt;b&gt;上下文长度错误&lt;/b&gt;：拆分任务或新开会话。&lt;br /&gt;•   &lt;b&gt;隐私&lt;/b&gt;：OpenRouter 默认不记录你的源码 prompts，除非你在账号设置里明确选择开启日志。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://openrouter.ai/docs/guides/guides/claude-code-integration&quot; target=&quot;_blank&quot;&gt;https://openrouter.ai/docs/guides/guides/claude-code-integration&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23ClaudeCode&quot;&gt;#ClaudeCode&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23OpenRouter&quot;&gt;#OpenRouter&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Anthropic&quot;&gt;#Anthropic&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E5%B7%A5%E5%85%B7&quot;&gt;#开发工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%88%90%E6%9C%AC%E7%AE%A1%E7%90%86&quot;&gt;#成本管理&lt;/a&gt;</content:encoded></item><item><title>小米发布 MiMo-V2-Flash：高效推理模型开源小米于 2025 年 12 月 16 日发布并开源了 MiMo-V2-Flash，这是一款高效、超快的基础语言模型，在推理、编码和智能体场景表现尤为出色，同时也可作为日常任务的通用助手</title><link>https://localhost/posts/72</link><guid isPermaLink="true">https://localhost/posts/72</guid><pubDate>Wed, 17 Dec 2025 02:16:20 GMT</pubDate><content:encoded>&lt;b&gt;小米发布 MiMo-V2-Flash：高效推理模型开源&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;小米于 2025 年 12 月 16 日发布并开源了 MiMo-V2-Flash，这是一款高效、超快的基础语言模型，在推理、编码和智能体场景表现尤为出色，同时也可作为日常任务的通用助手。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心亮点&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;u&gt;模型架构&lt;/u&gt;：采用混合专家（MoE）架构，总参数 309B，激活参数仅 15B，结合滑动窗口与全注意力的混合注意力机制，支持 256K 超长上下文。&lt;br /&gt;&lt;br /&gt;&lt;u&gt;性能表现&lt;/u&gt;：&lt;br /&gt;• AIME 2025、GPQA-Diamond 等推理测试中位列开源模型前二&lt;br /&gt;• SWE-bench Verified 达 73.4%，SWE-bench Multilingual 达 71.7%，软件工程能力领先所有开源模型&lt;br /&gt;• 推理速度达 150 tokens/秒，成本仅 $0.1/百万输入 token&lt;br /&gt;&lt;br /&gt;&lt;u&gt;技术创新&lt;/u&gt;：&lt;br /&gt;• 多 Token 预测（MTP）：通过自推测解码实现 2.0-2.6 倍加速&lt;br /&gt;• MOPD 训练范式：多教师在线策略蒸馏，训练效率提升 50 倍以上&lt;br /&gt;&lt;br /&gt;&lt;u&gt;开源资源&lt;/u&gt;：模型权重以 MIT 协议开放于 Hugging Face，推理代码已贡献至 SGLang，技术报告同步发布。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://mimo.xiaomi.com/zh/blog/mimo-v2-flash&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E5%B0%8F%E7%B1%B3&quot;&gt;#小米&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MiMo&quot;&gt;#MiMo&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B&quot;&gt;#大语言模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E6%8E%A8%E7%90%86&quot;&gt;#AI推理&lt;/a&gt;</content:encoded></item><item><title>Coding Agents 与复杂度预算Lee Robinson（Cursor 工程师）分享了一次惊人的迁移经历：仅用 3 天时间、$260 token 费用 和数百个 AI Agent，就把 cursor.com 从 CMS 迁回纯代码和 Markdown</title><link>https://localhost/posts/71</link><guid isPermaLink="true">https://localhost/posts/71</guid><pubDate>Tue, 16 Dec 2025 15:49:48 GMT</pubDate><content:encoded>Coding Agents 与复杂度预算&lt;br /&gt;&lt;br /&gt;Lee Robinson（Cursor 工程师）分享了一次惊人的迁移经历：仅用 &lt;b&gt;3 天时间&lt;/b&gt;、&lt;b&gt;$260 token 费用&lt;/b&gt; 和数百个 AI Agent，就把 &lt;a href=&quot;http://cursor.com/&quot; target=&quot;_blank&quot;&gt;cursor.com&lt;/a&gt; 从 CMS 迁回纯代码和 Markdown。&lt;br /&gt;&lt;br /&gt;&lt;u&gt;为什么要抛弃 CMS？&lt;/u&gt;&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt;CMS 带来的隐性复杂度超乎想象：&lt;br /&gt;• 多系统用户管理&lt;br /&gt;• 预览变更的繁琐流程&lt;br /&gt;• 国际化翻译的插件地狱&lt;br /&gt;• CDN 费用暴涨（上线后花了 $56,848）&lt;br /&gt;• 代码库的依赖和抽象膨胀&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;u&gt;AI 时代的关键洞察&lt;/u&gt;&lt;br /&gt;&lt;br /&gt;抽象的代价从未如此之高。当内容变成代码后：&lt;br /&gt;• Agent 可以直接 grep 和编辑&lt;br /&gt;• PR 链接无需登录即可分享预览&lt;br /&gt;• 所有变更通过 git 追踪，Agent 能自主挖掘历史&lt;br /&gt;&lt;br /&gt;&lt;u&gt;迁移成果&lt;/u&gt;&lt;br /&gt;&lt;br /&gt;• 344 次 Agent 请求&lt;br /&gt;• 67 次 commit（+43K / -322K 行代码）&lt;br /&gt;• 构建速度提升 2 倍&lt;br /&gt;• 节省数千美元 CDN 费用&lt;br /&gt;• 第二天就能在手机上通过 cloud agent 合并修复&lt;br /&gt;&lt;br /&gt;&lt;u&gt;核心观点&lt;/u&gt;&lt;br /&gt;&lt;br /&gt;&quot;过度抽象一直是代码异味，现在有了简单的解决方案：花 token 删除复杂度。&quot; 编程 Agent 正在帮助团队尝试疯狂想法、清理深埋的技术债。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://leerob.com/agents&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23CodingAgent&quot;&gt;#CodingAgent&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B&quot;&gt;#AI编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%8A%80%E6%9C%AF%E5%80%BA%E5%8A%A1&quot;&gt;#技术债务&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Cursor&quot;&gt;#Cursor&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E6%95%88%E7%8E%87&quot;&gt;#开发效率&lt;/a&gt;&lt;a href=&quot;https://leerob.com/agents&quot; target=&quot;_blank&quot;&gt;
  &lt;i&gt;&lt;/i&gt;
  &lt;div&gt;Leerob&lt;/div&gt;
  
  &lt;div&gt;Coding Agents &amp;amp; Complexity Budgets&lt;/div&gt;
  &lt;div&gt;$260 in tokens and hundreds of coding agents later.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>如何让 Claude Code Skills 可靠激活Claude Code 的 Skills 功能理论上会根据描述自动激活，但实际测试发现激活率仅约 20%，跟抛硬币差不多</title><link>https://localhost/posts/69</link><guid isPermaLink="true">https://localhost/posts/69</guid><pubDate>Sun, 14 Dec 2025 12:27:39 GMT</pubDate><content:encoded>如何让 Claude Code Skills 可靠激活&lt;br /&gt;&lt;br /&gt;Claude Code 的 Skills 功能理论上会根据描述自动激活，但实际测试发现激活率仅约 20%，跟抛硬币差不多。作者通过 200+ 次测试，找到了两种有效方案。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;测试结果对比：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;• &lt;b&gt;Simple 简单指令&lt;/b&gt;：整体成功率仅 20%&lt;br /&gt;• &lt;b&gt;Forced Eval 强制评估&lt;/b&gt;：成功率 84%，最稳定&lt;br /&gt;• &lt;b&gt;LLM Eval 预评估&lt;/b&gt;：成功率 80%，更快更省钱&lt;br /&gt;&lt;br /&gt;&lt;u&gt;核心发现&lt;/u&gt;&lt;br /&gt;&lt;br /&gt;强制评估之所以有效，在于它创建了「承诺机制」：&lt;br /&gt;&lt;br /&gt;1. Claude 必须逐一评估每个 Skill 并给出 YES/NO&lt;br /&gt;2. 明确表态后才能继续实现&lt;br /&gt;3. 使用 &quot;MANDATORY&quot;、&quot;CRITICAL&quot; 等强硬措辞增加执行力&lt;br /&gt;&lt;br /&gt;&lt;u&gt;如何选择&lt;/u&gt;&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt;Forced Eval：追求稳定性，不介意输出冗长&lt;br /&gt;LLM Eval：追求速度和成本，适合单一技能场景&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;使用方法：在 &lt;code&gt;.claude/hooks/&lt;/code&gt; 创建对应脚本，并在 &lt;code&gt;settings.json&lt;/code&gt; 中配置 hook。如果用 &lt;a href=&quot;https://github.com/spences10/claude-skills-cli&quot; target=&quot;_blank&quot;&gt;claude-skills-cli&lt;/a&gt;，可直接运行：&lt;br /&gt;&lt;br /&gt;&lt;pre&gt;&lt;code&gt;pnpm exec claude-skills-cli add-hook
&lt;/code&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://scottspence.com/posts/how-to-make-claude-code-skills-activate-reliably&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23ClaudeCode&quot;&gt;#ClaudeCode&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Skills&quot;&gt;#Skills&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E6%8A%80%E5%B7%A7&quot;&gt;#开发技巧&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Anthropic&quot;&gt;#Anthropic&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E5%85%B7&quot;&gt;#AI工具&lt;/a&gt;&lt;a href=&quot;https://github.com/spences10/claude-skills-cli&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;GitHub&lt;/div&gt;
  
  &lt;div&gt;GitHub - spences10/claude-skills-cli: &lt;i&gt;&lt;b&gt;🤖&lt;/b&gt;&lt;/i&gt; CLI for creating Claude Agent Skills with progressive disclosure validation. Built for…&lt;/div&gt;
  &lt;div&gt;&lt;i&gt;&lt;b&gt;🤖&lt;/b&gt;&lt;/i&gt; CLI for creating Claude Agent Skills with progressive disclosure validation. Built for Claude Code to use when humans ask it to create skills. - spences10/claude-skills-cli&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Claude Code Skills 不会自动激活？这有个解决方案Claude Code 的 Skills 功能号称是&quot;自主激活&quot;的——只要你的请求匹配技能描述，Claude 就会自动使用</title><link>https://localhost/posts/65</link><guid isPermaLink="true">https://localhost/posts/65</guid><pubDate>Thu, 11 Dec 2025 15:36:38 GMT</pubDate><content:encoded>Claude Code Skills 不会自动激活？这有个解决方案&lt;br /&gt;&lt;br /&gt;Claude Code 的 Skills 功能号称是&quot;自主激活&quot;的——只要你的请求匹配技能描述，Claude 就会自动使用。但现实很骨感：&lt;b&gt;它根本不会&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;作者创建了一个 &lt;code&gt;research&lt;/code&gt; 技能，用于验证信息来源。每当说&quot;research this&quot;，Claude 应该自动调用该技能。结果呢？Claude 每次都无视技能，直接蛮干。&lt;br /&gt;&lt;br /&gt;问题根源&lt;br /&gt;&lt;br /&gt;Claude 太过专注于完成任务，会直接跳过检查可用工具的步骤。即使 Hook 提醒&quot;检查一下 skills&quot;，Claude 也当成背景噪音忽略。&lt;br /&gt;&lt;br /&gt;解决方案：用 Hook 强制激活&lt;br /&gt;&lt;br /&gt;核心思路：不要依赖&quot;自主激活&quot;，而是通过 &lt;code&gt;UserPromptSubmit&lt;/code&gt; Hook 检测触发词，显式命令 Claude 使用技能。&lt;br /&gt;&lt;br /&gt;&lt;pre&gt;&lt;code&gt;# 温柔提醒（无效）
echo &apos;💡 Check skills for relevant skills&apos;

# 强制指令（有效）
echo &quot;🔍 INSTRUCTION: Use Skill(research) to handle this&quot;
&lt;/code&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;区别在于：一个是&quot;请考虑一下&quot;，另一个是&quot;闭嘴听令&quot;!&lt;br /&gt;&lt;br /&gt;更简洁的通用方案&lt;br /&gt;&lt;br /&gt;后来作者发现了更简单的方式——一条通用 Hook 指令适用于所有技能：&lt;br /&gt;&lt;br /&gt;&lt;pre&gt;&lt;code&gt;&lt;span&gt;&quot;command&quot;&lt;/span&gt;&lt;span&gt;:&lt;/span&gt; &lt;span&gt;&quot;echo &apos;INSTRUCTION: If prompt matches any skill keywords, use Skill(skill-name) to activate it.&apos;&quot;&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;无需维护关键词脚本，无需处理冲突。&lt;br /&gt;&lt;br /&gt;实测结果&lt;br /&gt;&lt;br /&gt;20 次测试，成功率约 50%——基本靠运气。但比维护复杂脚本省心多了。&lt;br /&gt;&lt;br /&gt;结论：官方说 Skills 会自动激活，实际不会。用简单 Hook 碰碰运气，重要任务还是显式调用 &lt;code&gt;Skill(skill-name)&lt;/code&gt; 最靠谱。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://scottspence.com/posts/claude-code-skills-dont-auto-activate&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23ClaudeCode&quot;&gt;#ClaudeCode&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E5%85%B7&quot;&gt;#AI工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E6%8A%80%E5%B7%A7&quot;&gt;#开发技巧&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Hooks&quot;&gt;#Hooks&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B&quot;&gt;#编程&lt;/a&gt;&lt;a href=&quot;https://scottspence.com/posts/claude-code-skills-dont-auto-activate&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Scott Spence&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Claude Code Skills Don&apos;t Auto-Activate (a workaround) - Scott Spence&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/mH0qui2FwCTzIE61mUZAVVkvxdXliiPmFAjAbpmOUwf4lopf0pbDifWIPRErVxF_V1Zlw9MmGDYYmsefFpeUcNzEZaE0zHR0z8m3aNIuzGS6CLHhD1Wk1zFXY5eBFm1pV6pU1ZVg0OpUx_MzhjieschoaD9XI_3A4a5EGm6sLjgR25CXY3mvLtcHDvT2vIWu1H9x2rKZl48MzDtEGZTc2MRV6maPBvV7RvZU5IcOdgclKuPrLbcfS7or7N4nb-Rk3oXU7_1gNoU1GbRSGdCokPTpgmwxo9c47WJJyugoZ9PJbjqpYd4Ww9NKJZB8GvOs7U9wRktitmspo9vM0Yk4oQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Claude Code Skills Don&apos;t Auto-Activate (a workaround) - Scott Spence&lt;/div&gt;
  &lt;div&gt;So I got Claude Skills to register with Claude Code (sorted the&lt;br /&gt;YAML formatting issue),&lt;br /&gt;and the skills are now showing up when I ask Claude ...&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>AI 现状：来自 100 万亿 Token 的实证研究a16z 与 OpenRouter 合作，通过分析超过 100 万亿 Token 的真实世界交互数据，揭示了大型语言模型(LLM)的实际使用情况</title><link>https://localhost/posts/55</link><guid isPermaLink="true">https://localhost/posts/55</guid><pubDate>Fri, 05 Dec 2025 11:51:22 GMT</pubDate><content:encoded>&lt;b&gt;AI 现状：来自 100 万亿 Token 的实证研究&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;a16z 与 OpenRouter 合作，通过分析超过 100 万亿 Token 的真实世界交互数据，揭示了大型语言模型(LLM)的实际使用情况。这项研究为我们提供了关于模型生态、用户行为和未来趋势的深刻洞见。&lt;br /&gt;&lt;br /&gt;以下是几个核心发现：&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt;&lt;b&gt;开源模型的崛起&lt;/b&gt;&lt;br /&gt;开源模型已占据约三分之一的市场份额，其中来自中国的模型增长尤为迅猛。在开源领域，&lt;b&gt;创意角色扮演&lt;/b&gt;和&lt;b&gt;编程辅助&lt;/b&gt;是两大主要应用场景。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;智能体推理成为新常态&lt;/b&gt;&lt;br /&gt;LLM 的使用正从简单的单轮问答转向集成了工具调用、具备多步规划能力的“智能体推理”。更长的上下文输入和对推理模型的偏爱都证明了这一趋势。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;编程与角色扮演：两大支柱&lt;/b&gt;&lt;br /&gt;在所有模型中，“编程”是增长最快的专业应用，而“角色扮演”则是一个体量惊人的消费级应用，其使用量几乎与专业任务相当。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;“灰姑娘的水晶鞋”效应&lt;/b&gt;&lt;br /&gt;研究发现，当一个新模型率先完美解决了某个特定高价值问题时，其早期用户会表现出极高的忠诚度和留存率，形成稳固的“基础用户群”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;价值驱动，而非价格&lt;/b&gt;&lt;br /&gt;LLM 市场尚未商品化，需求对价格相对不敏感。用户愿意为高可靠性的闭源模型支付溢价以完成关键任务，而开源模型则在成本敏感的高容量场景中占据优势。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;AI 使用的全球化&lt;/b&gt;&lt;br /&gt;AI 的使用日益全球化，北美地区支出已低于总额的一半，亚洲市场份额则翻倍增长至近三分之一，显示出强劲的消费和创新能力。&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;报告揭示了一个多元、动态且竞争激烈的 LLM 生态系统。实际的用户行为往往超出传统认知，从智能体的兴起到角色扮演的流行，都预示着 AI 应用的未来充满了更多可能性。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://openrouter.ai/state-of-ai&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E8%B6%8B%E5%8A%BF&quot;&gt;#AI趋势&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B&quot;&gt;#大语言模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90&quot;&gt;#数据分析&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%99%BA%E8%83%BD%E4%BD%93&quot;&gt;#智能体&lt;/a&gt;&lt;a href=&quot;https://openrouter.ai/state-of-ai&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;OpenRouter&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;State of AI 2025: 100T Token LLM Usage Study | OpenRouter&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/mz4k59yLSQM3RZ1RjAe2TogZHkXEj7Lid1NcwV15GVPYk-rq6SuHoS4RklPpa5eLkPgbt1XgQ_zZN6qrjK7mBgb3ATrOHI9EL5AfTWBgdcnSn8rTFd7UhVqus4QQIK0GtXF1J5fTQA8HKBg11J7w-uGbapcac3ilZhOXnmflwSzqZFZ3o2fMiKjNlZkka-UXdsdpqYbC4z_wGlYxfb8WIIupUVbbiffomR9v2bAJSF0OsqyyCW9p9y6p8ugf0agnRFXMX5pABTX_Dp-wGAuHs7K_3TKm0KvaE3dWeWId5knlP51UoryPgErixe2W6ywbhvcbKEpImghMBzPgB9EYZA.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;State of AI 2025: 100T Token LLM Usage Study | OpenRouter&lt;/div&gt;
  &lt;div&gt;Read OpenRouter&apos;s 2025 State of AI report — an empirical 100 trillion token study of real LLM usage, model trends, and developer insights.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Mistral AI 发布新一代开源模型 Mistral 3Mistral AI 今日发布了其下一代 AI 模型系列 —— Mistral 3，包含一个前沿的大模型和一系列为边缘计算优化的小模型，全部在 Apache 2.0 许可下开源</title><link>https://localhost/posts/51</link><guid isPermaLink="true">https://localhost/posts/51</guid><pubDate>Wed, 03 Dec 2025 02:29:55 GMT</pubDate><content:encoded>&lt;b&gt;Mistral AI 发布新一代开源模型 Mistral 3&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Mistral AI 今日发布了其下一代 AI 模型系列 —— Mistral 3，包含一个前沿的大模型和一系列为边缘计算优化的小模型，全部在 Apache 2.0 许可下开源。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Mistral Large 3&lt;/b&gt;&lt;br /&gt;一款顶级的稀疏混合专家（MoE）模型，拥有 41B 激活参数和 675B 总参数，性能可与最强的闭源模型相媲美。它在多语言对话和图像理解方面表现出色。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Ministral 3 系列&lt;/b&gt;&lt;br /&gt;专为边缘和本地应用设计，提供 3B、8B 和 14B 三种尺寸，实现了卓越的性价比和效率。同样具备多模态和多语言能力。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心亮点&lt;/b&gt;&lt;br /&gt;&lt;blockquote&gt; &lt;b&gt;完全开源&lt;/b&gt;：所有模型均采用 Apache 2.0 许可，开发者可自由使用和定制。&lt;br /&gt; &lt;b&gt;多模态与多语言&lt;/b&gt;：原生支持文本、图像理解以及超过 40 种语言。&lt;br /&gt; &lt;b&gt;强大生态合作&lt;/b&gt;：与 NVIDIA、vLLM 及 Red Hat 紧密合作，提供高效的推理和部署支持。&lt;br /&gt; &lt;b&gt;广泛可用&lt;/b&gt;：已登陆 Hugging Face、Amazon Bedrock、Azure 等多个平台。&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;Mistral 3 的发布进一步推动了开放、透明和可访问的 AI 发展，为开发者和企业提供了更强大的工具。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://mistral.ai/news/mistral-3&quot; target=&quot;_blank&quot;&gt;https://mistral.ai/news/mistral-3&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23MistralAI&quot;&gt;#MistralAI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI&quot;&gt;#AI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23LLM&quot;&gt;#LLM&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Mistral3&quot;&gt;#Mistral3&lt;/a&gt;&lt;a href=&quot;https://mistral.ai/news/mistral-3/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Mistral AI&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Introducing Mistral 3 | Mistral AI&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/fJgPPB2FZ-YQmXv64BXE-X2y7-xChIhu1RMXMyYsLFa1MH6kGS7Kunnl7hxtIV2-hibaH3iUV_oBv_DyiCYIsgLjYvlyg_5dKQ6Vp9XHdhcRNDfYtws55UA6cy5b9j--diwN1CXcmGknRaJanZVb8N8kOv--8Kr22Uy1iRHrX_1uFT3LMtbMm_B4_JO8bt7PFItFxHslbDMFY-DrNLHNMuglU7vbn4LV7SNOcBpvXfoy8kQtaieofA5X4wsmosko6B-8Dkp6GcmlzH4ni_ALb8dTghhjmQh1QgAiqYO6_hJd1wQimHYvbTA3G1zavPq1f9a6hbOwiExOL6vWZpUQBQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Introducing Mistral 3 | Mistral AI&lt;/div&gt;
  &lt;div&gt;The most powerful AI platform for enterprises. Customize, fine-tune, and deploy AI assistants, autonomous agents, and multimodal AI with open models.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item></channel></rss>