<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>编程 | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>omp：直接集成 IDE 能力的终端 AI 编码助手oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体</title><link>https://localhost/posts/138</link><guid isPermaLink="true">https://localhost/posts/138</guid><pubDate>Mon, 15 Jun 2026 15:52:13 GMT</pubDate><content:encoded>omp：直接集成 IDE 能力的终端 AI 编码助手&lt;br /&gt;&lt;br /&gt;oh my pi (omp) 是一个专为终端设计的开源 AI 编码智能体。它不仅是一个代码生成器，更是一个深度集成 IDE 工具的“全能型选手”，旨在为开发者提供开箱即用、无缝连接的终端开发体验。&lt;br /&gt;&lt;br /&gt;核心亮点：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;深度集成 IDE 工具链&lt;/b&gt;：内置 LSP（Language Server Protocol），AI 能够像在 IDE 中一样精准进行跨文件重命名与格式化；同时支持 DAP（Debug Adapter Protocol），可以直接启动调试器（如 lldb, dlv, debugpy）进行单步调试和堆栈排查。&lt;br /&gt;•   &lt;b&gt;创新的 Snapcompact 图像压缩&lt;/b&gt;：当对话历史过长时，omp 不使用 LLM 进行文本总结，而是将历史记录渲染成极其微小的像素字体 PNG 图像，并发送给多模态模型读取。这一技术能够确保上下文细节不丢失，且仅消耗约 1/3 的 Token 成本。&lt;br /&gt;•   &lt;b&gt;强悍的 Rust 原生引擎&lt;/b&gt;：核心由约 5.5 万行 Rust 代码构建，搜索、shell、AST 分析等高频操作均在进程内完成，避免频繁 fork 子进程，效率极高。&lt;br /&gt;•   &lt;b&gt;本地化记忆与离线整理&lt;/b&gt;：使用本地 SQLite 矢量记忆库，并使用本地的小模型（如 Qwen-1.7B / Gemma-1B）在本地整理记忆与会话标题，数据不离设备。&lt;br /&gt;•   &lt;b&gt;强大的协作与扩展性&lt;/b&gt;：支持通过 &lt;code&gt;/collab&lt;/code&gt; 实现端到端加密的实时会话共享；兼容多种主流编辑器规则（如 Cursor, Cline, Copilot），甚至可以通过 ACP 协议直接在 Zed 编辑器中驱动终端中的同一个 omp 实例。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://omp.sh/&quot; target=&quot;_blank&quot;&gt;https://omp.sh/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A0%81%E5%8A%A9%E6%89%8B&quot;&gt;#AI编码助手&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B%E5%B7%A5%E5%85%B7&quot;&gt;#编程工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Rust&quot;&gt;#Rust&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE&quot;&gt;#开源项目&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%99%BA%E8%83%BD%E5%BC%80%E5%8F%91&quot;&gt;#智能开发&lt;/a&gt;&lt;a href=&quot;https://omp.sh/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;omp&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;omp — a coding agent with the IDE wired in&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/OIp_uPjy8j57e8jFQ1EAHhDS4v_1ipZ5Hr_c3LzsU_WeVFLL0_N2oOCfVHMaFEy7q363DDSN-TkFGJ6K1cJNzemHtQtxCtEses5g2rTtw3vct34VT0BQwiYlR6wxHDS5LSOiWujruVXiBtCa5P-X5RNdpHgWwgAoIqKLkuSYE58adDMmTqIEV-xW3lSaGS3MdMLtnX22Hps3Ztzieaih_UfI05kKrw0ikTtMuWsyiHnNQMXwv5Ec2iRaQl0MtuJyCTFCXlihL8kVRKVJVcH-SrS_fCiwI_PMaV7IZWmpK1KPdoeIZy0_C8J1dUZTbAQpVtpZseIWUh54kj0ZerxGZw.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;omp — a coding agent with the IDE wired in&lt;/div&gt;
  &lt;div&gt;Subagents, plan mode, LSP, DAP, hindsight memory, hashline edits, time-traveling rules — with a native Rust engine doing the heavy lifting.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>CursorBench：Cursor 如何更贴近真实开发来评估模型质量开发者正在把更长、更复杂的编程任务交给智能体：跨多个文件、工具和步骤</title><link>https://localhost/posts/120</link><guid isPermaLink="true">https://localhost/posts/120</guid><pubDate>Fri, 13 Mar 2026 06:03:11 GMT</pubDate><content:encoded>&lt;b&gt;CursorBench：Cursor 如何更贴近真实开发来评估模型质量&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;开发者正在把更长、更复杂的编程任务交给智能体：跨多个文件、工具和步骤。Cursor 认为，评测方式也必须随之升级，才能真实反映“好用与否”。&lt;br /&gt;&lt;br /&gt;Cursor 的做法是 &lt;b&gt;线上 + 线下&lt;/b&gt; 的混合评测闭环：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;线下：CursorBench（内部基准）&lt;/b&gt;&lt;br /&gt;    基于工程团队的真实 Cursor 会话构建，而不是从公开代码库抽题。因为更贴近实际工作流、信息更不充分且常带歧义，CursorBench 往往能更好地区分前沿模型，并衡量多维能力（正确性、代码质量、效率、交互行为等）。&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;线上：真实流量的受控实验&lt;/b&gt;&lt;br /&gt;    用于捕捉线下评测遗漏的退化：例如线下评分器判“正确”，但开发者实际体验变差。Cursor 会用多类代理指标（交互信号 + 输出质量信号）综合观察，并通过消融实验归因（如移除语义搜索工具来定位其关键场景）。&lt;br /&gt;&lt;br /&gt;为什么不太依赖公开基准？Cursor 指出三类常见问题：&lt;br /&gt;&lt;br /&gt;1.  &lt;b&gt;任务不匹配&lt;/b&gt;：许多基准仍偏向“修 bug”或“解谜题”，与真实开发请求脱节。&lt;br /&gt;2.  &lt;b&gt;评分困难&lt;/b&gt;：真实请求常有多种正确解，固定答案容易误伤合理方案。&lt;br /&gt;3.  &lt;b&gt;数据污染&lt;/b&gt;：公开仓库题目容易进入训练数据，分数被抬高；甚至出现“记忆补丁”与测试缺陷等问题。&lt;br /&gt;&lt;br /&gt;下一步，Cursor 预计开发会更多转向“长时运行智能体”。他们也计划让 CursorBench 适配更长任务，并解决成本、可复现性、以及离线结果与真实体验之间的差距。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://cursor.com/cn/blog/cursorbench&quot; target=&quot;_blank&quot;&gt;https://cursor.com/cn/blog/cursorbench&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E6%A8%A1%E5%9E%8B%E8%AF%84%E6%B5%8B&quot;&gt;#模型评测&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B%E6%99%BA%E8%83%BD%E4%BD%93&quot;&gt;#编程智能体&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%9F%BA%E5%87%86%E6%B5%8B%E8%AF%95&quot;&gt;#基准测试&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Cursor&quot;&gt;#Cursor&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E4%BD%93%E9%AA%8C&quot;&gt;#开发者体验&lt;/a&gt;&lt;a href=&quot;https://cursor.com/cn/blog/cursorbench&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Cursor&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;How we compare model quality in Cursor · Cursor&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/QRvICVn9snfzukg82oFNZXywk4nurNWHeEwJrrPLmFAO7IZZHlo7sEP_qI_acKG1_RPMpo7Lfm88ritWi6KP78DNBgac4qbTzAiVDEtUTR_7NEL6WmTe2O8lmNRtdhifXCW31XhvLvk8X8jHBOycBh1ztir-qVYthNrpbL1DYK4UMtpJhYHAfb4N_hH7EO3NmZQ2n_YNq9KDTRVyocV4ORVIPzFwoynkGakSxLab1gFHzk860MJ_JmRhC47fVUVijcu3bswc_P62gdWXIUfGd-WCCiZiQVLxKMZxq061REs2e5Ts1omkAiPEOMcwXWhhUsUjBB2BBMWBWn7ugDTCzA.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;How we compare model quality in Cursor · Cursor&lt;/div&gt;
  &lt;div&gt;We use a hybrid online-offline eval process to keep our understanding of model quality aligned with what developers actually do.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Stripe「Minions」：一键生成、端到端交付的无人值守编码代理Stripe 在内部打造了一套名为 Minions 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入</title><link>https://localhost/posts/116</link><guid isPermaLink="true">https://localhost/posts/116</guid><pubDate>Tue, 10 Feb 2026 14:31:52 GMT</pubDate><content:encoded>&lt;b&gt;Stripe「Minions」：一键生成、端到端交付的无人值守编码代理&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Stripe 在内部打造了一套名为 &lt;b&gt;Minions&lt;/b&gt; 的编码代理：从接到任务到产出可评审的 PR，全程几乎无需人类介入。现在，Stripe &lt;b&gt;每周有超过 1000 个合并的 PR&lt;/b&gt; 是由 Minions 从头到尾生成的（人类负责 Review，但不写代码）。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么要自研？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;在 Stripe 这种超大规模、强约束的工程环境里，“从零写个原型”和“在成熟巨型代码库里安全改动”完全不是一回事：&lt;br /&gt;&lt;br /&gt;•   代码库规模巨大（数亿行），栈也相对小众：大量后端是 &lt;b&gt;Ruby + Sorbet&lt;/b&gt;，还有大量 &lt;b&gt;Stripe 自研库&lt;/b&gt;，LLM 天然不熟&lt;br /&gt;•   业务风险极高：Stripe 的代码承载着 &lt;b&gt;每年超过 1 万亿美元&lt;/b&gt; 的支付规模，并受金融合规与监管约束&lt;br /&gt;•   既要让代理“会写”，也要让它“按规矩写、能跑通、能过 CI”，并与既有研发流程深度结合&lt;br /&gt;&lt;br /&gt;&lt;b&gt;工程师怎么用？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;最常见的入口是 &lt;b&gt;Slack&lt;/b&gt;：&lt;br /&gt;&lt;br /&gt;•   在讨论线程里 &lt;a href=&quot;https://t.me/Slack&quot; target=&quot;_blank&quot;&gt;@Slack&lt;/a&gt; App 就能发起 Minion，它会读取整个线程与相关链接作为上下文&lt;br /&gt;•   也集成到内部系统里：文档平台、Feature Flag、工单系统等&lt;br /&gt;    例如 CI 发现 flaky tests，会生成工单，直接提供按钮让 Minion 去修&lt;br /&gt;&lt;br /&gt;完成后，Minion 会：&lt;br /&gt;&lt;br /&gt;•   创建分支 → 推送 → 跑 CI → 按模板生成 PR&lt;br /&gt;&lt;br /&gt;如果效果不理想，人类可以补充指令让它再改；即使不完美，也常常是很好的“可用起点”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;Minions 背后怎么运作（要点版）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Stripe 的思路是：&lt;b&gt;把“创意生成”交给 LLM，把“必须可靠执行的步骤”交给确定性工具链&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;•   运行环境：在隔离的 &lt;b&gt;devbox&lt;/b&gt; 中执行（10 秒内可启动，预热并预载代码与服务），与生产与公网隔离，便于并行&lt;br /&gt;•   Agent 框架：基于 Block 的开源编码代理 &lt;b&gt;goose&lt;/b&gt; 的 fork，并做了强定制&lt;br /&gt;•   规则与上下文：读取各类 agent rule 文件，但多为“按目录条件生效”，避免全局死规则拖累&lt;br /&gt;•   工具调用：接入 &lt;b&gt;MCP&lt;/b&gt;（函数调用通用协议），并建设内部 MCP 服务 &lt;b&gt;Toolshed&lt;/b&gt;，提供 &lt;b&gt;400+&lt;/b&gt; 工具（文档、工单、构建状态、Sourcegraph 搜索等）&lt;br /&gt;•   反馈与质量闸门：&lt;br /&gt;    •   首先跑本地启发式 lint/检查（通常 &amp;lt;5 秒）&lt;br /&gt;    •   再跑选择性的 CI（Stripe 有 300 万+ 测试），部分失败可自动修复&lt;br /&gt;    •   为控制成本与等待时间：&lt;b&gt;最多两轮 CI&lt;/b&gt;，强调“能本地提前发现就不要拖到 CI”&lt;br /&gt;&lt;br /&gt;&lt;b&gt;接下来&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;这篇是系列 Part 1，主要讲“怎么用、能做什么”；Part 2 会深入实现细节。整体信号很明确：当“开发者注意力”成为稀缺资源时，无人值守、可并行的编码代理正在改变工程协作方式。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&quot; target=&quot;_blank&quot;&gt;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E7%A8%8B%E5%8C%96&quot;&gt;#AI工程化&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A0%81%E4%BB%A3%E7%90%86&quot;&gt;#编码代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E6%95%88%E7%8E%87&quot;&gt;#开发者效率&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23CI%E5%AE%9E%E8%B7%B5&quot;&gt;#CI实践&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Stripe&quot;&gt;#Stripe&lt;/a&gt;&lt;a href=&quot;https://stripe.dev/blog/minions-stripes-one-shot-end-to-end-coding-agents&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;stripe.dev&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Minions: Stripe’s one-shot, end-to-end coding agents&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/H18ir4W7Yx5_y3FWZkpWcsbvq3tjwyhUR2cnF0H8zvQEMEA5hDDuzmWhlJMBqLt1a6rwdrjM7EZks3PRwzG5fKWcZuteGl6cCISlgkoPdBPluHLb1_LdSjq6sK5TIAJHPGzIQTidPEeuFE6bVyc0l3mw_bMwoWgKu09iX7PfPbW9ljEhh8D-CGo_juWvKyLQmO48TL5Q5XsCiS413KHYyOlbRUUGBa98Kl6-avUPqjDOLvvaeC9oSmqqtLOfYFQjLGy4bVo0e9spukFV3F-ffYVjVQ_tOJbmFuVBiJVZJEKaHDk9lOZov2-h9GuQJYKBehz65LkdCb4g-TepDOBhIQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Minions: Stripe’s one-shot, end-to-end coding agents&lt;/div&gt;
  &lt;div&gt;Minions are Stripe’s homegrown coding agents, responsible for more than a thousand pull requests merged each week. Though humans review the code, minions write it from start to finish. Learn how they work, and how we built them.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>用好编码代理：Claude Code 2.0 的关键功能与“上下文工程”心法这篇长文把 Claude Code 2.0 当成一个“能动手的工作台”来拆解：不仅讲新功能，更强调如何用更好的流程与上下文管理，让代理稳定产出</title><link>https://localhost/posts/86</link><guid isPermaLink="true">https://localhost/posts/86</guid><pubDate>Mon, 29 Dec 2025 00:50:48 GMT</pubDate><content:encoded>&lt;b&gt;用好编码代理：Claude Code 2.0 的关键功能与“上下文工程”心法&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;这篇长文把 Claude Code 2.0 当成一个“能动手的工作台”来拆解：不仅讲新功能，更强调如何用更好的流程与上下文管理，让代理稳定产出。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;1) 先换个视角：你不是“追上更新”，而是“借力变强”&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;作者给了一个更实用的框架：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;跟进工具&lt;/b&gt;：定期用、定期看更新（不必天天追）。&lt;br /&gt;•   &lt;b&gt;深耕领域&lt;/b&gt;：懂业务/系统设计/工程习惯，才能把“未知”变成“可提问、可验证”。&lt;br /&gt;•   &lt;b&gt;多玩多试&lt;/b&gt;：用不同模型做同一件事，快速建立直觉与边界。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;2) Claude Code 2.0 值得关注的体验升级&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;一些偏“日常效率”的改动，叠加起来很实用：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;语法高亮 + 更舒服的评审体验&lt;/b&gt;（作者因此更愿意在 CLI 里完成 review）&lt;br /&gt;•   &lt;code&gt;/context&lt;/code&gt;&lt;b&gt; 看上下文占用&lt;/b&gt;（建议复杂任务到 60% 左右就交接或压缩）&lt;br /&gt;•   &lt;b&gt;Checkpointing（&lt;/b&gt;&lt;code&gt;Esc&lt;/code&gt;&lt;b&gt;+&lt;/b&gt;&lt;code&gt;Esc&lt;/code&gt;&lt;b&gt; / &lt;/b&gt;&lt;code&gt;/rewind&lt;/code&gt;&lt;b&gt;）&lt;/b&gt;：能回到某个检查点，回滚代码与对话&lt;br /&gt;•   &lt;b&gt;Prompt suggestions / 历史搜索（&lt;/b&gt;&lt;code&gt;Ctrl + R&lt;/code&gt;&lt;b&gt;）&lt;/b&gt;：减少重复输入&lt;br /&gt;•   &lt;b&gt;更快的模糊文件搜索、队列导航、LSP 插件&lt;/b&gt; 等&lt;br /&gt;&lt;br /&gt;&lt;b&gt;3) Sub-agents（子代理）怎么用才不浪费&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;作者重点讲了“子代理不是魔法，是上下文与工具调用策略”：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Explore&lt;/b&gt;：偏“只读搜索专家”，适合快速扫代码库、定位文件与线索。&lt;br /&gt;•   &lt;b&gt;general-purpose / plan&lt;/b&gt;：更像“全能协作者”，通常会继承更多上下文。&lt;br /&gt;•   关键提醒：&lt;b&gt;不要只依赖 Explore 的摘要&lt;/b&gt;。摘要是“有损压缩”，重要文件最好让主代理再读一遍，让信息彼此“交叉注意力”，推理更稳。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;4) 核心概念：Context Engineering（上下文工程）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;代理之所以“烧 tokens”，不是它话多，而是：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;工具调用本身 + 工具返回结果&lt;/b&gt;都会进入上下文；&lt;br /&gt;•   上下文越长，检索与注意力越容易退化（作者称为 context rot / degradation）。&lt;br /&gt;&lt;br /&gt;因此，上下文工程的目标是：&lt;br /&gt;&lt;br /&gt;•   把&lt;b&gt;最相关&lt;/b&gt;的信息放进来&lt;br /&gt;•   控制“噪音”和重复指令&lt;br /&gt;•   用清晰结构（计划、scratchpad、handoff）对抗跑偏&lt;br /&gt;&lt;br /&gt;&lt;b&gt;5) Hooks / Skills / MCP：把“提示词”产品化&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;作者把这三者放在一起看：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Hooks&lt;/b&gt;：在对话生命周期某个节点自动触发脚本（比如 Stop 后自动提醒/继续下一步）。&lt;br /&gt;•   &lt;b&gt;Skills&lt;/b&gt;：把领域指令与脚本做成“按需加载”的技能包，避免常驻系统提示导致上下文膨胀。&lt;br /&gt;•   &lt;b&gt;MCP&lt;/b&gt;：连接外部工具/服务，但要注意“工具定义与中间结果”同样会吃上下文与成本；文中也提到用代码执行环境来降低这种膨胀的思路。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;6) 一个很实战的工作流建议&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;作者的默认搭配大意是：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;Claude（Opus 4.5）偏执行与沟通&lt;/b&gt;：更像结对编程伙伴、反馈快。&lt;br /&gt;•   &lt;b&gt;Codex 偏 review/找 bug&lt;/b&gt;：更克制、误报少，适合做“第二视角审查”。&lt;br /&gt;•   面对难功能：先跑一个“可丢弃的草稿版本”，用它暴露模型的偏差，再用更精准的提示第二轮迭代。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://sankalp.bearblog.dev/my-experience-with-claude-code-20-and-how-to-get-better-at-using-coding-agents/&quot; target=&quot;_blank&quot;&gt;https://sankalp.bearblog.dev/my-experience-with-claude-code-20-and-how-to-get-better-at-using-coding-agents/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23ClaudeCode&quot;&gt;#ClaudeCode&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A0%81%E4%BB%A3%E7%90%86&quot;&gt;#编码代理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%B8%8A%E4%B8%8B%E6%96%87%E5%B7%A5%E7%A8%8B&quot;&gt;#上下文工程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E5%85%B7&quot;&gt;#AI工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%BD%AF%E4%BB%B6%E5%B7%A5%E7%A8%8B&quot;&gt;#软件工程&lt;/a&gt;&lt;a href=&quot;https://sankalp.bearblog.dev/my-experience-with-claude-code-20-and-how-to-get-better-at-using-coding-agents/&quot; target=&quot;_blank&quot;&gt;
  &lt;i&gt;&lt;/i&gt;
  &lt;div&gt;sankalp&apos;s blog&lt;/div&gt;
  
  &lt;div&gt;A Guide to Claude Code 2.0 and getting better at using coding agents&lt;/div&gt;
  &lt;div&gt;A deep dive into Claude Code 2.0 features, Opus 4.5 workflows, and context engineering. Learn sub-agents, MCP servers, hooks, skills, and practical tips to boost your AI-assisted coding productivity.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Claude Code Skills 不会自动激活？这有个解决方案Claude Code 的 Skills 功能号称是&quot;自主激活&quot;的——只要你的请求匹配技能描述，Claude 就会自动使用</title><link>https://localhost/posts/65</link><guid isPermaLink="true">https://localhost/posts/65</guid><pubDate>Thu, 11 Dec 2025 15:36:38 GMT</pubDate><content:encoded>Claude Code Skills 不会自动激活？这有个解决方案&lt;br /&gt;&lt;br /&gt;Claude Code 的 Skills 功能号称是&quot;自主激活&quot;的——只要你的请求匹配技能描述，Claude 就会自动使用。但现实很骨感：&lt;b&gt;它根本不会&lt;/b&gt;。&lt;br /&gt;&lt;br /&gt;作者创建了一个 &lt;code&gt;research&lt;/code&gt; 技能，用于验证信息来源。每当说&quot;research this&quot;，Claude 应该自动调用该技能。结果呢？Claude 每次都无视技能，直接蛮干。&lt;br /&gt;&lt;br /&gt;问题根源&lt;br /&gt;&lt;br /&gt;Claude 太过专注于完成任务，会直接跳过检查可用工具的步骤。即使 Hook 提醒&quot;检查一下 skills&quot;，Claude 也当成背景噪音忽略。&lt;br /&gt;&lt;br /&gt;解决方案：用 Hook 强制激活&lt;br /&gt;&lt;br /&gt;核心思路：不要依赖&quot;自主激活&quot;，而是通过 &lt;code&gt;UserPromptSubmit&lt;/code&gt; Hook 检测触发词，显式命令 Claude 使用技能。&lt;br /&gt;&lt;br /&gt;&lt;pre&gt;&lt;code&gt;# 温柔提醒（无效）
echo &apos;💡 Check skills for relevant skills&apos;

# 强制指令（有效）
echo &quot;🔍 INSTRUCTION: Use Skill(research) to handle this&quot;
&lt;/code&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;区别在于：一个是&quot;请考虑一下&quot;，另一个是&quot;闭嘴听令&quot;!&lt;br /&gt;&lt;br /&gt;更简洁的通用方案&lt;br /&gt;&lt;br /&gt;后来作者发现了更简单的方式——一条通用 Hook 指令适用于所有技能：&lt;br /&gt;&lt;br /&gt;&lt;pre&gt;&lt;code&gt;&lt;span&gt;&quot;command&quot;&lt;/span&gt;&lt;span&gt;:&lt;/span&gt; &lt;span&gt;&quot;echo &apos;INSTRUCTION: If prompt matches any skill keywords, use Skill(skill-name) to activate it.&apos;&quot;&lt;/span&gt;
&lt;/code&gt;&lt;/pre&gt;&lt;br /&gt;&lt;br /&gt;无需维护关键词脚本，无需处理冲突。&lt;br /&gt;&lt;br /&gt;实测结果&lt;br /&gt;&lt;br /&gt;20 次测试，成功率约 50%——基本靠运气。但比维护复杂脚本省心多了。&lt;br /&gt;&lt;br /&gt;结论：官方说 Skills 会自动激活，实际不会。用简单 Hook 碰碰运气，重要任务还是显式调用 &lt;code&gt;Skill(skill-name)&lt;/code&gt; 最靠谱。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://scottspence.com/posts/claude-code-skills-dont-auto-activate&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23ClaudeCode&quot;&gt;#ClaudeCode&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E5%B7%A5%E5%85%B7&quot;&gt;#AI工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E6%8A%80%E5%B7%A7&quot;&gt;#开发技巧&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Hooks&quot;&gt;#Hooks&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B&quot;&gt;#编程&lt;/a&gt;&lt;a href=&quot;https://scottspence.com/posts/claude-code-skills-dont-auto-activate&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Scott Spence&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Claude Code Skills Don&apos;t Auto-Activate (a workaround) - Scott Spence&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/mH0qui2FwCTzIE61mUZAVVkvxdXliiPmFAjAbpmOUwf4lopf0pbDifWIPRErVxF_V1Zlw9MmGDYYmsefFpeUcNzEZaE0zHR0z8m3aNIuzGS6CLHhD1Wk1zFXY5eBFm1pV6pU1ZVg0OpUx_MzhjieschoaD9XI_3A4a5EGm6sLjgR25CXY3mvLtcHDvT2vIWu1H9x2rKZl48MzDtEGZTc2MRV6maPBvV7RvZU5IcOdgclKuPrLbcfS7or7N4nb-Rk3oXU7_1gNoU1GbRSGdCokPTpgmwxo9c47WJJyugoZ9PJbjqpYd4Ww9NKJZB8GvOs7U9wRktitmspo9vM0Yk4oQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Claude Code Skills Don&apos;t Auto-Activate (a workaround) - Scott Spence&lt;/div&gt;
  &lt;div&gt;So I got Claude Skills to register with Claude Code (sorted the&lt;br /&gt;YAML formatting issue),&lt;br /&gt;and the skills are now showing up when I ask Claude ...&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>规范驱动开发（SDD）的局限性随着 AI 编程的兴起，一种旧模式正在回归：编写详细的规范文档（Spec），然后期望 AI 能稳定地生成“正确”的代码</title><link>https://localhost/posts/53</link><guid isPermaLink="true">https://localhost/posts/53</guid><pubDate>Thu, 04 Dec 2025 01:43:23 GMT</pubDate><content:encoded>&lt;b&gt;规范驱动开发（SDD）的局限性&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;随着 AI 编程的兴起，一种旧模式正在回归：编写详细的规范文档（Spec），然后期望 AI 能稳定地生成“正确”的代码。然而，这种规范驱动开发（Spec-Driven Development, SDD）在实践中往往会碰壁，原因与当年瀑布流开发模式失败类似——现实的变化总比规范文档快。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么规范驱动开发会失败？&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;1️⃣&lt;/b&gt;&lt;/i&gt; &lt;b&gt;维护成本高昂&lt;/b&gt;&lt;br /&gt;&lt;blockquote&gt;编写详尽的规范耗时巨大，而且在需求变更、约束调整时，保持规范与代码同步会产生巨大的维护成本，有时甚至会加倍工作量。&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;2️⃣&lt;/b&gt;&lt;/i&gt; &lt;b&gt;规范无法反映所有上下文&lt;/b&gt;&lt;br /&gt;&lt;blockquote&gt;规范描述了系统“做什么”，却无法解释“为什么”这么做。而“为什么”恰恰承载了关键背景信息，如技术权衡、团队在迭代中的学习、以及塑造解决方案的现实约束。&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;3️⃣&lt;/b&gt;&lt;/i&gt; &lt;b&gt;过度规范化造成虚假的安全感&lt;/b&gt;&lt;br /&gt;&lt;blockquote&gt;一份详细的规范会给人一种“一切尽在掌握”的错觉，但这往往是虚假的。软件开发是一个探索性过程，最重要的洞见往往在构建开始后才会出现。&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;4️⃣&lt;/b&gt;&lt;/i&gt; &lt;b&gt;抽象层次错误&lt;/b&gt;&lt;br /&gt;&lt;blockquote&gt;多数 SDD 工具关注的是实现的细节（“如何做”），比如字段定义、函数签名等，但更重要的是其背后的意图、约束和上下文（“为什么做”）。&lt;br /&gt;&lt;/blockquote&gt;&lt;br /&gt;&lt;b&gt;什么才是真正重要的？—— 上下文工程&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;文章认为，AI 编程缺失的不是更详细的规范，而是更完善的上下文保留。AI 原生的开发流程应该：&lt;br /&gt;&lt;br /&gt;• 从&lt;b&gt;意图&lt;/b&gt;出发，明确要解决的问题和核心约束。&lt;br /&gt;• 保持&lt;b&gt;上下文&lt;/b&gt;的实时更新，让团队与 AI 保持同步。&lt;br /&gt;• 让&lt;b&gt;规范&lt;/b&gt;跟随代码库，成为动态演进的文档。&lt;br /&gt;• 保留决策背后的&lt;b&gt;“为什么”&lt;/b&gt;，而不仅仅是需求。&lt;br /&gt;&lt;br /&gt;总而言之，对于需求稳定、边界清晰的领域，SDD 是有效的。但对于不断演化的探索性开发，上下文驱动的方法能更好地适应变化。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://isoform.ai/blog/the-limits-of-spec-driven-development&quot; target=&quot;_blank&quot;&gt;https://isoform.ai/blog/the-limits-of-spec-driven-development&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI&quot;&gt;#AI&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%BD%AF%E4%BB%B6%E5%BC%80%E5%8F%91&quot;&gt;#软件开发&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B&quot;&gt;#编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%A7%84%E8%8C%83%E9%A9%B1%E5%8A%A8%E5%BC%80%E5%8F%91&quot;&gt;#规范驱动开发&lt;/a&gt;&lt;a href=&quot;https://isoform.ai/blog/the-limits-of-spec-driven-development&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;isoform.ai&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;The Limits of Spec-Driven Development - Isoform&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/HBbSqrbw9NbsuUdooc511PYhE3feNLThy6fvKE7RrbKJGsnQYOo-BSa4vsvrDpqdTdi5hEtuHnzpV5ArDKpADR7WoJBFFQqP6PDPxEXhvugaoRxu9juXufJJiNQEPjI7ZMS0yXTpEXFeEUmSHckdPA9LAEX8TQaVuc7nRQShHcGs_JGiXUmr7nAJDfftHHQyD25VtxwonnInEAjuvMU1SoTCqWxqzMllW9UX5ZaAng0--ti5X6wbUN8wIfxXt3G3Um2siRG8gObofaQ-1i-j8FxFmWLn05ERLtBGI6iMTrC7yY6S8JKRPt1vvGoIMd_BoH-TekP-nIJJvm2Cbq5yZQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;The Limits of Spec-Driven Development - Isoform&lt;/div&gt;
  &lt;div&gt;We enable private equity firms and mid-market companies to build bespoke AI products 5x faster. Services include AI feature shipping, AI-led integration, data migration, and legacy system modernization.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>这篇文章探讨了“制造软件”的真正含义. 作者认为，这远不止是编写代码，而是一个发现、创造和交付价值的完整过程. 它始于深入理解问题和用户需求，终于创造出能为他人生活带来积极改变的工具.真正的挑战在于处理那些模糊不清、充满人性的部分：理解混乱的需求、平衡不同的观点、并在不断变化的环境中找到前进的道路.软件开发是一门手艺，它结合了解决问题的智慧和创造有用工具的乐趣. 从一个想法到最终产品，这个过程充满了挑战，但也带来了巨大的满足感.原文链接：Making Software#软件开发 #产品思维 #编程 #创造力</title><link>https://localhost/posts/36</link><guid isPermaLink="true">https://localhost/posts/36</guid><pubDate>Mon, 24 Nov 2025 10:22:42 GMT</pubDate><content:encoded>这篇文章探讨了“制造软件”的真正含义. 作者认为，这远不止是编写代码，而是一个发现、创造和交付价值的完整过程. 它始于深入理解问题和用户需求，终于创造出能为他人生活带来积极改变的工具.&lt;br /&gt;&lt;br /&gt;真正的挑战在于处理那些模糊不清、充满人性的部分：理解混乱的需求、平衡不同的观点、并在不断变化的环境中找到前进的道路.&lt;br /&gt;&lt;br /&gt;软件开发是一门手艺，它结合了解决问题的智慧和创造有用工具的乐趣. 从一个想法到最终产品，这个过程充满了挑战，但也带来了巨大的满足感.&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://www.makingsoftware.com/&quot; target=&quot;_blank&quot;&gt;Making Software&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E8%BD%AF%E4%BB%B6%E5%BC%80%E5%8F%91&quot;&gt;#软件开发&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%BA%A7%E5%93%81%E6%80%9D%E7%BB%B4&quot;&gt;#产品思维&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E7%BC%96%E7%A8%8B&quot;&gt;#编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%88%9B%E9%80%A0%E5%8A%9B&quot;&gt;#创造力&lt;/a&gt;</content:encoded></item></channel></rss>