<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>RAG | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>Ref：给你的 AI Agent 一份“刚刚好”的文档上下文做 AI 编程助手最怕两件事：胡编和上下文膨胀</title><link>https://localhost/posts/85</link><guid isPermaLink="true">https://localhost/posts/85</guid><pubDate>Sat, 27 Dec 2025 02:47:44 GMT</pubDate><content:encoded>&lt;b&gt;Ref：给你的 AI Agent 一份“刚刚好”的文档上下文&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;做 AI 编程助手最怕两件事：&lt;b&gt;胡编&lt;/b&gt;和&lt;b&gt;上下文膨胀&lt;/b&gt;。Ref 主打的就是把问题变简单——让你的 Agent 能随用随查公共/私有技术文档，只拿“够用且准确”的信息。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;它怎么做？&lt;/b&gt;&lt;br /&gt;Ref 通过 MCP（Model Context Protocol）把文档上下文接到你的 AI 工具里：既有持续更新的公共文档索引，也支持把你的私有资料（如 GitHub 仓库、PDF）纳入检索。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;给 Agent 的两个核心能力：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;search_documentation&lt;/code&gt;：面向技术文档的精确搜索，能定位到具体章节，支持公有与私有文档集。&lt;br /&gt;•   &lt;code&gt;read_url&lt;/code&gt;：读取任意网页或 GitHub 文件内容（可含私有内容），适合顺藤摸瓜跟进链接。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;为什么不是“东拼西凑工具链”？&lt;/b&gt;&lt;br /&gt;你当然可以分别用：代码片段、搜索、爬取、私有代码检索、PDF 检索等工具组合；Ref 的定位是把这些需求尽量合并成一个更统一的入口，减少集成成本与上下文噪音。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;安全与企业能力（官方强调点）：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   SOC2 合规（并提供 Trust Center 与隐私安全说明）&lt;br /&gt;•   支持 SSO 与 MCP OAuth&lt;br /&gt;•   提供“主动提示注入防护”（对返回的上下文做注入扫描，仍在开发中）&lt;br /&gt;&lt;br /&gt;&lt;b&gt;定价概览：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   Free：200 credits（不刷新、不失效，官方估算约 10 周常规使用）&lt;br /&gt;•   Basic：$9/月，1000 credits&lt;br /&gt;•   Team：$9/月/席位，1000 credits/席位（团队共享私有文档索引与统一账单）&lt;br /&gt;•   Enterprise：SSO、SOC2、优先支持、定制化等&lt;br /&gt;&lt;br /&gt;如果你在用 Claude/Cursor/Zed 等工具做工程开发，且经常需要“查最新文档 + 查公司内部资料”，这种“面向文档的上下文层”会比泛用搜索/爬虫更省 token，也更贴近代码场景。&lt;br /&gt;&lt;br /&gt;原链接：&lt;a href=&quot;https://ref.tools/&quot; target=&quot;_blank&quot;&gt;https://ref.tools/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23MCP&quot;&gt;#MCP&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7&quot;&gt;#开发者工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%8A%80%E6%9C%AF%E6%96%87%E6%A1%A3&quot;&gt;#技术文档&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B%E5%8A%A9%E6%89%8B&quot;&gt;#AI编程助手&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23RAG&quot;&gt;#RAG&lt;/a&gt;&lt;a href=&quot;https://ref.tools/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;ref.tools&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Ref - Review every important decision&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/QFyUoGFWtualnjVx2LtRT40DX3iMZaktHuOE7fjg6jda98K7IeY3dR8Htzo83keZluA7yPYK9kpPxSHc88y3zHA-JQIK63mzAvunHJDiTwIkIT2_mRNVqY64lU4T1g3P-7HKS2OFP6hurGT2uYF-Nu5MrwoOMMcAscHeNXZ4z_v_ZG6KVrobCMkqhyR3ZTpMFtMpXi9nX3zbUa20kuyw-esenoJaPPuu3X6tREIb8xljPxrZO1JYTUclhpblErb6Ip4iFF6Z-W3Zsc1rDp7Bdfra0svZSVTJSxD0rpkOAjrJ65CEoj13dzhuHHnhAEP_hAVb_MM1_b8wtcTm7KOn_w.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Ref - Review every important decision&lt;/div&gt;
  &lt;div&gt;One workspace to plan, review and manage coding agents with your team.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>用 Payload CMS + Vercel AI SDK 搭建“可运营”的 AI 应用把 AI 做到生产可用，更多是架构问题：提示词不该写死在代码里，长任务要能可靠重试，Embedding 要能查询，输出要结构化可校验，更关键的是——要能看见系统到底“说了什么、做了什么”</title><link>https://localhost/posts/81</link><guid isPermaLink="true">https://localhost/posts/81</guid><pubDate>Wed, 24 Dec 2025 14:23:22 GMT</pubDate><content:encoded>&lt;b&gt;用 Payload CMS + Vercel AI SDK 搭建“可运营”的 AI 应用&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;把 AI 做到生产可用，更多是架构问题：提示词不该写死在代码里，长任务要能可靠重试，Embedding 要能查询，输出要结构化可校验，更关键的是——要能看见系统到底“说了什么、做了什么”。&lt;br /&gt;&lt;br /&gt;这篇文章分享了 InnoPeak 在 FinSureTech 场景下的一套实践组合：用 &lt;b&gt;Payload CMS&lt;/b&gt; 做“可视化、可配置的 AI 后端”，用 &lt;b&gt;Vercel AI SDK&lt;/b&gt; 做“结构化生成与工具调用的运行层”，形成一条从配置、执行到观测的闭环。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;1) 用 Payload 管理 Prompt 与模型选择（不发版也能调）&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;•   把系统/用户提示词做成模板（如 Handlebars），集中放在 Payload 的 &lt;code&gt;globals&lt;/code&gt; 里&lt;br /&gt;•   模型 ID 用受控下拉选项管理，避免随意输入造成线上不可控&lt;br /&gt;•   非开发同事也能在后台安全修改提示词与模型策略，应用逻辑保持稳定&lt;br /&gt;&lt;br /&gt;&lt;b&gt;2) 在后台“可视化”JSON Schema，提升结构化输出可靠性&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;做结构化输出（JSON schema）时，最大的成本在测试与迭代。作者的做法是：&lt;br /&gt;&lt;br /&gt;•   在 Payload Admin 里直接渲染/展示 schema&lt;br /&gt;•   让开发者一键复制到测试对话或本地 LLM 环境验证&lt;br /&gt;&lt;br /&gt;这样能更快发现：字段缺失、类型不匹配、约束不被遵守等问题。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;3) 用 Payload Jobs Queue 跑长任务：重试、编排、定时都省了&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;AI 工作流常有“慢”和“不稳定”：Embedding 生成、文档扫描、分段处理、失败重试……在 serverless 环境尤其麻烦。Payload 的 Jobs Queue 提供：&lt;br /&gt;&lt;br /&gt;•   任务与工作流编排&lt;br /&gt;•   重试与调度&lt;br /&gt;•   可用 Vercel CRON 或其他调度器触发&lt;br /&gt;&lt;br /&gt;把“队列基础设施”从应用里剥离出来，专注业务流程。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;4) Embedding 直接存进 Payload 的 Postgres（pgvector），再用 Drizzle 查&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;Payload 本身不内建向量字段与索引，但可以用 schema hooks 扩展：&lt;br /&gt;&lt;br /&gt;•   &lt;code&gt;beforeSchemaInit&lt;/code&gt; 增加 &lt;code&gt;vector&lt;/code&gt; 列，让生成的 Drizzle schema 也包含它（全类型化）&lt;br /&gt;•   &lt;code&gt;afterSchemaInit&lt;/code&gt; 创建 HNSW 向量索引、以及 GIN 文本索引（便于混合检索）&lt;br /&gt;&lt;br /&gt;随后即可在 API route / server action / task 里做相似度检索与排序，实现 &lt;mark&gt;RAG&lt;/mark&gt; 的“数据库内闭环”。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;5) 记录 Token 与完整消息：成本可控、行为可追溯&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;为了线上可观测性，作者在 Payload 里建了 &lt;code&gt;TokenUsage&lt;/code&gt; 集合，保存：&lt;br /&gt;&lt;br /&gt;•   输入/输出/总 token（含缓存、推理 token 等）&lt;br /&gt;•   与模型交互的完整 messages（包含 tool calls）&lt;br /&gt;&lt;br /&gt;并通过 Vercel AI SDK 的 &lt;code&gt;onFinish&lt;/code&gt; 钩子自动落库。好处是：复盘提示词与输出、定位异常、优化成本都有依据。&lt;br /&gt;&lt;br /&gt;结论很明确：AI 应用要“能跑、能改、能查、能追踪”，需要的不只是模型能力，更是把配置、数据与运行时纳入同一套可运营系统。&lt;br /&gt;&lt;br /&gt;原文链接：&lt;a href=&quot;https://finly.ch/engineering-blog/916926-building-ai-native-applications-with-payload-cms-and-the-vercel-ai-sdk&quot; target=&quot;_blank&quot;&gt;https://finly.ch/engineering-blog/916926-building-ai-native-applications-with-payload-cms-and-the-vercel-ai-sdk&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23PayloadCMS&quot;&gt;#PayloadCMS&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23VercelAISDK&quot;&gt;#VercelAISDK&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AInative&quot;&gt;#AInative&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23RAG&quot;&gt;#RAG&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%8F%AF%E8%A7%82%E6%B5%8B%E6%80%A7&quot;&gt;#可观测性&lt;/a&gt;&lt;a href=&quot;https://finly.ch/engineering-blog/916926-building-ai-native-applications-with-payload-cms-and-the-vercel-ai-sdk&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;finly.ch&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Finly - Building AI-Native Applications with Payload CMS and the Vercel AI SDK&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/gz2yxXAA2pavLI-cqUie94tqymG2zYmexLNC2bd7hAX0mlEkArkOmUAq9W_nykM1kYCBdmHWYeDPXqB3XEfuRxadQc1K2fu4sf6cemUD0f9y3zj4Y8Ex3-5l78UuCZU_BT_UERNnUq8oEk99J1UEuQmJa63bdpxuD9K5rmak3OiOqEXiYiZl9QA_3YfFbl_4HF2OU4t35DBrIsryf5Wsn_ycHlNbr7kt-fZIPlf-Qhm7mP1Jy6rFEl55D6fgjFooapF4sOGZJn_YSNWR3illulcOCH80Rf-d8rR_1h5gue3rgwVlFuoP_6RM6cuZ_eX_yHkElRGSYziXKliK0fWs1g.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Finly - Building AI-Native Applications with Payload CMS and the Vercel AI SDK&lt;/div&gt;
  &lt;div&gt;How we build AI-native FinSureTech applications at InnoPeak using Payload CMS and the Vercel AI SDK—breaking down real-world patterns for prompts, workflows, and AI-powered features that support modern financial advisors.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item></channel></rss>