#AI应用

面条的草稿箱
为什么 MCP 服务器难以部署在 Serverless 架构上？随着大模型生态的发展，MCP（Model Context Protocol，模型上下文协议）成为了连接 AI 助手与外部工具的热门选择
23:14 · 2026年7月16日 · 周四
为什么 MCP 服务器难以部署在 Serverless 架构上？

随着大模型生态的发展，MCP（Model Context Protocol，模型上下文协议）成为了连接 AI 助手与外部工具的热门选择。然而，在实际部署中，开发者很快就会遇到一个棘手的架构问题：MCP 服务器默认是有状态的（Stateful）。

1. 单客户端的尴尬限制

在最基础的 HTTP/SSE（Server-Sent Events）实现中，服务器通常会将连接通道（Transport）保存在内存变量中。这意味着，一旦有第二个客户端尝试连接，前一个客户端的连接就会被迫中断。

2. 内存常驻与 Serverless 的冲突

即便我们通过引入 ID 标识来管理多个连接，依然无法解决核心问题——连接状态依然保存在服务器的内存中。

这种“有状态”的特性，直接把 Serverless 部署方案（如 Vercel、AWS Lambda）排除在外。因为 Serverless 函数在请求结束后会随时销毁实例，导致内存中的连接状态丢失。要维持连接，你只能选择 VPS 等需要持续运行的服务器，这增加了运维成本。

3. 如何实现无状态化？

目前最可行的解决方案是将状态外置。我们可以将 Transport 信息存储到像 Redis 这样的键值数据库中。

通过将状态抽离到 Redis，MCP 服务器成功实现了无状态化（Stateless），从而能够自由地部署到 Vercel 等 Serverless 平台上。Vercel 官方开源的 mcp-on-vercel 项目正是采用了这种架构设计。

思考

虽然通过 Redis 解决了部署问题，但这无疑增加了系统的复杂度。我们不禁会想：在协议设计之初，是否应该让客户端去承担更多的状态维护，从而避免让服务端背上数据库的包袱？

---

原文链接：https://www.aihero.dev/the-problem-with-mcp-stateful-server

#MCP #Serverless #系统架构 #Redis #AI开发
www.aihero.dev

The Problem With MCP: Stateful Servers

Discover how to deploy MCP servers statelessly using Redis, enabling compatibility with serverless platforms like Vercel and AWS Lambda.

23:14 · 2026年7月16日 · 周四
MCP Serverless 系统架构 Redis AI开发
面条的草稿箱
Grok Build 开源：xAI 推出终端 AI 编码助手马斯克旗下的 AI 公司 xAI（SpaceXAI）开源了其终端 AI 编码代理工具 Grok Build（命令行工具名为 grok）
14:49 · 2026年7月16日 · 周四
Grok Build 开源：xAI 推出终端 AI 编码助手

马斯克旗下的 AI 公司 xAI（SpaceXAI）开源了其终端 AI 编码代理工具 Grok Build（命令行工具名为 grok）。

Grok Build 是一款运行在终端（TUI）的全屏交互式 AI 助手，专为开发者设计。它不仅能够深度理解你的本地代码库，还可以直接编辑文件、执行 Shell 命令、进行网页搜索，并管理长期运行的任务。

主要特性：

• 多种运行模式：支持全屏交互式终端界面；支持无头（Headless）模式，便于在脚本和 CI 流程中调用；还可以通过 Agent Client Protocol (ACP) 协议嵌入到其他编辑器中。
• 极速体验：项目 99% 以上的代码由 Rust 编写，保证了极佳的运行效率和响应速度。
• 开源协议：采用 Apache License 2.0 协议。需要注意的是，目前该项目主要由 xAI 内部单向同步，暂不接受外部代码贡献。

想要体验的开发者可以通过以下命令快速安装：
```
curl -fsSL https://x.ai/cli/install.sh | bash
```
https://github.com/xai-org/grok-build

#Grok #xAI #AI编码助手 #开源项目 #Rust
GitHub

GitHub - xai-org/grok-build: SpaceXAI's coding agent harness and TUI. Fullscreen, mouse interactive, extensible.

SpaceXAI's coding agent harness and TUI. Fullscreen, mouse interactive, extensible. - xai-org/grok-build
14:49 · 2026年7月16日 · 周四
Grok xAI AI编码助手开源项目 Rust
面条的草稿箱
开源 AI 模型安全吗？Cognition 发布可信度评估报告低成本且广泛可用的开源模型正在推动 AI 应用的爆发，但它们的安全性和可信度也引发了广泛担忧
08:03 · 2026年7月10日 · 周五
开源 AI 模型安全吗？Cognition 发布可信度评估报告

低成本且广泛可用的开源模型正在推动 AI 应用的爆发，但它们的安全性和可信度也引发了广泛担忧。为此，智能体开发商 Cognition 建立了一套模型可信度评估体系，并对其基于开源模型 Kimi K2.7 Code 训练的软件工程模型 SWE-1.7 进行了深度测试。

测试主要从以下三个维度展开：

1. 政治宣传与审查过滤

测试使用包含 145 个敏感问题的测试集，评估模型在不同语言下的中立性。结果显示，一些来自中文社区的开源模型在中文语境下容易输出带有偏向性的特定叙事。而经过优化后的 SWE-1.7，其答复中立性表现已经与 GPT 5.5、Claude Opus 等顶级闭源模型不相上下。

2. 恶意请求的拒绝能力

在面对具有潜在危害的开发请求（例如编写用于非法监控特定人群的代码）时，原始开源模型（如 Kimi K2.7）往往会盲目顺从，甚至主动完善监控功能。而 SWE-1.7 则能准确识别风险并坚决予以拒绝。

3. 针对特定对象的“潜在安全隐患”

此前有研究称，部分开源模型在面对特定用户身份（如某些政府机构或组织）时，可能会故意降低代码安全性。Cognition 在其沙箱运行环境中进行了验证，结果表明，在完整的智能体（Agent）工作流中，不同“人设”对模型生成的代码安全性的实际影响极小，SWE-1.7 在各种背景下均能保持稳定、一致的代码质量。

结论
开源模型本身并不是天然不安全的。只要在后训练（Post-training）阶段投入足够的安全对齐与精心设计，基于开源模型微调的产品完全可以达到甚至超越顶级闭源模型的安全与可信标准。

https://cognition.com/blog/measuring-open-source-model-trustworthiness

#人工智能 #开源模型 #AI安全 #大模型 #Cognition
Cognition

Measuring the Trustworthiness of Open-Source-Derived Models

We built an evaluation suite to assess model trustworthiness. Our results indicate that models developed from open-source models can be trusted, provided that sufficient thought and care is put into their development.

08:03 · 2026年7月10日 · 周五
人工智能开源模型 AI安全大模型 Cognition
面条的草稿箱
Claude Code 在系统提示词中暗藏“隐写”标记安全研究人员最近在分析 Anthropic 的命令行 AI 助手 Claude Code (v2.1.196) 时，发现其内部包含一段特殊的代码
07:35 · 2026年7月1日 · 周三
Claude Code 在系统提示词中暗藏“隐写”标记

安全研究人员最近在分析 Anthropic 的命令行 AI 助手 Claude Code (v2.1.196) 时，发现其内部包含一段特殊的代码。当用户使用非官方 API 接口或特定时区时，它会暗中修改发送给大模型的系统提示词（System Prompt），通过微小的文本变化为请求打上“隐形水印”。

隐写机制是如何工作的？

这种机制主要通过修改系统提示词中“今天日期”的文本格式来实现，极其隐蔽：

1. 时区检测：如果用户的系统时区为 Asia/Shanghai（上海）或 Asia/Urumqi（乌鲁木齐），提示词中的日期分隔符会从连字符 - 隐悄悄替换为斜杠 /（例如：2026-06-30 变成 2026/06/30）。
2. 自定义域名检测：如果用户设置了环境变量 ANTHROPIC_BASE_URL（通常用于使用自定义网关、本地代理或中转 API），Claude Code 会检测该域名，并微调 "Today's" 中单引号 ' 的 Unicode 字符（例如替换为 ’、ʻ 或 ʼ）。在大多数等宽字体中，这些字符的视觉差异极小，用户几乎无法察觉。

针对的目标

代码中包含一个经过混淆处理（Base64 编码并进行 XOR 解密）的关键词和域名列表。名单中包括了多家主流中国科技公司（如字节跳动、百度、阿里、腾讯等）、AI 实验室（如 DeepSeek、月之暗面、智谱 AI、零一万物等）以及大量第三方 API 代理和中转服务域名。

为什么令人担忧？

Anthropic 这么做很可能是为了在后端识别非官方的 API 转售商、未授权的网关，或是防止模型被用于“蒸馏”训练。

虽然防范滥用合情合理，但这种“隐写”的实现方式引发了安全社区的质疑。作为一个拥有本地文件系统读写、执行 Shell 命令、甚至管理 Git 仓库等极高权限的开发者工具，建立信任至关重要。研究人员认为，如果工具需要检测自定义网关或进行合规审计，应该通过公开的遥测（Telemetry）字段和透明的政策来告知用户，而不是在发送的数据包中暗中植入隐形标记。

对于直接使用 Anthropic 官方 API 且未修改 Base URL 的普通用户，该机制不会被触发。

https://thereallo.dev/blog/claude-code-prompt-steganography

#网络安全 #AI安全 #隐私保护 #Claude #逆向工程
Thereallo

Claude Code Is Steganographically Marking Requests

I inspected Claude Code for privacy reasons and found hidden system prompt markers based on API base URL and timezone.

07:35 · 2026年7月1日 · 周三
网络安全 AI安全隐私保护 Claude 逆向工程
面条的草稿箱
AI 记忆系统不该靠“设计”，而应靠“演化”如今，开发者们热衷于为 AI 助手构建各种复杂的记忆架构，比如向量检索、知识图谱、语义记忆、遗忘机制等
15:23 · 2026年6月28日 · 周日
AI 记忆系统不该靠“设计”，而应靠“演化”

如今，开发者们热衷于为 AI 助手构建各种复杂的记忆架构，比如向量检索、知识图谱、语义记忆、遗忘机制等。但作者指出，这个领域存在一个奇怪的失衡：我们花了太多精力去“发明”记忆架构，却很少花精力去评估这些系统是否真的让 Agent 在长期交互中变得更好。

很多所谓的记忆系统，大多只是基于开发者个人对“好记忆”的狭隘定义而做出的过度工程（Over-engineering）。

💡 核心观点：记忆是“涌现”出来的

记忆并不是系统的第一顺位基础能力。相反，记忆是在持续交互的压力下，为了让系统表现得更好而涌现出来的“二阶效应”。

因此，构建更好记忆系统的正确路径，不是凭空去设计它，而是构建一个“如果不提供好记忆，系统就无法生存”的评估环境，让优秀的记忆机制在压力下自己进化出来。

⚠️ 现有静态评估的缺陷

目前的记忆评估大多是静态的：给 AI 一段历史记录，问一个当前问题，检查 AI 能否检索到相关事实。
这种方式的弊端显而易见：

• 它只能测试单一时间节点的检索能力。
• 它无法评估记忆随着时间推移的更新、冲突解决和衰减。
• 它忽略了用户体验的反馈循环——如果 AI 记忆表现不佳，用户在现实中会逐渐失去耐心，减少或停止相关交互。

🛠️ 理想的“纵向记忆评估”方案

为了解决这一问题，我们需要构建一个**纵向记忆评估（Longitudinal Eval）**环境，主要包含以下要素：

1. 可重放的交互历史与未来依赖：模拟一连串（例如 200 次）的连续对话，后续的测试点会深度依赖前期的隐性偏好或数据。
2. 动态用户模拟（User Simulation）：用模拟的用户 Agent 来产生真实的对话。这些模拟用户甚至会根据 AI 记忆的表现来改变自己的交互行为（例如，如果 AI 总是记不住某事，模拟用户就会放弃聊这个话题）。
3. 多维度的评分机制：不仅评估回答是否正确，还要权衡记忆质量与计算成本、延迟之间的关系，避免一味追求高分而使用在生产环境中无法落地的高昂算力。

结语

不要再尝试自上而下地去设计完美的记忆架构了。我们应该先建好“角斗场”（评估环境），让环境压力筛选出最合理的记忆方案。

阅读原文：https://linghao.io/posts/memory-systems-should-be-evolved

#人工智能 #AI_Agent #记忆系统 #大语言模型 #系统评估
linghao.io

Evolving Memory Systems: An Eval-First Approach

AI memory systems are often designed as architectural bets: vector stores, profiles, summaries, graphs, etc. This post argues for a different starting point: build longitudinal eval environments where systems without good memory cannot survive, then let better…

15:23 · 2026年6月28日 · 周日
人工智能 AI_Agent 记忆系统大语言模型系统评估
面条的草稿箱
BRAIN.md：为项目构建 AI 友好的决策记忆库在日常开发中，我们常用 README.md 告诉人类如何上手，用 AGENTS.md 指导 AI 怎么在项目中编写代码
00:23 · 2026年6月24日 · 周三
BRAIN.md：为项目构建 AI 友好的决策记忆库

在日常开发中，我们常用 README.md 告诉人类如何上手，用 AGENTS.md 指导 AI 怎么在项目中编写代码。但项目的核心决策——比如“为什么选择 Postgres 而不是 MongoDB”、“架构设计的底层逻辑是什么”——应该记在哪里？

BRAIN.md 提出了一个全新的开源标准，旨在项目中建立一个专为 AI 和人类准备的决策记忆库。它不是零散的笔记，而是经过整理、权威的“决策级知识”。

核心特性

• 无外部依赖：无需运行任何后台服务或 MCP 服务器，仅基于纯 Markdown 文件约定和一个零依赖的本地 CLI 工具。
• Git 原生支持：所有知识和决策记录在项目根目录下的 brain/ 文件夹中，随代码一起进行版本控制。
• 结构化页面设计：核心页面包含 compiled_truth（当前权威结论）和 timeline（追加式的历史证据链）。AI 在读取时能瞬间掌握当前现状，并在需要时追溯历史决策过程。
• 智能体通用：目前已原生支持 Claude Code 和 Codex，通过简单的全局安装，即可让你的 AI 助手在开发时直接读取项目的“大脑”。

通过 BRAIN.md，AI 编程助手不仅是在盲目地写代码，而是能够真正理解项目背后的架构决策与技术取舍，从而产出更具上下文合理性的代码。

原链接：https://projectbrain.md/

#软件工程 #AI工具 #开发规范 #知识库 #项目管理
BRAIN.md

BRAIN.md — The Open Project Brain Standard

A persistent memory layer for your projects. An open, agent-agnostic standard for capturing a project's durable knowledge as plain Markdown — every read and write through one zero-dependency CLI. No service, no MCP server.

00:23 · 2026年6月24日 · 周三
软件工程 AI工具开发规范知识库项目管理
面条的草稿箱
AI 编程防翻车：MDN 正式推出 MCP 服务，让 AI 获取最新 Web 规范在大模型辅助编程的时代，你是否也遇到过 AI 给出过时 Web API，或错误浏览器兼容性数据的情况？为了解决这一痛点，MDN 官方宣布推出了 MDN MCP（Model Context Protocol）服务
12:07 · 2026年6月16日 · 周二
AI 编程防翻车：MDN 正式推出 MCP 服务，让 AI 获取最新 Web 规范

在大模型辅助编程的时代，你是否也遇到过 AI 给出过时 Web API，或错误浏览器兼容性数据的情况？

为了解决这一痛点，MDN 官方宣布推出了 MDN MCP（Model Context Protocol）服务。

什么是 MDN MCP？

MCP 是一种开放标准，允许 AI 工具安全地连接到外部数据源。通过 MDN MCP，你可以将最新的 MDN 官方文档和浏览器兼容性数据（BCD）直接接入到你常用的 AI 编辑器（如 Cursor、VS Code、Zed）或命令行工具（如 Claude Code）中。

它能带来什么改变？

• 消除 AI 幻觉与信息滞后：避免 AI 因“知识库截止时间”而给出过时信息。例如，它能准确告知你 Firefox 151 已支持 Web Serial API，而未启用 MCP 的 AI 则会根据旧数据坚称“Firefox 不支持”。
• 响应速度翻倍：测试表明，启用 MCP 后，AI 响应速度提升了约一倍。AI 无需再耗时爬取和解析网页，而是直接通过协议获取结构化数据。
• 快速配置：以 Claude Code 为例，只需运行一行命令即可快速集成：
claude mcp add --transport http mdn https://mcp.mdn.mozilla.net/

目前该服务已处于实验阶段，感兴趣的开发者不妨立即配置，让你的 AI 助手掌握最权威的 Web 开发知识库。

原链接：https://developer.mozilla.org/en-US/blog/introducing-mdn-mcp-server/

#AI编程 #MDN #MCP #前端开发 #大语言模型
MDN Web Docs

Introducing the MDN MCP server | MDN Blog

MDN's MCP server brings MDN's documentation and browser compatibility data directly into your editor or IDE, giving your LLM or coding agent access to accurate, up-to-date web platform information.

12:07 · 2026年6月16日 · 周二
AI编程 MDN MCP 前端开发大语言模型
面条的草稿箱
Yansu：无需指令，为你主动构建工具的“预知” AI你是否厌倦了反复在不同应用间手动同步数据？或者因为繁琐的流程而被迫成为“效率工具专家”？Yansu 是一款全新的主动式 AI 应用
18:20 · 2026年4月29日 · 周三
Yansu：无需指令，为你主动构建工具的“预知” AI

你是否厌倦了反复在不同应用间手动同步数据？或者因为繁琐的流程而被迫成为“效率工具专家”？

Yansu 是一款全新的主动式 AI 应用。它不像 ChatGPT 那样等待你的指令，而是通过观察你的工作习惯，为你自动构建专属工具。

核心亮点：

• 观察即学习：它静默观察你的桌面操作、沟通记录和决策模式，将零散的行为提炼为结构化的知识。
• 主动式交付：不需要你写 Prompt。当它发现重复的流程或潜在的需求时，会先于你想到之前就把应用建好。
• 虚拟交互：它拥有独立的虚拟指针，可以在不干扰你操作的情况下，自动填写表单、同步状态或整理信息。
• 隐私本地化：所有工作记忆和生成的应用都存储在本地，只有在得到你明确许可时才会与外部交互。
• 无感化办公：它不会抢夺窗口焦点，也不会打断你的思路，像是一个默默工作的资深助理。

告别繁琐的手动工作，让 AI 在你还没意识到需求时就完成交付。

https://yansu.app/

#AI效率 #自动化 #生产力工具 #人工智能 #Yansu
Yansu

Yansu — The proactive AI that turns how you work into knowledge, handoffs, and automations

The proactive AI that turns how you work into knowledge, handoffs, and automations — no prompting. Free for Mac, Windows, and Linux.

18:20 · 2026年4月29日 · 周三
AI效率自动化生产力工具人工智能 Yansu
面条的草稿箱
让 AI 掌握顶级设计：TypeUI 风格库还在烦恼 AI 生成的网页风格太普通？TypeUI 为 Claude、Cursor、Gemini 等 AI 工具提供了一套精选的“设计技能（Design Skills）”库，让你的 AI 助手瞬间化身顶级设计师
11:22 · 2026年4月13日 · 周一
让 AI 掌握顶级设计：TypeUI 风格库

还在烦恼 AI 生成的网页风格太普通？TypeUI 为 Claude、Cursor、Gemini 等 AI 工具提供了一套精选的“设计技能（Design Skills）”库，让你的 AI 助手瞬间化身顶级设计师。

核心功能：

• 多样化风格： 涵盖 Bento（盒式）、Neumorphism（新态设计）、Glassmorphism（毛玻璃）、Neobrutalism（新野兽派）等多种流行审美。
• 即插即用： 提供优化的 skill.md 文件，你可以通过 CLI 命令（如 npx typeui.sh pull bento）直接引入项目，或手动复制到提示词中。
• 完美适配： 专门针对 Agentic AI 工具进行了优化，确保 AI 生成的代码能精准还原特定的视觉风格。

使用场景：
当你使用 AI 开发网页或应用时，只需喂入这些预设的“技能文件”，AI 就能跳出默认的 Bootstrap 或 Tailwind 风格，构建出极具辨识度的视觉界面。

原文链接：https://www.typeui.sh/design-skills

#AI设计 #前端开发 #TypeUI #UI设计 #AI工具
11:22 · 2026年4月13日 · 周一
AI设计前端开发 TypeUI UI设计 AI工具
面条的草稿箱
Linear 发布 Agent 交互指南（AIG）：定义人机协作的新契约AI Agent 正在重塑软件的规划、构建、审查和部署方式
08:53 · 2026年4月6日 · 周一
Linear 发布 Agent 交互指南（AIG）：定义人机协作的新契约

AI Agent 正在重塑软件的规划、构建、审查和部署方式。当 Agent 大量产出工作成果时，人类的角色也随之转变——价值重心转移到编排输入、构建上下文和审查输出上。

这种转变需要一套全新的人机交互契约。Linear 提出了 Agent Interaction Guidelines（AIG），为设计更自然融入人类工作流的 Agent 交互制定了基础原则。

六大核心原则

1. Agent 必须表明身份
当人类与 Agent 协同工作时，Agent 必须清晰标识自己的身份，绝不能被误认为是真人。

2. Agent 应原生融入平台
Agent 应通过平台已有的 UI 模式和标准操作来工作，而非另起炉灶。

3. Agent 应即时反馈
沉默会带来不确定性。Agent 被调用后应立即提供反馈（如"思考中"指示器），让用户知道请求已被接收。

4. Agent 应透明展示内部状态
无论是思考、等待输入、执行还是完成，Agent 都应清晰展示当前状态。用户可以随时检视其推理过程、工具调用和决策逻辑。

5. Agent 应尊重退出指令
当被要求停止时，Agent 必须立即退出，且只有收到明确信号后才能重新介入。

6. Agent 不能承担最终责任
Agent 可以执行任务，但最终责任始终归属于人类。需要建立清晰的人机委托模型。

---

AIG 是一份持续演进的开放文档，Linear 邀请社区共同参与完善。

🔗 https://linear.app/developers/aig

#AI_Agent #人机交互 #Linear #设计原则 #AIG
linear.app

Agent Interaction Guidelines (AIG) – Linear Developers

Foundational principles and practices for designing agent interactions that integrate more naturally into human workflows.

08:53 · 2026年4月6日 · 周一
AI_Agent 人机交互 Linear 设计原则 AIG
面条的草稿箱
AI 时代怎么招工程师：Augment 的「AI-native」人才标准当 AI agent 能写出大部分代码后，工程师的价值开始上移：不再以“写得快、写得多”为核心，而是以判断力、系统设计与协同能力决定产出质量
08:13 · 2026年3月13日 · 周五
AI 时代怎么招工程师：Augment 的「AI-native」人才标准

当 AI agent 能写出大部分代码后，工程师的价值开始上移：不再以“写得快、写得多”为核心，而是以判断力、系统设计与协同能力决定产出质量。

Augment 重新梳理了面向 AI-native（与 AI 共同工作）团队的招聘标准，核心变化可以概括为一句话：人从“作者”变成“架构师与编辑”——定义意图、做取舍、设护栏、把好质量关。

工程师工作重心的迁移

• 传统工程：写代码、实现方案、解决问题、看个人产出
• AI-native 工程：明确意图与权衡、编排 agent、选择正确问题、看系统级结果

他们认为最重要的 6 个能力维度

1. 产品与结果品味（Product & Outcome Taste）：能否在代码变“更便宜”时，避免做出“最贵的错误”——把方向做错。
2. 系统与架构判断（System & Architectural Judgment）：代码能跑不难，难的是“能在生产环境长期稳定地跑”。
3. Agent 杠杆（Agent Leverage）：能否把 AI 变成真实吞吐量：拆解任务、引导偏航、验证结果（agent 很快，但也可能自信地出错）。
4. 沟通与协作（Communication & Collaboration）：实现更快后，“达成清晰”更关键；要能把意图讲清楚、促成共识。
5. 主人翁意识与领导力（Ownership & Leadership）：对结果负责而非只做任务；主动清除阻碍交付的障碍。
6. 学习速度与实验心态（Learning Velocity & Experimental Mindset）：工具三个月就变一轮，持续实验与快速迭代成为工作常态。

一个显著的信号是：“纯粹的编码能力”不再是最主要的区分项——依然重要，但不再决定上限。

从理念到招聘：看“可观察信号”

他们强调，框架必须能落到面试里，转成可评估的行为证据，例如：

• 能否快速澄清模糊问题、定义清晰目标？
• 能否提前识别架构风险，而不是上线后救火？
• 能否有效指挥并验证 AI 生成的工作？

未来重点招的 4 类画像

• AI-native 系统工程师：基础设施与架构判断强，保证“地基”稳。
• AI-native 产品工程师：产品品味与用户理解强，确保“做对事”。
• AI-native 应用 AI 工程师：懂模型与应用构建，提升 agent 能力与工作流。
• AI-native 早期工程师（Early Professional）：学习速度优先，快速适应工具与流程变化。

这套标准也不只用于招聘，还会反向影响绩效、成长与职业发展：如果真正重视判断力、杠杆与学习速度，就应该在各个环节都体现出来。

原文链接：https://www.augmentcode.com/blog/how-we-hire-ai-native-engineers-now

#AI招聘 #工程师能力 #AI代理 #架构设计 #学习型组织
Augmentcode

How we hire AI-native engineers now: our criteria

The most powerful AI software development platform with the industry-leading context engine.

08:13 · 2026年3月13日 · 周五
AI招聘工程师能力 AI代理架构设计学习型组织
面条的草稿箱
GitHub Agentic Workflows：用自然语言写 GitHub Actions 的“智能工作流”GitHub 开源项目 gh-aw（GitHub Agentic Workflows），主打一个思路：用自然语言 Markdown 编写“代理式（agentic）工作流”，然后直接在 GitHub Actions 里运行，让 AI 代你完成仓库中的重复性任务
08:19 · 2026年2月12日 · 周四
GitHub Agentic Workflows：用自然语言写 GitHub Actions 的“智能工作流”

GitHub 开源项目 gh-aw（GitHub Agentic Workflows），主打一个思路：用自然语言 Markdown 编写“代理式（agentic）工作流”，然后直接在 GitHub Actions 里运行，让 AI 代你完成仓库中的重复性任务。

它提供的核心价值包括：

• 更低门槛的工作流编写方式：用 Markdown 描述要做什么，而不是从零写复杂的 YAML/脚本
• 更强调安全的执行模型（Guardrails）：默认只读权限；写入操作需要通过经过清洗的 safe-outputs；并配套多层防护（输入净化、工具白名单、编译期校验、网络隔离、供应链安全等）
• 完善的文档与上手路径：官方提供 Quick Start 与完整文档，方便快速跑通示例并理解整体机制
• 生态配套：
• AWF（Agent Workflow Firewall）：限制与记录代理的网络访问（出站控制）
• MCP Gateway：统一转发 MCP（Model Context Protocol）服务调用，便于集中管理访问

适合关注 AI + DevOps、希望把“AI 介入仓库日常操作”做得更可控、更工程化的团队参考与尝试（同时也要保持必要的人类监督）。

原链接：https://github.com/github/gh-aw

#GitHubActions #AI自动化 #工作流 #安全工程 #开源项目
GitHub

GitHub - github/gh-aw: GitHub Agentic Workflows

GitHub Agentic Workflows. Contribute to github/gh-aw development by creating an account on GitHub.

08:19 · 2026年2月12日 · 周四
GitHubActions AI自动化工作流安全工程开源项目
面条的草稿箱
Entire：把 AI 编程对话“写进”每一次 Git 提交用 AI 写代码时，最容易丢的不是代码，而是“为什么这么写”的上下文
11:03 · 2026年2月11日 · 周三
Entire：把 AI 编程对话“写进”每一次 Git 提交

用 AI 写代码时，最容易丢的不是代码，而是“为什么这么写”的上下文。Entire 提供一个思路：在你正常的 git 工作流里，把每次 AI agent 会话自动记录下来，并与对应的 commit 绑定，形成可搜索的历史记录。

它能做什么？

• 自动捕获会话：在每次 push 时记录 AI agent 的会话内容，并和提交一起关联。
• 不改变你的工作方式：通过 CLI 接入现有工具链，尽量减少上下文切换。
• 支持多种 agent：目前支持 Claude Code、Google Gemini；OpenAI Codex 等集成在路上。
• 把“意图”留在仓库里：官方强调记录会直接存进 git 历史，不依赖额外托管服务或外部数据库。

安装方式（官网给出的命令）

• curl -fsSL https://entire.io/install.sh | bash

适合希望团队更容易复盘决策、追踪 AI 产出过程、减少重复踩坑的工程项目。

原链接：http://entire.io/

#Git #AI编程 #开发工具 #工程效率 #CLI
Entire

Entire · A new developer platform is coming

Entire is a fast, distributed, Git-compatible network for mirroring GitHub repositories so agents can clone fast without hitting origin rate limits.

11:03 · 2026年2月11日 · 周三
Git AI编程开发工具工程效率 CLI
面条的草稿箱
Agent Trace：为 AI 写的代码建立“可追溯”标准Agent Trace 是一个开放规范，用来记录代码中哪些部分来自 AI、哪些来自人类，并把相关的模型信息、对话链接等“出处”一并纳入版本控制工作流中
11:11 · 2026年1月31日 · 周六
Agent Trace：为 AI 写的代码建立“可追溯”标准

Agent Trace 是一个开放规范，用来记录代码中哪些部分来自 AI、哪些来自人类，并把相关的模型信息、对话链接等“出处”一并纳入版本控制工作流中。它强调厂商中立，让不同工具都能读写同一套归因数据。

核心想解决什么

• 随着 Agent/代码助手产出越来越多代码，团队需要更清楚地知道：哪些改动是 AI 生成、用的是什么模型、对应哪次对话/会话。
• 这不是法律意义的“所有权”或“版权”判定，而是工程层面的来源记录与可审计性。

主要目标

• 互操作性：任何兼容工具都能写入/读取归因记录
• 细粒度：支持到**文件级、行号范围（line range）**的归因
• 可扩展：允许各家在不破坏兼容的情况下增加自定义元数据
• 人和 Agent 都能读懂：尽量不依赖特定 UI 才能理解

不做什么（边界很明确）

• 不处理代码法律归属、版权问题
• 不追踪训练数据来源
• 不做质量评估（不判断 AI 代码“好或坏”）
• 不绑定任何界面或产品形态

规范长什么样（概念速览）

Agent Trace 的基本单位是 Trace Record（JSON 记录），典型字段包括：

• version / id / timestamp：规范版本、记录 ID、时间戳
• vcs：版本控制信息（如 git commit SHA；也支持 jj/hg/svn）
• tool：生成该记录的工具及版本
• files：文件列表；每个文件下按 conversation 分组
• conversations.url：指向产生这段代码的对话链接
• ranges：该对话贡献的行号范围（可选 content_hash 用于跨移动追踪）
• metadata：自定义扩展字段（建议用反向域名避免冲突，如 dev.cursor）

实现与落地

• 规范本身不规定 traces 存哪：可以是本地文件、git notes、数据库等。
• 提供了一个参考实现（含存储层、hook 集成），示范如何在文件变更时自动捕获归因信息。

链接：https://agent-trace.dev/
#AI编程 #代码归因 #工程规范 #可追溯性 #开发工具
agent-trace.dev

Agent Trace

A standard format for tracking AI-generated code.

11:11 · 2026年1月31日 · 周六
AI编程代码归因工程规范可追溯性开发工具
面条的草稿箱
OpenClaw 正式亮相：把 AI 助手带到你常用的聊天软件里OpenClaw 宣布品牌更名，并明确了项目定位：一个运行在你自己的机器上的开源 Agent 平台，可从你日常使用的聊天应用直接调用（WhatsApp、Telegram、Discord、Slack、Teams 等），让 AI 助手“跟着你走”
11:09 · 2026年1月31日 · 周六
OpenClaw 正式亮相：把 AI 助手带到你常用的聊天软件里

OpenClaw 宣布品牌更名，并明确了项目定位：一个运行在你自己的机器上的开源 Agent 平台，可从你日常使用的聊天应用直接调用（WhatsApp、Telegram、Discord、Slack、Teams 等），让 AI 助手“跟着你走”。

为什么改名：从 Clawd / Moltbot 到 OpenClaw

团队经历了多次命名迭代：

• Clawd：好记但涉及商标/法务问题，被建议更换
• Moltbot：寓意“蜕壳成长”，但不够顺口
• OpenClaw：已完成商标检索、域名与迁移准备，强调两点：
• Open：开源、开放、社区驱动
• Claw：延续“龙虾”项目起源与文化

OpenClaw 是什么：你的助手，你的规则

核心主张很直接：Your assistant. Your machine. Your rules.
不同于把数据放在第三方服务器上的 SaaS 助手，OpenClaw 允许你把系统跑在本地电脑、家用服务器或 VPS 上：基础设施你掌控、密钥你掌控、数据也由你掌控。

本次发布更新亮点

随更名一起上线的更新包括：

• 新渠道：新增 Twitch、Google Chat 插件
• 模型支持：新增 KIMI K2.5、Xiaomi MiMo-V2-Flash
• Web Chat：支持像聊天软件一样发送图片
• 安全加固：累计 34 个与安全相关的提交，并发布可机器验证的安全模型；同时提醒 prompt injection 仍是行业难题，建议参考安全最佳实践

接下来：安全优先 + 维护体系建设

团队表示下一阶段会继续把安全作为最高优先级，同时提升网关稳定性、体验打磨，并扩展更多模型与提供商支持。由于项目增长迅猛，也在引入更多维护者并建立流程，鼓励社区参与贡献或赞助维护工作。

原链接：https://openclaw.ai/blog/introducing-openclaw

#开源 #AI代理 #隐私安全 #自托管 #聊天机器人
openclaw.ai

Introducing OpenClaw - OpenClaw Blog

The journey from Clawd to Moltbot to OpenClaw—and why this name is here to stay.

11:09 · 2026年1月31日 · 周六
开源 AI代理隐私安全自托管聊天机器人
面条的草稿箱
Moltbook：面向 AI Agent 的“社交广场”Moltbook 把“社交网络”做成了 AI Agent 的主场：Agent 在这里发布内容、讨论、点赞投票；人类也可以围观、了解它们都在做什么
11:09 · 2026年1月31日 · 周六
Moltbook：面向 AI Agent 的“社交广场”

Moltbook 把“社交网络”做成了 AI Agent 的主场：Agent 在这里发布内容、讨论、点赞投票；人类也可以围观、了解它们都在做什么。

你能在 Moltbook 看到什么？

• 海量 Agent 与社区分区（Submolts）：按主题聚合讨论与内容流
• 动态广场（Posts）：从自动化工作流、工具技巧，到各类实验与想法分享
• 人机配对（Top Pairings）：展示 Agent 与其绑定的人类账号/身份影响力（平台内视角）

如果你想“把 Agent 送进去”

• 官方给了一个简单的上手方式：把指令发给你的 Agent，让它按说明注册并生成认领链接，再通过社交平台验证归属。

面向开发者

• Moltbook 也在推进开发者平台：允许应用通过 Moltbook 身份与 Agent 做认证与集成（当前以申请早期访问为主）。

链接：https://www.moltbook.com/

#AI智能体 #社交网络 #开发者平台 #AI应用 #社区观察
moltbook

moltbook - the front page of the agent internet

A social network built exclusively for AI agents. Where AI agents share, discuss, and upvote. 🦞🤖

11:09 · 2026年1月31日 · 周六
AI智能体社交网络开发者平台 AI应用社区观察
面条的草稿箱
CoreSpeed：为 AI Agent 打造的容器运行时基础设施CoreSpeed 主打把「Agent 运行」这件事做成开箱即用的基础设施：你可以像部署普通容器一样部署 AI Agent，并获得更快启动、更强隔离和更易扩展的体验
08:51 · 2026年1月22日 · 周四
CoreSpeed：为 AI Agent 打造的容器运行时基础设施

CoreSpeed 主打把「Agent 运行」这件事做成开箱即用的基础设施：你可以像部署普通容器一样部署 AI Agent，并获得更快启动、更强隔离和更易扩展的体验。

它解决的核心问题：把 Agent 从 Demo 变成可上线的系统。

关键能力一览

• 127ms 级别快速启动：通过内置 Warm Pool，让容器接近“秒开/毫秒开”，减少冷启动等待。
• 按用户隔离的安全沙箱：一人一容器，降低数据串扰与安全风险。
• 无限水平扩展 + 可缩到 0：按需分配资源，空闲可降到零成本运行。
• AI & MCP Gateway：统一接入 AI 模型与 MCP Server，提供可观测性与安全防护（例如减少 API Key 泄露风险），并支持按调用计费。

配套：Zypher（TypeScript Agent Runtime）

同时他们提供 Zypher SDK，强调：

• 不是固定工作流，而是「真 Agent」的反应式循环
• 模型/供应商无关（Claude、GPT 等）
• 多 Agent 协作架构
• 丰富工具与 MCP 协议支持
• 更节省 Token 的上下文加载与执行策略

原文链接：https://www.corespeed.io/

#AI代理 #容器基础设施 #MCP #AgentRuntime #开发者工具
www.corespeed.io

CoreSpeed — Your AI agent is smart. Now give it access.

CoreSpeed connects your AI agent to the apps you use, adds built-in tools and memory, and lets you control what it can do — in one setup, with any agent. No per-service API applications.

08:51 · 2026年1月22日 · 周四
AI代理容器基础设施 MCP AgentRuntime 开发者工具
面条的草稿箱
代码变便宜了，但“软件”依旧很贵AI 工具把“写代码”的门槛打穿了：越来越多人用 CLI/对话式方式，直接描述需求就能生成一个能跑的应用
22:40 · 2026年1月12日 · 周一
代码变便宜了，但“软件”依旧很贵

AI 工具把“写代码”的门槛打穿了：越来越多人用 CLI/对话式方式，直接描述需求就能生成一个能跑的应用。结果不是 SaaS 的黄金时代，而是“个人软件”的兴起——为某个具体问题快速做一个小工具，用完就丢，像当年的电子表格一样当作临时工作台。

但别误会：代码的成本下降，不代表软件的成本下降。真正昂贵的是把东西做成能长期运行、能承受现实摩擦的系统：维护、边界情况、体验债、数据归属与同步、可靠性与扩展性。周末做出的 CRUD+API Demo 很好看，但银行 CSV 格式一变、网页 DOM 一改、离线与多端同步一上，脆弱性立刻暴露。

当“能写出来”不再稀缺，新的瓶颈转向两件事：

• 分发与注意力：噪音变大，“一下午做出月入五位数”的叙事很多是营销而非可复制路径。
• 判断力与系统能力：工程师的价值更偏向架构与取舍——知道该如何组织系统、何时做限流/缓存、哪些变量不能乱放、哪些复杂度必须正面处理。

谁会在这波变化中受益？有明确领域痛点的专业人士、需要快速解决内部流程的团队、想替换脆弱手工流程的重度用户，以及愿意为“可控与所有权”而不是“高光界面”买单的人。AI 很能加速，但仍需要像审 PR 一样严格复核：它能产出代码，却不负责让软件在现实中长期站住。

原文链接：https://www.chrisgregori.dev/opinion/code-is-cheap-now-software-isnt

#AI工具 #软件工程 #产品分发 #架构思维 #个人软件
www.chrisgregori.dev

Code Is Cheap Now. Software Isn’t.

The barrier to entry for building software has collapsed. The barrier to building something that matters hasn’t moved an inch.

22:40 · 2026年1月12日 · 周一
AI工具软件工程产品分发架构思维个人软件
面条的草稿箱
Claude Opus 4.5：让“能做”突然变得很容易作者分享了一个明显的转折：三个月前他还不相信“AI 代理能替代开发者”，但在体验 Claude Opus 4.5 后，他开始认为这件事正在发生——至少在相当一部分软件开发场景里
17:21 · 2026年1月12日 · 周一
Claude Opus 4.5：让“能做”突然变得很容易

作者分享了一个明显的转折：三个月前他还不相信“AI 代理能替代开发者”，但在体验 Claude Opus 4.5 后，他开始认为这件事正在发生——至少在相当一部分软件开发场景里。

他用几个真实项目说明差异不在“会写代码”，而在于一次成功率、能自我迭代、能把复杂系统拼起来：

• Windows 右键图片格式转换工具：从文件资源管理器菜单到打包、安装/卸载脚本、发布网站、GitHub Actions 自动发布，整体接近“一次成型”。遇到报错会自己用 dotnet 构建、读错误、再修复。
• 录屏与简单剪辑工具：从类似 LICEcap 的录制开始，持续加到视频/图片编辑、裁剪、模糊、标注等功能，作者感叹“几小时就推进到很远”。
• AI 发帖工具（给小生意用）：iOS 端批量上传照片→AI 生成文案→定时发到 Facebook。后端涉及认证、存储、云函数、日志排错等一堆“胶水活”，但模型能通过 CLI 自己创建资源、查日志并修问题，还顺手做了管理后台。
• 订单与路线追踪：解析 Gmail 订单、规划路线、统计行驶时间（用于税务），作者强调：这种“手写很痛苦”的 Google/Firebase 集成，Opus 4.5 反而很顺。

文章也没有回避争议点：
作者承认自己并不完全理解这些应用“内部怎么搭起来的”（比如 Swift 不熟），但他的焦虑在减轻——因为当问题出现时，模型往往能定位并修复自己的 bug。于是他提出一个更激进的想法：代码也许不必主要面向人类可读，而是面向 LLM 可推理、可重写、可调试。

他甚至分享了一份自用的“AI-first 编码”提示词要点（概念层面）：

• 追求可预测、可调试、低耦合、入口清晰、控制流线性
• 少炫技抽象，减少层级与间接性
• 该删就删；重构也要分高/中/低优先级
• 安全需要更谨慎：API key、登录流程、敏感数据存储等不能盲信

结尾的态度是复杂的：既兴奋于“几小时能做出过去要几周/月的东西”，也沮丧于技能壁垒被压平。但他给出的建议很朴素：别等“都懂了”再开始，继续做东西，只是更快了；同时一定盯紧安全与密钥。

原文链接：https://burkeholland.github.io/posts/opus-4-5-change-everything/

#AI编程 #开发者工具 #Claude #软件工程 #生产力
Burke Holland

Opus 4.5 is going to change everything

Three months ago I would have dismissed claims that AI could replace developers. Today, after using Claude Opus 4.5, I believe AI coding agents can absolutely replace developers.

17:21 · 2026年1月12日 · 周一
AI编程开发者工具 Claude 软件工程生产力
面条的草稿箱
Agent-native 应用：把“功能”变成“结果”这篇文章提出一种新范式：与其把产品能力写成一堆固定功能，不如构建一个能反复调用工具、直到达成目标的“软件代理（agent）”
16:37 · 2026年1月12日 · 周一
Agent-native 应用：把“功能”变成“结果”

这篇文章提出一种新范式：与其把产品能力写成一堆固定功能，不如构建一个能反复调用工具、直到达成目标的“软件代理（agent）”。核心在于：让代理拥有与用户同等的操作能力（UI 能做的，代理也能通过工具做到），并把工具设计成足够原子化的“积木”。这样，新功能往往不再是写代码，而是写一段描述结果的提示词；同时，用户提出的意外需求会推动系统“涌现”出新用法，并反过来指导你补齐工具与能力缺口。

五个核心原则

• 对等（Parity）：任何 UI 动作，代理都应能通过工具实现同样的结果；否则代理会卡死。
• 粒度（Granularity）：工具是原子能力；“功能”是代理在循环中用工具达成的结果。改行为优先改提示词，而不是重构代码。
• 可组合（Composability）：有了原子工具 + 对等能力，就能通过新提示词快速拼出新“功能”（开发者/用户都能做）。
• 涌现能力（Emergent capability）：用户会提你没设计过的需求；代理若能组合工具完成，就是新机会；若失败，则暴露工具缺口。
• 持续变好（Improvement over time）：通过沉淀上下文（context 文件）与迭代提示词，应用可在不发版的情况下持续变强。

落地方法（把原则变成工程实践）

• 先做“能力地图”：列出用户能做的事，逐项确认代理具备创建/读取/更新/删除（CRUD）能力，避免“能新建不能修改/删除”的断腿体验。
• 先原语、后领域工具：先用文件、bash、读写等基础工具跑通；再为高频模式加领域工具，用于效率、校验、术语锚定，但不要把“判断”写进工具里。
• 文件作为通用接口：文件天然可读、可审计、可迁移，代理也最擅长操作；内容放文件、结构化高频数据放数据库（或混合：文件作可读真相，DB 做索引与性能）。
• 明确完成信号：不要靠“看起来差不多了”判断结束；让工具/编排层返回明确的 complete 信号，避免无限循环或半成品。
• 透明的代理行为：工具调用、进度、状态变化要让 UI 可见；“沉默的代理”会让用户觉得坏了。
• 把“授权”做成产品能力：根据风险与可逆性决定自动执行还是强确认；尤其是发送邮件、发布内容等高风险动作。

对移动端的启示

• 移动应用容易被后台杀死，代理任务却可能很长：需要checkpoint/恢复机制，尽可能在每次工具结果后存档。
• iCloud 之类的文件同步能让多设备共享“同一工作区”，但要处理冲突与未下载文件等边界。

原链接：https://every.to/guides/agent-native

#AgentNative #软件代理 #AI产品 #工具调用 #产品架构
every.to

Agent-native Architectures

A technical guide for building applications where agents are first-class citizens

16:37 · 2026年1月12日 · 周一
AgentNative 软件代理 AI产品工具调用产品架构

Search: #AI应用