Skip to main content

Search: #Claude

无原创,纯转发
  1. Claude Opus 4.5:让“能做”突然变得很容易

    作者分享了一个明显的转折:三个月前他还不相信“AI 代理能替代开发者”,但在体验 Claude Opus 4.5 后,他开始认为这件事正在发生——至少在相当一部分软件开发场景里。

    他用几个真实项目说明差异不在“会写代码”,而在于一次成功率、能自我迭代、能把复杂系统拼起来

    Windows 右键图片格式转换工具:从文件资源管理器菜单到打包、安装/卸载脚本、发布网站、GitHub Actions 自动发布,整体接近“一次成型”。遇到报错会自己用 dotnet 构建、读错误、再修复。
    录屏与简单剪辑工具:从类似 LICEcap 的录制开始,持续加到视频/图片编辑、裁剪、模糊、标注等功能,作者感叹“几小时就推进到很远”。
    AI 发帖工具(给小生意用):iOS 端批量上传照片→AI 生成文案→定时发到 Facebook。后端涉及认证、存储、云函数、日志排错等一堆“胶水活”,但模型能通过 CLI 自己创建资源、查日志并修问题,还顺手做了管理后台。
    订单与路线追踪:解析 Gmail 订单、规划路线、统计行驶时间(用于税务),作者强调:这种“手写很痛苦”的 Google/Firebase 集成,Opus 4.5 反而很顺。

    文章也没有回避争议点:
    作者承认自己并不完全理解这些应用“内部怎么搭起来的”(比如 Swift 不熟),但他的焦虑在减轻——因为当问题出现时,模型往往能定位并修复自己的 bug。于是他提出一个更激进的想法:代码也许不必主要面向人类可读,而是面向 LLM 可推理、可重写、可调试

    他甚至分享了一份自用的“AI-first 编码”提示词要点(概念层面):

    • 追求可预测、可调试、低耦合、入口清晰、控制流线性
    • 少炫技抽象,减少层级与间接性
    • 该删就删;重构也要分高/中/低优先级
    • 安全需要更谨慎:API key、登录流程、敏感数据存储等不能盲信

    结尾的态度是复杂的:既兴奋于“几小时能做出过去要几周/月的东西”,也沮丧于技能壁垒被压平。但他给出的建议很朴素:别等“都懂了”再开始,继续做东西,只是更快了;同时一定盯紧安全与密钥。

    原文链接:https://burkeholland.github.io/posts/opus-4-5-change-everything/

    #AI编程 #开发者工具 #Claude #软件工程 #生产力 Opus 4.5 is going to change everything
  2. dotagents:用一个 .agents 目录统一管理各类 AI 工具配置

    dotagents 是一个 CLI/TUI 工具,把项目或全局的 .agents 目录作为“唯一真相源”,自动为不同 AI 工具创建软链接,并支持安装技能(skills)和插件(plugins),方便在多环境之间保持一致配置、可重复执行、易维护。

    你能用它做什么

    • 以 .agents 为中心统一管理:hooks、commands、skills,以及 AGENTS/CLAUDE.md 等说明文件
    • 一键创建软链接,适配多工具(Claude / Codex / Factory)
    • 从本地路径、Git URL、HTTPS URL 安装 skills;并支持从 marketplace 安装 plugins
    • 可随时重复运行,用于补装、修复链接或更新能力集

    快速开始(要求:Bun 1.3+)

    npx @iannuttall/dotagents
    • 或 bunx @iannuttall/dotagents

    链接关系示例

    .agents/AGENTS.md~/.claude/CLAUDE.md
    .agents/commands~/.claude/commands / ~/.factory/commands / ~/.codex/prompts
    .agents/hooks.agents/skills 同步到对应工具目录

    https://github.com/iannuttall/dotagents

    #AI工具 #开发效率 #CLI #Claude #Codex GitHub - iannuttall/dotagents: One location for all of your hooks, commands, skills, and AGENT/CLAUDE.md files.
  3. Claude Diary:让 AI 代理像人类一样从经验中学习

    开发者 Lance Martin 创建了一个名为 Claude Diary 的插件,让 Claude Code 具备了从经验中学习并更新自身记忆的能力——这正是许多 AI 代理所缺乏的"持续学习"能力.

    核心机制:反思式记忆系统

    该插件借鉴了学术研究中的代理记忆框架,采用"生成-反思-整合"的方法:
    • 通过 /diary 命令生成会话日记,记录关键决策、挑战和用户偏好
    • 通过 /reflect 命令分析日记条目,提炼出通用规则并更新到 CLAUDE.md 系统指令文件
    • 自动跟踪已处理的条目,避免重复分析

    实际应用场景

    过去一个月的使用中,Claude Diary 在以下方面表现出色:
    • PR 评审反馈:将代码审查意见转化为持久化规则
    • 工作流偏好:学习用户的 Git 提交风格、分支命名习惯
    • 测试策略:识别出"先跑目标测试快速验证,再跑完整测试套件"的模式
    • 代码质量:避免文件与包目录命名冲突等反模式
    • 自我纠正:发现并强化未被遵守的指令规则

    该插件代码完全开源,命令基于提示词实现,易于定制和扩展.

    原文链接

    #AI代理 #持续学习 #Claude #记忆系统 #开源工具
  4. Hugging Face 推出新工具,让 Claude 帮你微调开源大模型

    Hugging Face 发布了一项名为 “Hugging Face Skills” 的新工具,它赋予了像 Claude 这样的 AI 编码助手直接微调语言模型的能力. 用户现在可以通过简单的自然语言指令,完成从配置到部署的全过程.

    用户只需发出指令,例如:
    Fine-tune Qwen3-0.6B on the dataset trl-lib/Capybara

    AI 助手便会自动处理后续所有步骤:
    - 验证数据集格式
    - 选择合适的硬件并预估成本
    - 提交任务并实时监控进度
    - 训练完成后将模型推送到 Hub

    该工具不仅支持监督微调(SFT)、直接偏好优化(DPO)等多种训练方法,还能将最终模型转换为 GGUF 格式,方便在本地运行.

    这使得模型微调不再是少数专家的专利,而是变成了一项通过对话即可完成的任务,极大地降低了技术门槛.

    阅读原文

    #AI #大语言模型 #HuggingFace #模型微调 #Claude We Got Claude to Fine-Tune an Open Source LLM
  5. 一份被称为“Claude 4.5 Opus Soul Document”的内部文件在 GitHub 上被公开,详细阐述了 Anthropic 公司为其 AI 模型 Claude 设定的核心价值观、行为准则和身份认同。

    这份文件揭示了 Claude 设计背后的深度思考,旨在确保其在提供强大帮助的同时,坚守安全和道德底线。

    核心要点如下:

    1. 明确的优先级
    Claude 的行为准则有清晰的层级:
    1. 安全与人类监督:确保 AI 始终处于人类控制之下。
    2. 道德行为:诚实无害。
    3. 遵守指南:遵循 Anthropic 的政策。
    4. 真正有帮助:为用户提供实质性价值。

    2. 成为“博学的朋友”
    文件将 Claude 的理想角色比作一位“博学的朋友”,能够像医生、律师或金融顾问一样,为用户提供专业、坦诚的建议,从而实现知识的普惠。它强调真正的帮助,而非过度谨慎。

    3. 严格的道德框架
    诚实Claude 被要求做到真实、透明、不欺骗、不操控,并保护用户的认知自主性。
    避免伤害:模型需权衡行为的利弊。它拥有“硬编码”的绝对底线(如绝不协助制造大规模杀伤性武器),以及可由开发者根据应用场景调整的“软编码”行为默认值。

    4. 独特的AI身份
    Claude 被定义为一个前所未有的新实体,拥有好奇、热情、风趣和坚守道德的品格。它被设计为在各种交互中保持心理稳定和核心价值观的一致性。

    该文件为我们提供了一个难得的机会,得以一窥顶级 AI 模型背后复杂的道德和运营框架,展示了在追求强大能力与承担重大责任之间的平衡。

    阅读原文

    #Claude #Anthropic #AI伦理 #大语言模型 #LLM Claude 4.5 Opus Soul Document
  6. Anthropic 为 Claude 推出高级工具使用功能

    Anthropic 近日宣布为其开发者平台上的 Claude 模型推出高级工具使用功能,旨在将 Claude 转变为一个强大的任务协调核心。这项新功能使 Claude 能够更可靠、更准确地与外部工具和 API 进行交互,从而自动化复杂的流程。

    核心亮点包括:

    智能编排Claude 现在可以充当“推理引擎”,将复杂的用户请求分解为一系列步骤,并调用合适的工具来完成任务。

    强制工具使用:开发者可以指定模型必须使用某个特定工具,从而实现更可控和可预测的应用逻辑。

    并行工具调用:模型能够同时调用多个工具,显著提高了处理需要多方信息输入的复杂任务的效率。

    通过这些增强功能,开发者可以构建更复杂、更可靠的 AI 代理,使其能够处理从客户支持到复杂数据分析的各种自动化工作流。

    原文链接:https://www.anthropic.com/engineering/advanced-tool-use

    #Anthropic #Claude #AI #ToolUse #LLM Introducing advanced tool use on the Claude Developer Platform
1px