Skip to main content

面条的草稿箱

无原创,纯转发
  1. LLM Gateway:统一管理你的大语言模型 API

    LLM Gateway 是一款开源的大语言模型 API 网关,它充当你的应用和多个 LLM 提供商(如 OpenAI、Anthropic、Google 等)之间的中间件,旨在帮助开发者更高效地管理、路由和分析 LLM 请求。

    主要功能
    - 统一接口:提供与 OpenAI API 兼容的格式,方便应用无缝迁移。
    - 多提供商路由:通过单一网关连接和路由到不同的 LLM 提供商。
    - 用量分析:集中管理 API 密钥,跟踪请求、Token 用量、响应时间和成本。
    - 性能监控:帮助你比较不同模型的性能和成本效益,以优化选择。

    该项目支持云端托管版本和自部署两种方式,让你既可以快速上手,也可以完全掌控自己的数据。对于需要灵活切换、管理和分析多个 LLM 服务的开发者来说,这是一个非常实用的工具。

    原始链接:https://github.com/theopenco/llmgateway LLM Gateway - Unified API for Multiple LLM Providers
  2. AIO Sandbox: AI 代理的一体化沙盒环境

    agent-infra/sandbox 是一个为 AI 代理设计的开源一体化沙盒环境,它将浏览器、终端、文件系统、VSCode Server 和 Jupyter Notebook 等多种工具集成在单个 Docker 容器中.

    该项目旨在解决传统沙盒功能单一、组件间难以协作的问题. 通过共享统一的文件系统,用户可以在浏览器中下载文件,并立即在终端或代码编辑器中无缝访问,极大地简化了开发和调试流程.

    主要特性
    *统一环境*: 所有工具共享文件系统,实现无缝工作流.
    *多功能接口*: 支持通过 VNC、VSCode、Jupyter 和 Web 终端进行访问.
    *安全执行*: 提供隔离的 Python 和 Node.js 运行时.
    *开箱即用*: 预配置了多种开发工具和 MCP 服务,无需复杂设置.
    *为代理而生*: 提供兼容 MCP 的 API,方便 AI 代理集成.

    对于构建和测试 AI 代理的开发者来说,这是一个功能强大且便捷的工具.

    原始链接
  3. 使用 ChatGPT 自动化社交媒体管理

    还在为管理多个社交媒体平台而烦恼吗?这篇文章介绍了一个高效的工作流程,通过将 ChatGPT 与 Composio 的 Rube MCP 服务器相结合,让你在一个对话窗口内完成所有社交媒体管理任务.

    这个智能社交媒体助手可以帮你:
    发现热点:无需无休止地刷屏,即可发现 Reddit 和 HackerNews 上的热门话题.
    生成内容:轻松地为 Twitter 和 LinkedIn 等不同平台量身定制帖子.
    直接发布:在 ChatGPT 内直接发布或安排你的内容,无需切换标签页.
    追踪表现:在一个地方集中监控帖子的点赞、分享、浏览和评论.

    Rube 是一个为 AI 代理设计的通用连接器,它为 ChatGPT 等模型搭建了一座桥梁,使其能轻松连接到数百个你日常使用的应用程序(如 Reddit、Twitter、HackerNews),并处理了繁琐的 API 对接和身份验证问题.

    通过这种方式,你可以将社交媒体管理从一项耗时的工作转变为一个智能、自动化的系统,从而节省时间,专注于创作优质内容.

    原文链接:Managing social media and making viral content in Chatgpt using Rube MCP Managing social media and making viral content in Chatgpt using Rube MCP - Composio
  4. Anthropic 新方法:用代码执行提升 AI 代理效率

    Anthropic 提出了一种利用代码执行和模型上下文协议 (MCP) 来构建更高效、更具扩展性 AI 代理的新方法。

    目前 AI 代理在连接大量工具时,常因一次性加载所有工具定义而导致上下文窗口过载、成本激增。同时,工具调用的中间结果(如长文档)反复传入模型,也极其低效。

    Anthropic 的解决方案是:让 AI 代理编写代码与工具 API 交互,而非直接调用。这样,代理能像浏览文件系统一样,按需加载完成任务所需的特定工具,从而解决上述难题。

    这一方法带来了几点核心优势:
    大幅降低 Token 消耗
    按需加载可将 Token 使用量减少高达 98% (文中示例从 15 万降至 2 千)。

    ⚙️ 高效的数据流
    代理可在代码环境中预处理海量数据,只将关键结果返回模型,避免上下文被淹没。

    🔒 增强隐私与安全
    敏感信息可在安全的执行环境中处理,无需进入模型上下文,有效保护数据隐私。

    🧠 实现技能积累
    代理能将代码保存为可复用的“技能”,实现跨任务的记忆和能力成长。

    虽然该方法需要安全的沙箱执行环境,增加了实现复杂性,但其在效率和能力上的提升是显著的。

    原文链接: https://www.anthropic.com/engineering/code-execution-with-mcp Code execution with MCP: building more efficient AI agents
  5. Browserbase: 为 AI Agent 量身打造的浏览器基础设施

    Browserbase 是一个专为 AI 设计的无服务器浏览器平台,能帮助 AI 代理(Agent)自主地在网页上执行阅读、写入和交互等任务。开发者无需再为管理复杂的浏览器基础设施而烦恼。

    核心亮点
    - 无缝集成:与 Playwright、Puppeteer、Selenium 等主流自动化框架完全兼容。
    - 弹性扩展:无服务器架构,可在毫秒间启动成千上万个浏览器实例,按需使用。
    - 极致性能:全球化的节点分布,确保低延迟;每个实例配备 4vCPU,保证页面加载速度。
    - 强大而隐蔽:内置验证码自动处理、住宅代理和浏览器指纹管理,轻松绕过网站限制。
    - 开发者友好:提供实时调试视图、会话录制功能,并配备了 Node.js 和 Python 的官方 SDK。

    无论是构建复杂的 AI 代理、执行自动化工作流,还是大规模网页抓取,Browserbase 都能提供稳定可靠的支持。

    原始链接:https://www.browserbase.com Browserbase
  6. Gemini 3 提示词工程最佳实践

    作者分享了使用 Gemini 3 Pro 的经验,强调它在各方面都远超 2.5 Pro。Gemini 3 偏爱直接和逻辑化的指令,而非冗长或说服性的语言。以下是一些核心原则和技巧总结:

    核心原则
    - 精确指令:清晰、直接地陈述你的目标,避免冗余信息。
    - 结构一致:在提示词中使用统一的结构(如 XML 标签),并明确定义模糊术语。
    - 长上下文指令后置:处理长文本(如书籍、代码库)时,应将具体指令放在上下文数据之后
    - 上下文锚定:在提供大量数据后提问时,使用“基于以上信息…”等语句进行过渡。

    高阶技巧
    - 引导思考:让模型在回答前先进行规划、分解任务、甚至批判自己的输出,以提高回答质量。
    - 结构化提示词:使用 XML 或 Markdown 格式来清晰地区分指令和数据。
    - 特定领域应用:文章为研究分析、创意写作、问题解决和教育内容等场景提供了具体的提示词结构。

    文章最后还提供了一个结合了各项最佳实践的通用模板,并强调提示词工程是一个需要不断迭代和优化的过程。

    原文链接 Gemini 3 Prompting: Best Practices for General Usage
1px