Skip to main content

面条的草稿箱

无原创,纯转发
  1. Browserbase: 为 AI Agent 量身打造的浏览器基础设施

    Browserbase 是一个专为 AI 设计的无服务器浏览器平台,能帮助 AI 代理(Agent)自主地在网页上执行阅读、写入和交互等任务。开发者无需再为管理复杂的浏览器基础设施而烦恼。

    核心亮点
    - 无缝集成:与 Playwright、Puppeteer、Selenium 等主流自动化框架完全兼容。
    - 弹性扩展:无服务器架构,可在毫秒间启动成千上万个浏览器实例,按需使用。
    - 极致性能:全球化的节点分布,确保低延迟;每个实例配备 4vCPU,保证页面加载速度。
    - 强大而隐蔽:内置验证码自动处理、住宅代理和浏览器指纹管理,轻松绕过网站限制。
    - 开发者友好:提供实时调试视图、会话录制功能,并配备了 Node.js 和 Python 的官方 SDK。

    无论是构建复杂的 AI 代理、执行自动化工作流,还是大规模网页抓取,Browserbase 都能提供稳定可靠的支持。

    原始链接:https://www.browserbase.com
  2. Gemini 3 提示词工程最佳实践

    作者分享了使用 Gemini 3 Pro 的经验,强调它在各方面都远超 2.5 Pro。Gemini 3 偏爱直接和逻辑化的指令,而非冗长或说服性的语言。以下是一些核心原则和技巧总结:

    核心原则
    - 精确指令:清晰、直接地陈述你的目标,避免冗余信息。
    - 结构一致:在提示词中使用统一的结构(如 XML 标签),并明确定义模糊术语。
    - 长上下文指令后置:处理长文本(如书籍、代码库)时,应将具体指令放在上下文数据之后
    - 上下文锚定:在提供大量数据后提问时,使用“基于以上信息…”等语句进行过渡。

    高阶技巧
    - 引导思考:让模型在回答前先进行规划、分解任务、甚至批判自己的输出,以提高回答质量。
    - 结构化提示词:使用 XML 或 Markdown 格式来清晰地区分指令和数据。
    - 特定领域应用:文章为研究分析、创意写作、问题解决和教育内容等场景提供了具体的提示词结构。

    文章最后还提供了一个结合了各项最佳实践的通用模板,并强调提示词工程是一个需要不断迭代和优化的过程。

    原文链接 Gemini 3 Prompting: Best Practices for General Usage
1px