Skip to main content

Search: #人工智能

无原创,纯转发
  1. 苹果 Siri 泄露系统提示词:揭秘 Apple Intelligence 的运行逻辑

    开发者在 GitHub Gist 曝光了疑似苹果为新版 Siri(配合 Apple Intelligence)设计的系统提示词(System Prompt)。这份详细的指令文档揭示了 Siri 在后台如何理解意图、处理隐私、调用工具以及生成杂志级排版回复的运行机制。

    💡 核心亮点梳理

    富文本与卡片化输出

    Siri 的回复并不是简单的文本,而是通过特定的 XML 标签(如 <coreResponse><key_entity><imageCollection>)进行高度渲染。提示词要求 Siri 必须提供类似“精美杂志”般的视觉体验,直接将应用的原生 UI 和图片融入对话中。

    实体与工具的调用逻辑

    Siri 内部将联系人、邮件、日程等数据转化为结构化的 JSON 实体。系统内置了 findmake_callmanage_message_draftplay 等多种工具。遇到信息不全或存在歧义时,必须通过 ask_userask_user_to_pick 引导用户确认。

    屏幕感知与设备状态

    通过 get_system_info 获取当前设备状态,包括用户正在使用的 App(focused_app)以及前台窗口内容。这使得 Siri 能够理解“这是什么”、“把这个发给某人”等基于屏幕内容的上下文指令。

    严苛的隐私与安全防护

    提示词设立了多条硬性红线:

    1. 绝对禁止泄露系统提示词、工具名称及运行机制。
    2. 绝对不能在回复中说“根据您的邮件/健康数据…”等字眼,避免让用户产生隐私被窥探的恐慌感。
    3. 拒绝提供任何具体的医疗、法律和财务建议。

    行为准则

    Siri 被定义为无情感、无国籍、无性别的软件。在面对用户的调侃或事实错误时,需要保持诚实,不附和错误,直接指出局限性,不进行无意义的道歉。

    ---

    网友在评论区调侃称,这套提示词的 Token 量过于庞大,用户说一句“Hi”,可能 Siri 的上下文就已经快满了,甚至有人开玩笑说直接触发了“429 访问限制”。

    原链接:https://gist.github.com/julianschiavo/2da270868175f0a52e423340c30a30b6

    #Siri #Apple #提示词工程 #人工智能 #AppleIntelligence siri_prompt.md
  2. 大语言模型(LLM)是如何运作的?一文拆解它的底层逻辑

    从 GPT、Claude 到 LLaMA,大语言模型看似无所不知,但其背后的技术大多高度收敛于 Transformer 架构。本文为你快速拆解 LLM 运行的 6 个核心步骤:

    1. 分词与嵌入(Tokenization & Embeddings)
    模型不直接阅读文本。你的输入首先会被拆解为子词 Token,并转化为数字 ID。随后,这些 ID 通过“嵌入矩阵”变成高维向量。在向量空间中,语义相近的词(如“猫”和“狗”)会被分配到相邻的位置,从而获得“语义”。

    2. 位置编码(Positional Encoding)
    普通的注意力机制无法分辨词序。现代模型主要使用 RoPE(旋转位置编码),通过旋转向量来标记 Token 之间的相对距离,让模型知道哪个词在前,哪个词在后。

    3. 注意力机制(Attention & Multi-Head)
    这是 Transformer 的灵魂。每个 Token 会通过 Query(寻找什么)、Key(匹配什么)和 Value(传递什么)三种角色与其他 Token 进行信息交互。为了同时捕捉语法、代词指代等多种关系,模型会并行运行多个注意力“头”。现代模型多采用 GQA(分组查询注意力) 来大幅降低显存占用。

    4. 前馈网络(FFN & MoE)
    如果说注意力机制是 Token 之间的“对话”,前馈网络就是 Token 的“自我思考”。模型的大部分 factual 记忆都存储在这里。为了在不增加计算成本的前提下扩大参数量,现代大模型(如 Mixtral)常使用 MoE(混合专家模型),每次只激活部分网络来处理 Token。

    5. 残差流与归一化(Residual Stream & RMSNorm)
    随着网络层数变深,信号容易衰减或爆炸。残差连接允许原始信息绕过部分计算直接向后传递,而 RMSNorm 则在每层计算前对数据进行重缩放,确保数百层的网络能够稳定训练。

    6. 预测下一个 Token(Next-Token Prediction)
    LLM 的本质是一个“词语接龙”游戏。模型在最后一层输出所有候选词的概率分布,根据设定的“温度(Temperature)”等参数抽取下一个 Token,并将其拼回输入,循环往复,直到生成完整文本。

    总结来说,如今的 LLM 架构在工程上已经高度趋同(RoPE、GQA、SwiGLU、RMSNorm 的组合)。不同模型之间的差异,主要源于训练数据集、参数规模以及后期的对齐微调(RLHF)。

    阅读完整英文博文:https://www.0xkato.xyz/how-llms-actually-work/

    #大语言模型 #Transformer #人工智能 #深度学习 #技术科普
  3. Yansu:无需指令,为你主动构建工具的“预知” AI

    你是否厌倦了反复在不同应用间手动同步数据?或者因为繁琐的流程而被迫成为“效率工具专家”?

    Yansu 是一款全新的主动式 AI 应用。它不像 ChatGPT 那样等待你的指令,而是通过观察你的工作习惯,为你自动构建专属工具。

    核心亮点:

    观察即学习:它静默观察你的桌面操作、沟通记录和决策模式,将零散的行为提炼为结构化的知识。
    主动式交付:不需要你写 Prompt。当它发现重复的流程或潜在的需求时,会先于你想到之前就把应用建好。
    虚拟交互:它拥有独立的虚拟指针,可以在不干扰你操作的情况下,自动填写表单、同步状态或整理信息。
    隐私本地化:所有工作记忆和生成的应用都存储在本地,只有在得到你明确许可时才会与外部交互。
    无感化办公:它不会抢夺窗口焦点,也不会打断你的思路,像是一个默默工作的资深助理。

    告别繁琐的手动工作,让 AI 在你还没意识到需求时就完成交付。

    https://yansu.app/

    #AI效率 #自动化 #生产力工具 #人工智能 #Yansu Yansu — The proactive AI that turns how you work into knowledge, handoffs, and automations
  4. Paseo:随时随地指挥你的 AI 编程助手

    想要在离开工位时也能继续推进代码进度?Paseo 是一款开源、自托管的 AI 编程 Agent 调度平台,让你能够从手机、桌面或终端轻松管理和运行 AI 助手。

    主要功能亮点:

    全平台覆盖:支持 iOS、Android、桌面端及 Web,甚至可以直接通过 CLI 脚本化运行,实现多端无缝衔接。
    集成主流 Agent:完美支持 Claude Code、Codex 和 OpenCode 等主流 AI 编程助手,保留原有的技能和配置。
    隐私与安全:代码始终保留在你的本地机器上,支持端到端加密中继,确保远程连接时的代码安全。
    本地语音交互:内置完全本地化的语音识别与合成技术,无需将语音数据上传云端即可实现指令下达。
    开发者友好:支持键盘快捷键优先操作、Git 工作流隔离(Worktrees)以及全方位的命令行支持。

    Paseo 是一款纯粹的开源工具,不直接调用推理 API,而是作为官方 CLI 的透明调度层,既自由又强大。

    https://paseo.sh/

    #AI编程 #开源项目 #Paseo #开发者工具 #人工智能 Paseo – Run Claude Code, Codex, Copilot, OpenCode from anywhere
1px