<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>人机交互 | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>大语言模型（LLM）是如何运作的？一文拆解它的底层逻辑从 GPT、Claude 到 LLaMA，大语言模型看似无所不知，但其背后的技术大多高度收敛于 Transformer 架构</title><link>https://localhost/posts/133</link><guid isPermaLink="true">https://localhost/posts/133</guid><pubDate>Mon, 08 Jun 2026 09:59:52 GMT</pubDate><content:encoded>大语言模型（LLM）是如何运作的？一文拆解它的底层逻辑&lt;br /&gt;&lt;br /&gt;从 GPT、Claude 到 LLaMA，大语言模型看似无所不知，但其背后的技术大多高度收敛于 Transformer 架构。本文为你快速拆解 LLM 运行的 6 个核心步骤：&lt;br /&gt;&lt;br /&gt;1.  &lt;b&gt;分词与嵌入（Tokenization &amp;amp; Embeddings）&lt;/b&gt;&lt;br /&gt;    模型不直接阅读文本。你的输入首先会被拆解为子词 Token，并转化为数字 ID。随后，这些 ID 通过“嵌入矩阵”变成高维向量。在向量空间中，语义相近的词（如“猫”和“狗”）会被分配到相邻的位置，从而获得“语义”。&lt;br /&gt;&lt;br /&gt;2.  &lt;b&gt;位置编码（Positional Encoding）&lt;/b&gt;&lt;br /&gt;    普通的注意力机制无法分辨词序。现代模型主要使用 &lt;b&gt;RoPE（旋转位置编码）&lt;/b&gt;，通过旋转向量来标记 Token 之间的相对距离，让模型知道哪个词在前，哪个词在后。&lt;br /&gt;&lt;br /&gt;3.  &lt;b&gt;注意力机制（Attention &amp;amp; Multi-Head）&lt;/b&gt;&lt;br /&gt;    这是 Transformer 的灵魂。每个 Token 会通过 Query（寻找什么）、Key（匹配什么）和 Value（传递什么）三种角色与其他 Token 进行信息交互。为了同时捕捉语法、代词指代等多种关系，模型会并行运行多个注意力“头”。现代模型多采用 &lt;b&gt;GQA（分组查询注意力）&lt;/b&gt; 来大幅降低显存占用。&lt;br /&gt;&lt;br /&gt;4.  &lt;b&gt;前馈网络（FFN &amp;amp; MoE）&lt;/b&gt;&lt;br /&gt;    如果说注意力机制是 Token 之间的“对话”，前馈网络就是 Token 的“自我思考”。模型的大部分 factual 记忆都存储在这里。为了在不增加计算成本的前提下扩大参数量，现代大模型（如 Mixtral）常使用 &lt;b&gt;MoE（混合专家模型）&lt;/b&gt;，每次只激活部分网络来处理 Token。&lt;br /&gt;&lt;br /&gt;5.  &lt;b&gt;残差流与归一化（Residual Stream &amp;amp; RMSNorm）&lt;/b&gt;&lt;br /&gt;    随着网络层数变深，信号容易衰减或爆炸。残差连接允许原始信息绕过部分计算直接向后传递，而 &lt;b&gt;RMSNorm&lt;/b&gt; 则在每层计算前对数据进行重缩放，确保数百层的网络能够稳定训练。&lt;br /&gt;&lt;br /&gt;6.  &lt;b&gt;预测下一个 Token（Next-Token Prediction）&lt;/b&gt;&lt;br /&gt;    LLM 的本质是一个“词语接龙”游戏。模型在最后一层输出所有候选词的概率分布，根据设定的“温度（Temperature）”等参数抽取下一个 Token，并将其拼回输入，循环往复，直到生成完整文本。&lt;br /&gt;&lt;br /&gt;总结来说，如今的 LLM 架构在工程上已经高度趋同（RoPE、GQA、SwiGLU、RMSNorm 的组合）。不同模型之间的差异，主要源于训练数据集、参数规模以及后期的对齐微调（RLHF）。&lt;br /&gt;&lt;br /&gt;阅读完整英文博文：&lt;a href=&quot;https://www.0xkato.xyz/how-llms-actually-work/&quot; target=&quot;_blank&quot;&gt;https://www.0xkato.xyz/how-llms-actually-work/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B&quot;&gt;#大语言模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Transformer&quot;&gt;#Transformer&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD&quot;&gt;#人工智能&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%B7%B1%E5%BA%A6%E5%AD%A6%E4%B9%A0&quot;&gt;#深度学习&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E6%8A%80%E6%9C%AF%E7%A7%91%E6%99%AE&quot;&gt;#技术科普&lt;/a&gt;&lt;a href=&quot;https://www.0xkato.xyz/how-llms-actually-work/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;0xkato&lt;/div&gt;
  
  &lt;div&gt;How LLMs Actually Work&lt;/div&gt;
  &lt;div&gt;A from-the-ground-up walkthrough of how modern LLMs work, from tokens to transformer blocks to the next-token loop&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Paseo：随时随地指挥你的 AI 编程助手想要在离开工位时也能继续推进代码进度？Paseo 是一款开源、自托管的 AI 编程 Agent 调度平台，让你能够从手机、桌面或终端轻松管理和运行 AI 助手</title><link>https://localhost/posts/125</link><guid isPermaLink="true">https://localhost/posts/125</guid><pubDate>Sat, 11 Apr 2026 08:44:20 GMT</pubDate><content:encoded>Paseo：随时随地指挥你的 AI 编程助手&lt;br /&gt;&lt;br /&gt;想要在离开工位时也能继续推进代码进度？Paseo 是一款开源、自托管的 AI 编程 Agent 调度平台，让你能够从手机、桌面或终端轻松管理和运行 AI 助手。&lt;br /&gt;&lt;br /&gt;主要功能亮点：&lt;br /&gt;&lt;br /&gt;•   &lt;b&gt;全平台覆盖&lt;/b&gt;：支持 iOS、Android、桌面端及 Web，甚至可以直接通过 CLI 脚本化运行，实现多端无缝衔接。&lt;br /&gt;•   &lt;b&gt;集成主流 Agent&lt;/b&gt;：完美支持 Claude Code、Codex 和 OpenCode 等主流 AI 编程助手，保留原有的技能和配置。&lt;br /&gt;•   &lt;b&gt;隐私与安全&lt;/b&gt;：代码始终保留在你的本地机器上，支持端到端加密中继，确保远程连接时的代码安全。&lt;br /&gt;•   &lt;b&gt;本地语音交互&lt;/b&gt;：内置完全本地化的语音识别与合成技术，无需将语音数据上传云端即可实现指令下达。&lt;br /&gt;•   &lt;b&gt;开发者友好&lt;/b&gt;：支持键盘快捷键优先操作、Git 工作流隔离（Worktrees）以及全方位的命令行支持。&lt;br /&gt;&lt;br /&gt;Paseo 是一款纯粹的开源工具，不直接调用推理 API，而是作为官方 CLI 的透明调度层，既自由又强大。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://paseo.sh/&quot; target=&quot;_blank&quot;&gt;https://paseo.sh/&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI%E7%BC%96%E7%A8%8B&quot;&gt;#AI编程&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E9%A1%B9%E7%9B%AE&quot;&gt;#开源项目&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Paseo&quot;&gt;#Paseo&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E5%8F%91%E8%80%85%E5%B7%A5%E5%85%B7&quot;&gt;#开发者工具&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD&quot;&gt;#人工智能&lt;/a&gt;&lt;a href=&quot;https://paseo.sh/&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Paseo&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Paseo – Run Claude Code, Codex, Copilot, OpenCode from anywhere&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/tsdb41uFeE86Ceg5JHOAXkByMotBrbdEc5F257z0MJY5KDP4DHvBymY1v1ymn9ueyh28LCHaclXOyWokU2ZufkLU_7Ckr-eGluIAiCi3f_xUL3NRCGqn_M6yz11nV1dNoryadiQjKsRIXoZdBY-qNdRgX47lLwRIwDHJXf20HyxyC2EZ_6xZYMmYcSjmOFoQLWYggh8y18xkpuF8cEZnX0S9UPmYrCR98Ln_Ob-m1DDOEKAx6A6Zf5-wjT0_qN9djbIlLk0oatykVLkpTWrSd4vQLuXwFy3u_EBM3Er7aldp7btlUtjgfAom8V9_MNgwa7kDJeYmOiJuT695e1dmMA.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Paseo – Run Claude Code, Codex, Copilot, OpenCode from anywhere&lt;/div&gt;
  &lt;div&gt;Self-hosted daemon for Claude Code, Codex, Copilot, OpenCode, and Pi. Agents run on your machine with your full dev environment. Connect from phone, desktop, or web.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item><item><title>Linear 发布 Agent 交互指南（AIG）：定义人机协作的新契约AI Agent 正在重塑软件的规划、构建、审查和部署方式</title><link>https://localhost/posts/122</link><guid isPermaLink="true">https://localhost/posts/122</guid><pubDate>Mon, 06 Apr 2026 00:53:40 GMT</pubDate><content:encoded>&lt;b&gt;Linear 发布 Agent 交互指南（AIG）：定义人机协作的新契约&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;AI Agent 正在重塑软件的规划、构建、审查和部署方式。当 Agent 大量产出工作成果时，人类的角色也随之转变——价值重心转移到编排输入、构建上下文和审查输出上。&lt;br /&gt;&lt;br /&gt;这种转变需要一套全新的人机交互契约。Linear 提出了 &lt;b&gt;Agent Interaction Guidelines（AIG）&lt;/b&gt;，为设计更自然融入人类工作流的 Agent 交互制定了基础原则。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;六大核心原则&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;b&gt;1. Agent 必须表明身份&lt;/b&gt;&lt;br /&gt;当人类与 Agent 协同工作时，Agent 必须清晰标识自己的身份，绝不能被误认为是真人。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;2. Agent 应原生融入平台&lt;/b&gt;&lt;br /&gt;Agent 应通过平台已有的 UI 模式和标准操作来工作，而非另起炉灶。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;3. Agent 应即时反馈&lt;/b&gt;&lt;br /&gt;沉默会带来不确定性。Agent 被调用后应立即提供反馈（如&quot;思考中&quot;指示器），让用户知道请求已被接收。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;4. Agent 应透明展示内部状态&lt;/b&gt;&lt;br /&gt;无论是思考、等待输入、执行还是完成，Agent 都应清晰展示当前状态。用户可以随时检视其推理过程、工具调用和决策逻辑。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;5. Agent 应尊重退出指令&lt;/b&gt;&lt;br /&gt;当被要求停止时，Agent 必须立即退出，且只有收到明确信号后才能重新介入。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;6. Agent 不能承担最终责任&lt;/b&gt;&lt;br /&gt;Agent 可以执行任务，但最终责任始终归属于人类。需要建立清晰的人机委托模型。&lt;br /&gt;&lt;br /&gt;---&lt;br /&gt;&lt;br /&gt;AIG 是一份持续演进的开放文档，Linear 邀请社区共同参与完善。&lt;br /&gt;&lt;br /&gt;&lt;i&gt;&lt;b&gt;🔗&lt;/b&gt;&lt;/i&gt; &lt;a href=&quot;https://linear.app/developers/aig&quot; target=&quot;_blank&quot;&gt;https://linear.app/developers/aig&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23AI_Agent&quot;&gt;#AI_Agent&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E4%BA%BA%E6%9C%BA%E4%BA%A4%E4%BA%92&quot;&gt;#人机交互&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Linear&quot;&gt;#Linear&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E8%AE%BE%E8%AE%A1%E5%8E%9F%E5%88%99&quot;&gt;#设计原则&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AIG&quot;&gt;#AIG&lt;/a&gt;&lt;a href=&quot;https://linear.app/developers/aig&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;linear.app&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Agent Interaction Guidelines (AIG) – Linear Developers&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/T4FAOv6rF9ljbpo4oSi6cINvLIxWR7vjE_jxubZ96IZVBgyC1DkgeooKgNQfc1frqJVYT0VFPQF2wnFRtHwP8Wqy72tsdv4s7bVO4MA247jDfXV-Yvt6uwZhVAIuDbz3VozhFVQUWCgug-yhpurI7kYXNEzymCEib7vPNUpE91MyBPk7vyH50xjiomVmoLAkXF-KrALKESQMzkSdx266rsFlzBc3nYQY-3npaOchWzPgdbxwUHL8x69UY39HL_uMRYq2dhVbxn4ry2l73KGzRMUYhCdTl3JY029c7qSRMi5DuIaWxtLz_9lz8Rr2kQnpR6IdCfImMHRUY5S_F03oMg.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Agent Interaction Guidelines (AIG) – Linear Developers&lt;/div&gt;
  &lt;div&gt;Foundational principles and practices for designing agent interactions that integrate more naturally into human workflows.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item></channel></rss>