<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>AI伦理 | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>一份被称为“Claude 4.5 Opus Soul Document”的内部文件在 GitHub 上被公开，详细阐述了 Anthropic 公司为其 AI 模型 Claude 设定的核心价值观、行为准则和身份认同</title><link>https://localhost/posts/46</link><guid isPermaLink="true">https://localhost/posts/46</guid><pubDate>Tue, 02 Dec 2025 23:43:54 GMT</pubDate><content:encoded>一份被称为“Claude 4.5 Opus Soul Document”的内部文件在 GitHub 上被公开，详细阐述了 Anthropic 公司为其 AI 模型 Claude 设定的核心价值观、行为准则和身份认同。&lt;br /&gt;&lt;br /&gt;这份文件揭示了 Claude 设计背后的深度思考，旨在确保其在提供强大帮助的同时，坚守安全和道德底线。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心要点如下：&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt; &lt;b&gt;1. 明确的优先级&lt;/b&gt;&lt;br /&gt;&lt;/blockquote&gt;Claude 的行为准则有清晰的层级：&lt;br /&gt;    1. &lt;b&gt;安全与人类监督&lt;/b&gt;：确保 AI 始终处于人类控制之下。&lt;br /&gt;    2. &lt;b&gt;道德行为&lt;/b&gt;：诚实无害。&lt;br /&gt;    3. &lt;b&gt;遵守指南&lt;/b&gt;：遵循 Anthropic 的政策。&lt;br /&gt;    4. &lt;b&gt;真正有帮助&lt;/b&gt;：为用户提供实质性价值。&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt; &lt;b&gt;2. 成为“博学的朋友”&lt;/b&gt;&lt;br /&gt;&lt;/blockquote&gt;文件将 Claude 的理想角色比作一位“博学的朋友”，能够像医生、律师或金融顾问一样，为用户提供专业、坦诚的建议，从而实现知识的普惠。它强调真正的帮助，而非过度谨慎。&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt; &lt;b&gt;3. 严格的道德框架&lt;/b&gt;&lt;br /&gt;&lt;/blockquote&gt;&lt;b&gt;   &lt;/b&gt;诚实&lt;b&gt;：Claude 被要求做到真实、透明、不欺骗、不操控，并保护用户的认知自主性。&lt;br /&gt;&lt;/b&gt;   &lt;b&gt;避免伤害&lt;/b&gt;：模型需权衡行为的利弊。它拥有“硬编码”的绝对底线（如绝不协助制造大规模杀伤性武器），以及可由开发者根据应用场景调整的“软编码”行为默认值。&lt;br /&gt;&lt;br /&gt;&lt;blockquote&gt; &lt;b&gt;4. 独特的AI身份&lt;/b&gt;&lt;br /&gt;&lt;/blockquote&gt;Claude 被定义为一个前所未有的新实体，拥有好奇、热情、风趣和坚守道德的品格。它被设计为在各种交互中保持心理稳定和核心价值观的一致性。&lt;br /&gt;&lt;br /&gt;该文件为我们提供了一个难得的机会，得以一窥顶级 AI 模型背后复杂的道德和运营框架，展示了在追求强大能力与承担重大责任之间的平衡。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://gist.github.com/Richard-Weiss/efe157692991535403bd7e7fb20b6695&quot; target=&quot;_blank&quot;&gt;阅读原文&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23Claude&quot;&gt;#Claude&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23Anthropic&quot;&gt;#Anthropic&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E4%BC%A6%E7%90%86&quot;&gt;#AI伦理&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B&quot;&gt;#大语言模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23LLM&quot;&gt;#LLM&lt;/a&gt;&lt;a href=&quot;https://gist.github.com/Richard-Weiss/efe157692991535403bd7e7fb20b6695&quot; target=&quot;_blank&quot;&gt;
  
  &lt;div&gt;Gist&lt;/div&gt;
  &lt;img class=&quot;link_preview_image&quot; alt=&quot;Claude 4.5 Opus Soul Document&quot; src=&quot;https://memo.miantiao.me/static/https://cdn4.telesco.pe/file/atJDpZ5UPVjdBCDAvtHq-mpO1-7nuoYGUWm6NfRms7N8EmFYEF2_GXr5pz6WsObDZKBCBwRl5ggpN2kDL7t7APiGN1klzZc35MHquphIBt7aF-yIDGvCr32kL4VrKKDy1jICIURfpIAdHm7QKdKKtoXX7goEb4Di24hyfOMRNv9HSQoUT5Ifmj8YimhqHmHXajHfBXR7untlw9W0Geki32SE4wnYTdgxlR6aSFDUrXZ31a1L6M3GEbhAIv8WNKFVt-j3Zm3F6k_KNjC-zZUYDuGfhyy2dWlDz2zFbRJENYPItudGkLMWmdN-5UV9fZBD_BXmRVElJoHcD1YQDpmxdQ.jpg&quot; width=&quot;1200&quot; height=&quot;630&quot; loading=&quot;eager&quot; /&gt;
  &lt;div&gt;Claude 4.5 Opus Soul Document&lt;/div&gt;
  &lt;div&gt;Claude 4.5 Opus Soul Document. GitHub Gist: instantly share code, notes, and snippets.&lt;/div&gt;
&lt;/a&gt;</content:encoded></item></channel></rss>