<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet href="/rss.xsl" type="text/xsl"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/"><channel><title>小米 | 面条的草稿箱</title><description>无原创，纯转发</description><link>https://localhost</link><item><title>小米发布 MiMo-V2-Flash：高效推理模型开源小米于 2025 年 12 月 16 日发布并开源了 MiMo-V2-Flash，这是一款高效、超快的基础语言模型，在推理、编码和智能体场景表现尤为出色，同时也可作为日常任务的通用助手</title><link>https://localhost/posts/72</link><guid isPermaLink="true">https://localhost/posts/72</guid><pubDate>Wed, 17 Dec 2025 02:16:20 GMT</pubDate><content:encoded>&lt;b&gt;小米发布 MiMo-V2-Flash：高效推理模型开源&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;小米于 2025 年 12 月 16 日发布并开源了 MiMo-V2-Flash，这是一款高效、超快的基础语言模型，在推理、编码和智能体场景表现尤为出色，同时也可作为日常任务的通用助手。&lt;br /&gt;&lt;br /&gt;&lt;b&gt;核心亮点&lt;/b&gt;&lt;br /&gt;&lt;br /&gt;&lt;u&gt;模型架构&lt;/u&gt;：采用混合专家（MoE）架构，总参数 309B，激活参数仅 15B，结合滑动窗口与全注意力的混合注意力机制，支持 256K 超长上下文。&lt;br /&gt;&lt;br /&gt;&lt;u&gt;性能表现&lt;/u&gt;：&lt;br /&gt;• AIME 2025、GPQA-Diamond 等推理测试中位列开源模型前二&lt;br /&gt;• SWE-bench Verified 达 73.4%，SWE-bench Multilingual 达 71.7%，软件工程能力领先所有开源模型&lt;br /&gt;• 推理速度达 150 tokens/秒，成本仅 $0.1/百万输入 token&lt;br /&gt;&lt;br /&gt;&lt;u&gt;技术创新&lt;/u&gt;：&lt;br /&gt;• 多 Token 预测（MTP）：通过自推测解码实现 2.0-2.6 倍加速&lt;br /&gt;• MOPD 训练范式：多教师在线策略蒸馏，训练效率提升 50 倍以上&lt;br /&gt;&lt;br /&gt;&lt;u&gt;开源资源&lt;/u&gt;：模型权重以 MIT 协议开放于 Hugging Face，推理代码已贡献至 SGLang，技术报告同步发布。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://mimo.xiaomi.com/zh/blog/mimo-v2-flash&quot; target=&quot;_blank&quot;&gt;原文链接&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;/search/result?q=%23%E5%B0%8F%E7%B1%B3&quot;&gt;#小米&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23MiMo&quot;&gt;#MiMo&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%BC%80%E6%BA%90%E6%A8%A1%E5%9E%8B&quot;&gt;#开源模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23%E5%A4%A7%E8%AF%AD%E8%A8%80%E6%A8%A1%E5%9E%8B&quot;&gt;#大语言模型&lt;/a&gt; &lt;a href=&quot;/search/result?q=%23AI%E6%8E%A8%E7%90%86&quot;&gt;#AI推理&lt;/a&gt;</content:encoded></item></channel></rss>