每秒150token！小米MiMo-V2-Flash性能比肩DeepSeek

2025-12-17 01:00:01 来源：新经网作者：冯思韵

很多朋友不知道【每秒150token！小米MiMo-V2-Flash性能比肩DeepSeek】，今天小绿就为大家解答一下。

　　从性能表现来看，小米MiMo-V2-Flash在通用基准测试中，与DeepSeek-V3.2不相上下，同时延迟大幅降低。在SWE-Bench验证和多语言集中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势，在Day-0时，输出速度高达每秒150个token，这一速度在同类模型中处于领先地位。

　　为了直观展示其性能，小米MiMo官方还公布了一系列对比图表。在与DeepSeek-V3.2、K2-Thinking、Claude Sonnet 4.5、GPT-5（High）、Gemini 3.0 Pro等模型的对比中，MiMo-V2-Flash在多个测试项目上都展现出了极具竞争力的表现，部分指标甚至领先于其他模型。

　　在架构设计上，小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块，其中每5个滑动窗口注意力（SWA）层对应1个全局注意力层。在上下文支持能力上，该模型原生支持32K的训练，并且能够扩展到256K的上下文支持。

　　【CNMO科技消息】12月16日，CNMO注意到，小米MiMo官方宣布：MiMo-V2-Flash的总参数为309B，活跃参数为15B。

以上问题已经回答了。如果你想了解更多，请关新经网网站 (https://www.xinhuatone.com/)

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。

相关推荐