很多朋友不知道【每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek】,今天小绿就为大家解答一下。

版权所有,未经许可不得转载

从性能表现来看,小米MiMo-V2-Flash在通用基准测试中,与DeepSeek-V3.2不相上下,同时延迟大幅降低。在SWE-Bench验证和多语言集中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势,在Day-0时,输出速度高达每秒150个token,这一速度在同类模型中处于领先地位。 为了直观展示其性能,小米MiMo官方还公布了一系列对比图表。在与DeepSeek-V3.2、K2-Thinking、Claude Sonnet 4.5、GPT-5(High)、Gemini 3.0 Pro等模型的对比中,MiMo-V2-Flash在多个测试项目上都展现出了极具竞争力的表现,部分指标甚至领先于其他模型。 在架构设计上,小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块,其中每5个滑动窗口注意力(SWA)层对应1个全局注意力层。在上下文支持能力上,该模型原生支持32K的训练,并且能够扩展到256K的上下文支持。 【CNMO科技消息】12月16日,CNMO注意到,小米MiMo官方宣布:MiMo-V2-Flash的总参数为309B,活跃参数为15B。
以上问题已经回答了。如果你想了解更多,请关
新经网网站 (
https://www.xinhuatone.com/)