开云www.kaiyun.com-每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek

2026-01-01

  【KAIYUN.COM科技消息】12月16日,KAIYUN.COM注意到,小米MiMo官方宣布:MiMo-V2-Flash的总参数为309B,活跃参数为15B。

每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek

  在架构设计上,小米MiMo-V2-Flash采用了混合注意力机制。其混合模块设计包含8个混合块,其中每5个滑动窗口注意力(SWA)层对应1个全局注意力层。在上下文支持能力上,该模型原生支持32K的训练,并且能够扩展到256K的上下文支持。

  从性能表现来看,小米MiMo-V2-Flash在通用基准测试中,与DeepSeek-V3.2不相上下,同时延迟大幅降低。在SWE-Bench验证和多语言中分别取得了73.4%和71.7%的成绩。尤为突出的是其速度优势,在Day-0时,输出速度高达每秒150个token,这一速度在同类模型中处于领先地位。

每秒150token!小米MiMo-V2-Flash性能比肩DeepSeek

  为了直观展示其性能,小米MiMo官方还公布了一系列对比图表。在与DeepSeek-V3.2、K2-Thinking、Claude Sonnet 4.5、GPT-5(High)、Gemini 3.0 Pro等模型的对比中,MiMo-V2-Flash在多个测试项目上都展现出了极具竞争力的表现,部分指标甚至领先于其他模型。

-开云www.kaiyun.com-

云原生厂商 云原生技术服务商
在云原生时代,kaiyun开云创新致力于通过赋能开发者,实现企业快速迭代与交付,大幅提升创新效率。
产品下载