Ao usar a licença MIT, a Xiaomi disse que está permitindo implantação comercial, treinamento contínuo e ajuste fino sem autorização adicional. Tulika Sheel, vice-presidente sênior da Kadence International, disse que a licença do MIT pode torná-lo atraente. “Ele permite que as empresas modifiquem, implantem e comercializem livremente o modelo sem restrições, o que é raro no cenário atual de IA”, disse Sheel.
“No ClawEval, o V2.5-Pro chega a 64% Pass^3 usando apenas aproximadamente 70 mil tokens por trajetória – cerca de 40-60% menos tokens do que Claude Opus 4.6, Gemini 3.1 Pro e GPT-5.4 em níveis de capacidade comparáveis”, disse Xiaomi em uma postagem no blog.
Os modelos usam um design de mistura esparsa de especialistas (MoE) para gerenciar custos de computação. O MiMo-V2.5 de 310 bilhões de parâmetros ativa apenas 15 bilhões de parâmetros por solicitação, enquanto a versão Pro de 1,02 trilhão de parâmetros ativa 42 bilhões. Xiaomi disse que o design de atenção híbrida do modelo Pro pode reduzir o armazenamento do cache KV em quase sete vezes durante tarefas de longo contexto.
