小米上线MiMo-V2.5-Pro-UltraSpeed模式,推理速度突破1000 tokens/s
钛媒体App 6月9日消息,小米MiMo技术团队正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。据介绍,MiMo-V2.5-Pro-UltraSpeed通过对模型推理系统的全链路工程能力优化,在不降低模型能力前提下,首次把推理速度提升至1000 tokens/s,且无需定制芯片、只使用通用GPU即可达成。即日起至6月23日 ,MiMo-V2-Pro-UltraSpeed模式将采取申请制限时开放,通过申请的用户可接入 API 进行体验。(广角观察)
本文内容仅供参考,不构成投资建议,请谨慎对待。
根据《网络安全法》实名制要求,请绑定手机号后发表评论