生成式AI落地时,企业往往会遇到模型部署复杂、资源消耗大的问题,而开源大模型凭借可定制性强、成本优势突出的特点,正逐渐成为行业主流选择。4月28日,小米正式发布并开源了MiMo-V2.5和MiMo-V2.5-Pro两款大模型,给企业布局生成式AI应用带来了新选项。同一天,亚马逊云科技完成了对MiMo-V2.5-Pro的Day-0极速适配,成为全球首批支持该模型的云服务商之一,目的是帮助客户更快完成生成式AI场景下的模型部署,提升推理效率。
亚马逊云科技的适配工作主要包含三个核心环节:训练后优化、推理服务封装和云原生工具链集成。训练后优化借助量化、剪枝等技术,在不影响模型精度的前提下减少推理时的计算资源消耗;推理服务封装把模型转化为标准化API接口,用户不用关心底层技术细节;云原生工具链集成则结合Amazon SageMaker的部署工具,支持自动扩缩容,保障高并发场景下的稳定运行。完成这些适配后,用户只需要通过简单的API调用就能使用MiMo-V2.5-Pro,不用修改任何代码,部署时间也从传统的数天压缩到了小时级别。
这次适配的价值在于,它为不同规模的企业提供了低门槛的生成式AI落地方案:中小企业不用组建专业AI团队就能快速用MiMo模型开展业务,大型企业则可以把模型快速集成到现有系统中,加快客服对话、内容生成等场景的应用落地。小米的开源模型和亚马逊云的协同,形成了“开源模型+云服务”的生态闭环,有助于生成式AI技术向更多行业渗透。
最近,开源大模型适配成了云服务领域的竞争热点。其他云服务商也动作频频:阿里云在4月中旬宣布支持Meta Llama 3模型的快速部署,华为云则在3月底完成了对盘古大模型开源版的全栈适配;微软Azure在5月初推出了针对开源模型的优化服务,支持Llama 3、Mistral等模型的Day-1适配,Google Cloud也在4月下旬更新了其AI平台,新增了开源模型的一键部署功能。这些动向表明,云服务商正通过加强开源模型生态建设,争夺生成式AI市场的主导地位。






快报