蚂蚁集团开源全模态大模型Ming-flash-omni 2.0

钛媒体App 2月11日消息,蚂蚁集团开源发布全模态大模型Ming-flash-omni 2.0。在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越Gemini 2.5 Pro。Ming-flash-omni 2.0也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。(广角观察)

本文内容仅供参考,不构成投资建议,请谨慎对待。

评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
投资日历
更多