阿里达摩院低调上线文本生成视频大模型，已开放试玩

推荐
快报
广场
科股宝VIP
视频
直播

阿里达摩院低调上线文本生成视频大模型，已开放试玩

2023.03.22 15:54

钛媒体App 3月22日消息，近日，阿里达摩院低调地在魔搭社区（ModelScope）放出了“文本生成视频大模型”。根据官方介绍，目前文本生成视频大模型，由文本特征提取、文本特征到视频隐空间扩散模型、视频隐空间到视频视觉空间这3个子网络组成，整体模型参数约17亿。支持英文输入。扩散模型采用Unet3D结构，通过从纯高斯噪声视频中，迭代去噪的过程，实现视频生成的功能。

AGI

本文内容仅供参考，不构成投资建议，请谨慎对待。

0 / 300

根据《网络安全法》实名制要求，请绑定手机号后发表评论

请登录后输入评论内容

投资日历