腾讯混元发布毫秒级响应实时生图大模型Hunyuan Image 2.0

钛媒体App 5月16日消息,腾讯混元发布业内首个毫秒级响应的实时生图大模型Hunyuan Image 2.0(参数规模提升数10倍),支持文本、语音、草图等多种交互方式。只需一句话、写一个prompt或是画一笔线稿,图像就能同步生成,更具写实质感。Hunyuan Image 2.0基于单双流DiT架构,提升生成效率,同时对图像质感做了系统性重构,没有牺牲任何细节。此外,Hunyuan Image 2.0引入多模态大语言模型(MLLM)作为文本编码器,配合自研的结构化caption系统,可理解语义并推测画面表达意图,再一步步拆解画出。

本文内容仅供参考,不构成投资建议,请谨慎对待。

评论
0 / 300

根据《网络安全法》实名制要求,请绑定手机号后发表评论

登录后输入评论内容
投资日历
更多