腾讯混元DiT是一个基于Diffusion transformer的文本到图像生成模型,也是业内首个中文原生的DiT架构文生图开源模型。该模型具有中英文细粒度理解能力,能够与用户进行多轮对话,根据上下文生成并完善图像。腾讯混元DiT的参数量达到15亿,支持中英文双语输入及理解,进一步提升了生成图像的...