Lumiere是谷歌发布的一个文本到视频扩散模型,于2024年正式发布。这个模型能够直接生成全帧率、低分辨率视频,通过训练海量文本和视频数据,可以将文字描述直接转化为高质量、真实、多样且连贯动作的视频。适用于多种内容创作和视频编辑应用,如图像到视频、视频修复和风格化生成。Lumiere的时空扩散U-...
Boximator是字节跳动推出的一款利用深度学习技术进行视频合成的先进工具。它使用文本提示和额外的盒子约束来生成丰富且可控制的视频运动,从而为用户创造独特的视频场景提供了灵活的运动控制。具体来说,Boximator可以通过文本精准控制生成视频中人物或物体的动作,能生成包含多个角色以及特定类型运动的...
Moonvalley.ai是一款功能强大的文本到视频生成式AI模型。它可以从简单的文字描述中生成高清视频和动画,涵盖各种不同的风格,包括超现实视频、动漫以及介于两者之间的所有内容。用户只需提供简要的文字提示,即可创造电影级的视觉效果。该模型主打高清、16:9电影画质,视频质量比大多数其他一代AI视频...
VideoCrafter2是腾讯推出的一个先进的视频生成模型,它借助深度学习技术,致力于提高视频的视觉质量、动态效果以及概念组合,能够根据用户提供的文本描述生成高质量、流畅的视频作品。具体来说,VideoCrafter2的核心功能包括:文本到视频(Text-to-Video):用户只需输入一段描述,...
Veo 是 Google DeepMind 开发的一种先进的视频生成模型。它能够生成1080p高分辨率、长时长的高质量视频。Veo 支持多种电影和视觉风格,能够准确捕捉文本提示的细微差别,并提供创意控制。这个模型旨在使视频制作更易于访问,并在叙事、教育等领域开启新的可能性。目前,Veo 还没有向公众...
MagicVideo-V2是字节跳动公司团队开发的一款AI视频生成模型和框架。它通过集成文本到图像(Text-to-Image, T2I)模型、图像到视频(Image-to-Video, I2V)模型、视频到视频(Video to Video, V2V)模型和视频帧插值(Video Frame In...
EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说,EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件(例如说话、唱歌的声音),EMO就能够根据音频内容生成一个生动的视频,视频中的...
有言是一款消费级的超写实 3D 虚拟人 AIGC 视频生成工具。它致力于高质量、高效率、低门槛、低成本地创作三维虚拟人视频。这个平台提供了一站式服务,从内容生成到后期制作,为用户提供了全套视频创作解决方案。用户只需输入文字,平台即可基于 AIGC 技术自动生成 相应的 3D动画、形象和场景,极大地加...
DeepBrain AI是一家基于深度学习技术的科技型公司,专注于视频合成和语音合成。它利用人工智能技术,为用户提供了AI视频生成制作平台。DeepBrain AI能够通过简单的文本快速创建逼真的AI虚拟人视频,用户可以从100多个不同的AI模型中选择,找到最适合自己品牌的AI虚拟人,让它以任何语言...
灵动人像LivePortrait是阿里云推出的一个数字人视频生成工具。这个工具只需要一张肖像照片和一段文字或音频,就可以生成一段开口说话的数字人视频。它可应用于视频直播、聊天机器人、企业营销等多种场景。LivePortrait工具由运动模块和生成模块组成,采用了阿里云自研的口型预测算法,以提高口型的...