小叶云-AI创意工坊是一个融合了尖端AIGC技术的创新平台。我们专注于提供高效且经济的高清AI绘画生成服务。我们的AI绘画工具依托 cutting-edge 的Midjourney和Stable Diffusion生成技术,能够创作出具有丰富细节和生动氛围的艺术画作,无尽扩展您的想象力边际。此外,我...
Leonardo AI是一个AI绘图平台,它使用先进的人工智能和机器学习技术来生成艺术素材,基于Stable Diffusion,同时深度集成了Stable Diffusion的各种插件,比如ControlNET的openpose姿势参考、局部重绘、prompt提示等等,甚至还提供了傻瓜式在线训练自...
追影视频生成是一款基于人工智能技术的视频生成工具。它可以快速生成高质量的视频内容,提供丰富的视频模板和智能编辑功能,让用户能够轻松制作出令人印象深刻的视频作品。由通义实验室-开放视觉-追影团队推出。在追影视频生成中,用户可以根据需求选择预设的舞蹈模板,或者上传特定的人物图片作为跳舞主角。追影还支持对...
MagicVideo-V2是字节跳动公司团队开发的一款AI视频生成模型和框架。它通过集成文本到图像(Text-to-Image, T2I)模型、图像到视频(Image-to-Video, I2V)模型、视频到视频(Video to Video, V2V)模型和视频帧插值(Video Frame In...
Etna模型是七火山科技推出的一个文生视频的AIGC模型,它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒,每秒可达60帧,分辨率最高可达4K(3840*2160),画面细腻逼真。该模型采用先进的技术架构,在语言模型和图像模型中插入时空卷...
DeepFaceLab是一款强大的开源软件,用于利用深度学习技术创建AI换脸视频。它通过卷积神经网络和自编码器等先进技术训练并生成换脸模型,使得一个人的脸部可以被替换成另一个人的脸,且生成的效果极其逼真。尽管使用DeepFaceLab需要一定的技能和耐心,但它的强大功能和灵活性使得用户可以轻松地优化...
Boximator是字节跳动推出的一款利用深度学习技术进行视频合成的先进工具。它使用文本提示和额外的盒子约束来生成丰富且可控制的视频运动,从而为用户创造独特的视频场景提供了灵活的运动控制。具体来说,Boximator可以通过文本精准控制生成视频中人物或物体的动作,能生成包含多个角色以及特定类型运动的...
Stable Video是由StabilityAI在2023年11月发布的视频生成式大模型。它是一种潜在扩散模型,能够支持文本到视频的生成、图像到视频的生成,以及从单一视角到多视角的3D合成。用户可以通过输入文本或上传图片来生成视频,还可以自定义视频的各种参数,如镜头控制、运动速度等。这款工具的核心...
Moonvalley.ai是一款功能强大的文本到视频生成式AI模型。它可以从简单的文字描述中生成高清视频和动画,涵盖各种不同的风格,包括超现实视频、动漫以及介于两者之间的所有内容。用户只需提供简要的文字提示,即可创造电影级的视觉效果。该模型主打高清、16:9电影画质,视频质量比大多数其他一代AI视频...
Animate Anyone是一种基于扩散模型打造的可控视频生成框架,通过图文就能制作高质量人类跳舞视频。用户只需上传一张人像,以及一段提示词,就能生成对应的视频,而且改变提示词,生成的人物的背景和身上的衣服也会跟着变化。简单来说就是,一张图、一句话就能让任何人或角色在任何场景里跳舞。用户可以通过多...
PixelDance是由字节跳动开发的一款高动态视频生成模型,它能够根据用户提供的图片和文本描述来生成具有复杂场景和动态效果的视频。这项技术特别在于它结合了图像指令(针对视频片段的首尾帧)和文本指令,使得生成的视频不仅视觉上丰富,而且动作细节丰富,能够展现出高度的动态性。PixelDance提供了两...
Vidu 是中国首个长时长、高一致性、高动态性的视频大模型,由生数科技联合清华大学发布。这个模型采用了原创的 U-ViT 架构,融合了 Diffusion(扩散) 与 Transformer 技术,能够一键生成长达 16 秒、分辨率高达 1080P 的高清视频内容。Vidu 不仅能够模拟真实物理世界...
VideoCrafter2是腾讯推出的一个先进的视频生成模型,它借助深度学习技术,致力于提高视频的视觉质量、动态效果以及概念组合,能够根据用户提供的文本描述生成高质量、流畅的视频作品。具体来说,VideoCrafter2的核心功能包括:文本到视频(Text-to-Video):用户只需输入一段描述,...
Haiper AI是一家致力于构建下一代内容创作的最佳感知基础模型的公司,位于伦敦,专注于开发先进的视频内容创作技术。他们的核心产品利用强大的AI模型,为创作者提供卓越的感知基础模型,将文本和图像转换成引人入胜的动态视频,极大地简化了视频制作过程,助力他们将创意变为现实。Haiper AI提供多项主...
「通义听悟」是通义家族新成员,依托通义千问语言模型、音视频AI模型能力,为用户带来音频和视频内容记录和阅读的全新体验,成为在工作和学习中的AI助手,让每个人都能亲身去体验AI功能给我们带来的效率提升和灵感迸发。 通义听悟可以帮助用户在会议、学习、访谈、培训等场景下:实时记录交流内容,多语言翻译;批量...
PandaGPT是一个利用人工智能读取、总结和回答文件相关问题的工具。它由ChatGPT模型驱动,该模型是在大量文本和代码数据集上进行训练的大型语言模型。PandaGPT可以用于读取和总结各种文件,包括PDF、Word文档甚至图片。它还可以用于回答有关文件内容的问题。要使用PandaGPT,只需将文...
Jukebox是由OpenAI开发的一个先进的音乐生成模型,它能够创建新的音乐作品,包括旋律和歌词。这个模型使用深度学习技术,可以根据用户指定的音乐风格、艺术家类型和其他参数来生成音乐。Jukebox不仅能够模仿已知艺术家的风格,还能够创造出全新的音乐体验。用户不仅可以在这里探索歌曲集合,还可以指定...
Harmonai是一个开源生成音频工具,专注于开源的生成音频模型,让每个人都能轻松愉快地进行音乐制作。他们的目标是让音乐制作更加容易和有趣,让每个人都能表达自己的创造力。该公司推出的Dance Diffusion模型是其核心技术之一。该模型利用先进的AI算法,可以生成定制的无限音乐库,为用户提供高品...
M2UGen是一个由腾讯和新加坡国立大学共同研发的多模态音乐生成模型,它具备音乐生成、理解和编辑的能力。具体来说,M2UGen可以接收文字、图片、视频或音频作为输入,然后生成与之相匹配的音乐。例如,给它一段文字,如诗句或故事,它能够创作出与文字内容相应的音乐;对于图片,它能创作出匹配的音乐,让图片仿...
CodeGemma是一个由Google推出的基于Gemma模型构建的开源代码模型系列。它专门设计用于代码生成和理解,提供了强大的代码自动补全和生成功能。它有两个主要的预训练模型:CodeGemma 7B和CodeGemma 2B。其中,7B模型专门用于代码补全和根据代码前缀和/或后缀生成代码,而2...