灵境矩阵是百度推出的一个基于文心大模型的智能体(Agent)平台。它支持开发者根据自己的行业领域和应用场景,选择不同的开发方式来构建产品,以适应大模型时代的需求。开发者可以通过低成本的prompt编排方式来开发智能体,同时平台还提供了流量分发路径,帮助开发者完成商业闭环。通过灵境矩阵,开发者可以利用...
MagicVideo-V2是字节跳动公司团队开发的一款AI视频生成模型和框架。它通过集成文本到图像(Text-to-Image, T2I)模型、图像到视频(Image-to-Video, I2V)模型、视频到视频(Video to Video, V2V)模型和视频帧插值(Video Frame In...
在这个信息爆炸的时代,我们常常被如何高效、准确地获取知识所困扰。而现在,一个全新的解决方案正在悄然崛起——百川智能,一家致力于用AI技术改变知识获取方式的科技公司。百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的A...
腾讯混元大模型,这是一款由腾讯全方位自研的大型通用语言模型,拥有强悍的参数规模超过千亿级别,预训练语料库超过2万亿tokens。其独步全球的中文理解与创作能力,以及出色的逻辑推理能力和稳定的任务执行能力,都令人震撼。在2023年这短短的不到两个月内,腾讯混元大模型已经取得了举足轻重的成就。9月6日,...
Outfit Anyone是一种虚拟试穿技术,它可以让用户在照片上穿上任何衣服。它是阿里巴巴集团智能计算研究所开发的一个创新项目,利用先进的人工智能和机器学习技术,提供高质量和细节一致的虚拟试穿效果。它可以适应不同的姿势和身材,甚至可以在动漫角色上试穿服装。它有可能改变电子商务和时尚行业的发展,让用...
DDColor是阿里达摩院研究的一种基于深度学习的图像上色模型,它可以自动将黑白或灰度图像着色,使图像更加生动逼真。它使用了双解码器技术,能够同时考虑色彩分布和像素级详细信息,实现高度真实的图像上色效果。它还利用多尺度视觉特征和颜色损失来提高着色的语义合理性和颜色丰富性。DDColor的黑白上色测试...
Etna模型是七火山科技推出的一个文生视频的AIGC模型,它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒,每秒可达60帧,分辨率最高可达4K(3840*2160),画面细腻逼真。该模型采用先进的技术架构,在语言模型和图像模型中插入时空卷...
云雀大模型是字节跳动公司开发的一款大规模预训练语言模型。该模型采用 Transformer 架构,它能够处理多种自然语言处理任务,如聊天、绘画、写作和学习。云雀大模型利用了大量的数据进行训练,包括文本、图像、视频和音频等,以学习丰富的语言知识和语境信息。此外,它还具有视频内容理解能力,能够识别视频中...
EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说,EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件(例如说话、唱歌的声音),EMO就能够根据音频内容生成一个生动的视频,视频中的...
GPT-4是OpenAI开发的最新一代大型语言模型。它能够接受文本和图像输入,生成类似人类的文本输出。GPT-4在多种专业和学术基准上表现出了接近人类的水平,例如在模拟律师资格考试中取得前10%的成绩。此外,GPT-4在处理复杂任务、理解多语言和图文混合内容方面有显著的改进。它还能处理长达2.5万字...
MuseV是一个由腾讯音乐娱乐旗下的天琴实验室推出的基于SD扩散模型的高保真虚拟人视频生成框架。支持文生视频、图生视频、视频生视频等多种生成方式,能够保持角色一致性,且不受视频长度限制。这意味着用户可以通过MuseV轻松地将文本、图像或现有视频转换成高质量的虚拟人视频,无需担心角色形象的不统一或视频...
悟道大模型是由北京智源人工智能研究院发起的超大规模预训练模型研究项目,旨在以原始创新为基础实现预训练技术的突破,填补以中文为核心预训练大模型的空白,探索通向通用人工智能的实现路径。悟道大模型包括语言、视觉、跨模态、跨语言等多个领域的大模型系列,如悟道·天鹰、悟道·视界、悟道·天鹰AquilaCode...
Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。它能够根据用户的文本描述生成长达 60 秒、1080P 高质量视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。并在单个生成视频中创建多个镜头,准确保留角色和视觉风格。其功能特点有以下几个方面:文...
天工是国内首个对标ChatGPT的双千亿级大语言模型,也是一个智能对话助手。它通过自然语言与用户进行交互,能够满足各种需求,包括文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。「天工」的AI生成能力非常强大,可以支持1万字以上的文本对话,实现20轮次以上的用户交互,无论是在学习、职场还...
讯飞星火大模型是由科大讯飞推出的新一代跨领域的认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。讯飞星火大模型可基于自然文本、语音的方式提供多场景文本生成、语言理解、知识问答、逻辑推理、数学解答、代码生成和多模态7大能力,快速生成文本、图片、代码等内容。适用于营销、...
天壤小白是一个基于语言大模型的AI应用开发平台,无需代码开发,即可快速、灵活地搭建个性化的AI应用。它可以帮助用户实现知识客服、广告文案、总结摘要、多语言翻译、新闻稿写作、会议提纲等多个场景的AI服务。同时提供了一些AI工具组件,如语义搜索、向量数据库等,以及一些AI场景应用的示例。它是一个专业的A...
魔搭ModelScope社区是一个AI模型社区,它汇聚了各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。魔搭ModelScope社区的目标是降低AI的应用门槛,让每个人都能够方便地使用和开发AI模型。魔搭ModelScope社区的模型涵盖了视觉、语音、自然语言处理、...
书生·天际LandMark是全球首个城市级NeRF实景三维大模型。它涵盖了2000多亿个训练参数,通过空地倾斜摄影数据构建城市级场景的NeRF模型,并以4K级图像精度准确呈现大范围三维城市场景。这个模型具有实时渲染和自由编辑的功能,能够展现城市的广阔与细腻,真实与自由。书生·天际LandMark突破...