Auto-GPT是一个开源的“AI代理”,它可以根据自然语言的目标,自动地分解成子任务,并利用互联网和其他工具来实现它。它使用OpenAI的GPT-4或GPT-3.5 API,是使用GPT-4进行自主任务的第一个应用程序之一。Auto-GPT可以自动化工作流程,分析数据,提出新的建议,还可以处理文本...
VideoCrafter2是腾讯推出的一个先进的视频生成模型,它借助深度学习技术,致力于提高视频的视觉质量、动态效果以及概念组合,能够根据用户提供的文本描述生成高质量、流畅的视频作品。具体来说,VideoCrafter2的核心功能包括:文本到视频(Text-to-Video):用户只需输入一段描述,...
序列猴子是出门问问自研的一款大语言模型,它以语言为核心的能力体系涵盖了知识、对话、数学、逻辑、推理和规划等六个维度。它可以同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务,展现出强大的多模态表达能力。序列猴子的名字来源于数学家埃米尔·波雷尔提出的“无限猴子”定理,意味着它可以通...
妙笔是阿里巴巴最新开源的中文文生图模型,它与经典的Stable Diffusion 1.5版本结构相同,兼容现有的lora、controlnet等主流插件及其权重。妙笔的特点是用户可以直接输入中文进行文生图操作,生成的图像效果逼真。例如,输入“枯藤老树昏鸦,小桥流水人家。水墨画。”,妙笔能够理解诗句...
Grok-1是马斯克旗下AI创企xAI发布的一款开源AI大模型。它是一个混合专家(Mixture-of-Experts,MOE)大模型,旨在用作聊天机器人背后的引擎,用于包括问答、信息检索、创意写作和编码辅助在内的自然语言处理任务。其参数量达到了3140亿,远超OpenAI GPT-3.5的1750...
Mistral AI 是一家来自法国的人工智能服务商,由前 DeepMind 和 Meta 公司的研究人员组建的新公司。他们专注于大型语言模型和生成式人工智能的构建、培训和应用。Mistral AI 的目标是与 OpenAI 和 谷歌 竞争,为企业开发生成式人工智能基础设施。最近,他们开源了全球首个...
Veo 是 Google DeepMind 开发的一种先进的视频生成模型。它能够生成1080p高分辨率、长时长的高质量视频。Veo 支持多种电影和视觉风格,能够准确捕捉文本提示的细微差别,并提供创意控制。这个模型旨在使视频制作更易于访问,并在叙事、教育等领域开启新的可能性。目前,Veo 还没有向公众...
SDXL-Lightning是一款由字节跳动开发的开源免费的文生图开放模型,能根据文本快速生成相应的高分辨率图像。该模型能够在极短的时间内生成高质量和高分辨率的图像,是目前最快的文生图模型之一。通过渐进式对抗式蒸馏,显著提升了图像生成速度,使其可应用于需要快速响应的场景。此外,SDXL-Lightn...
魔搭ModelScope社区是一个AI模型社区,它汇聚了各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。魔搭ModelScope社区的目标是降低AI的应用门槛,让每个人都能够方便地使用和开发AI模型。魔搭ModelScope社区的模型涵盖了视觉、语音、自然语言处理、...
CodeGemma是一个由Google推出的基于Gemma模型构建的开源代码模型系列。它专门设计用于代码生成和理解,提供了强大的代码自动补全和生成功能。它有两个主要的预训练模型:CodeGemma 7B和CodeGemma 2B。其中,7B模型专门用于代码补全和根据代码前缀和/或后缀生成代码,而2...
CogVideo是目前最大的通用领域文本到视频生成预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。用于文本到视频的生成。它是基于Transformer架构的,旨在通过理解和转换文本描述来生成相应的视频...
怪兽AI知识库大模型是一款企业知识库大模型 + 智能的AI问答机器人,旨在通过零代码的方式,快速搭建和管理企业的知识库。这个平台支持团队多人协同工作,具备完善的权限管理系统,确保信息安全同时提高工作效率。利用先进的AI问答机器人技术,怪兽AI能够提供智能且精准的自动回复服务,大幅度提升客户服务体验。...
阿里云百炼是一个基于通义系列大模型和开源大模型的一站式大模型服务平台。该平台提供生成式大模型的全流程应用工具和企业大模型的全链路训练工具,支持多种开源大模型的接入及适配。这个平台旨在帮助企业和开发者快速构建、部署和应用大规模人工智能模型。它支持开箱即用的应用调用、大模型训练微调以及一站式在线灵活部署...
Codex大模型是一种人工智能模型,它可以根据自然语言的输入生成代码。它是由OpenAI开发的,OpenAI是一个由埃隆·马斯克、彼得·蒂尔、杰克·多西等知名的科技领袖和企业家创立的研究机构,它的目标是创造和推广友好的人工智能,造福全人类。Codex大模型是基于GPT-3模型的改进版本,它经过了自然...
AnyText是一种基于扩散的多语言视觉文本生成和编辑模型,它可以在图像中生成或修改任意精准的文本。AnyText支持中文、日文、韩文、英语等多种语言,可帮助电商、广告平面设计、电影制作、动画设计师、插画师、网页设计、UI设计师、数字营销等领域的人员,提供高精准、自定义的文生图像服务。AnyText...
Segment Anything是一个基于深度学习的图像分割模型,它可以根据用户的输入提示(如点或框)生成高质量的物体遮罩。它可以用于为图像中的任何物体生成遮罩,无论是常见的物体(如人、车、猫等),还是罕见的物体(如火箭、恐龙、魔法棒等)。它的特点是具有强大的零样本性能,即它可以在没有见过的类别上进...
Llama 2是Meta AI推出的新一代大型语言模型(LLM),参数规模从70亿到700亿不等。它是为对话场景而优化的,称为Llama 2-Chat,能够在多数基准上超越开源的对话模型,并且在人类评估的有用性和安全性上,可能是闭源模型的合适替代品。Meta提供了对Llama 2-Chat进行微调和...
商量拟人大模型是商汤科技推出的一款AI拟人大模型,它支持个性化角色创建与定制、知识库构建、长对话记忆、多人群聊等功能,可实现行业领先的角色对话、人设及剧情推动能力。该模型广泛应用于情感陪伴、影视/动漫/网文IP角色、明星/网红/艺人AI分身、语言角色扮演游戏等拟人对话场景。商量拟人大模型的主要功能特...
灵境矩阵是百度推出的一个基于文心大模型的智能体(Agent)平台。它支持开发者根据自己的行业领域和应用场景,选择不同的开发方式来构建产品,以适应大模型时代的需求。开发者可以通过低成本的prompt编排方式来开发智能体,同时平台还提供了流量分发路径,帮助开发者完成商业闭环。通过灵境矩阵,开发者可以利用...
MagicVideo-V2是字节跳动公司团队开发的一款AI视频生成模型和框架。它通过集成文本到图像(Text-to-Image, T2I)模型、图像到视频(Image-to-Video, I2V)模型、视频到视频(Video to Video, V2V)模型和视频帧插值(Video Frame In...
在这个信息爆炸的时代,我们常常被如何高效、准确地获取知识所困扰。而现在,一个全新的解决方案正在悄然崛起——百川智能,一家致力于用AI技术改变知识获取方式的科技公司。百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的A...
腾讯混元大模型,这是一款由腾讯全方位自研的大型通用语言模型,拥有强悍的参数规模超过千亿级别,预训练语料库超过2万亿tokens。其独步全球的中文理解与创作能力,以及出色的逻辑推理能力和稳定的任务执行能力,都令人震撼。在2023年这短短的不到两个月内,腾讯混元大模型已经取得了举足轻重的成就。9月6日,...
Outfit Anyone是一种虚拟试穿技术,它可以让用户在照片上穿上任何衣服。它是阿里巴巴集团智能计算研究所开发的一个创新项目,利用先进的人工智能和机器学习技术,提供高质量和细节一致的虚拟试穿效果。它可以适应不同的姿势和身材,甚至可以在动漫角色上试穿服装。它有可能改变电子商务和时尚行业的发展,让用...
DDColor是阿里达摩院研究的一种基于深度学习的图像上色模型,它可以自动将黑白或灰度图像着色,使图像更加生动逼真。它使用了双解码器技术,能够同时考虑色彩分布和像素级详细信息,实现高度真实的图像上色效果。它还利用多尺度视觉特征和颜色损失来提高着色的语义合理性和颜色丰富性。DDColor的黑白上色测试...
Etna模型是七火山科技推出的一个文生视频的AIGC模型,它能够根据简短的文本描述生成相应的视频内容。七火山科技发布的Etna文生视频模型支持生成视频时长达到8~15秒,每秒可达60帧,分辨率最高可达4K(3840*2160),画面细腻逼真。该模型采用先进的技术架构,在语言模型和图像模型中插入时空卷...
云雀大模型是字节跳动公司开发的一款大规模预训练语言模型。该模型采用 Transformer 架构,它能够处理多种自然语言处理任务,如聊天、绘画、写作和学习。云雀大模型利用了大量的数据进行训练,包括文本、图像、视频和音频等,以学习丰富的语言知识和语境信息。此外,它还具有视频内容理解能力,能够识别视频中...
EMO (Emote Portrait Alive) 是阿里巴巴集团智能计算研究院的研究团队开发的一个音频驱动型肖像视频生成框架。具体来说,EMO系统基于音频信号驱动来生成肖像视频。用户只需要提供一张参考图片和一段音频文件(例如说话、唱歌的声音),EMO就能够根据音频内容生成一个生动的视频,视频中的...
GPT-4是OpenAI开发的最新一代大型语言模型。它能够接受文本和图像输入,生成类似人类的文本输出。GPT-4在多种专业和学术基准上表现出了接近人类的水平,例如在模拟律师资格考试中取得前10%的成绩。此外,GPT-4在处理复杂任务、理解多语言和图文混合内容方面有显著的改进。它还能处理长达2.5万字...
MuseV是一个由腾讯音乐娱乐旗下的天琴实验室推出的基于SD扩散模型的高保真虚拟人视频生成框架。支持文生视频、图生视频、视频生视频等多种生成方式,能够保持角色一致性,且不受视频长度限制。这意味着用户可以通过MuseV轻松地将文本、图像或现有视频转换成高质量的虚拟人视频,无需担心角色形象的不统一或视频...
悟道大模型是由北京智源人工智能研究院发起的超大规模预训练模型研究项目,旨在以原始创新为基础实现预训练技术的突破,填补以中文为核心预训练大模型的空白,探索通向通用人工智能的实现路径。悟道大模型包括语言、视觉、跨模态、跨语言等多个领域的大模型系列,如悟道·天鹰、悟道·视界、悟道·天鹰AquilaCode...
Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。它能够根据用户的文本描述生成长达 60 秒、1080P 高质量视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。并在单个生成视频中创建多个镜头,准确保留角色和视觉风格。其功能特点有以下几个方面:文...
天工是国内首个对标ChatGPT的双千亿级大语言模型,也是一个智能对话助手。它通过自然语言与用户进行交互,能够满足各种需求,包括文案创作、知识问答、逻辑推演、数理推算、代码编程等多元化需求。「天工」的AI生成能力非常强大,可以支持1万字以上的文本对话,实现20轮次以上的用户交互,无论是在学习、职场还...
讯飞星火大模型是由科大讯飞推出的新一代跨领域的认知智能大模型,拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。讯飞星火大模型可基于自然文本、语音的方式提供多场景文本生成、语言理解、知识问答、逻辑推理、数学解答、代码生成和多模态7大能力,快速生成文本、图片、代码等内容。适用于营销、...
ViGen.AI是一款高质量的AI产品照片、海报和视频的生成器,专注于为电子商务领域提供高质量的产品图像。通过先进的生成算法,ViGen.AI 能够从单一的产品照片出发,自动生成多个场景和光线条件下的高清产品图像。这项服务特别适合需要大量视觉内容的电商和营销活动,能够显著提高内容生产的效率和质量。...
Cliclic AI是一个AI商品图背景编辑器,旨在帮助用户快速生成具有吸引力的商品图背景,适用于各种需要产品图设计的场景。用户可以通过使用系统预设的各种模块来搭建展示场景的框架,然后上传产品图并选择预设的场景和风格。系统会根据这些选择自动生成具有出色效果的展示图。此外,Cliclic AI还提供了...
JAY创作是一款专为电商卖家打造的AI商拍工具。通过Jay创作,用户可以一键拍出服装模特图,无需实际模特。同时,它还支持切换商品场景,拍摄出商业级摄影效果的图片。此外,Jay创作还具备商品抠图功能,可以精准识别商品主体和边缘细节,全自动处理背景去除,从而创造出彩的商品照片。它融合了最先进的人工智能技...
PixelForce是一款专注于电商图片生成领域的AI商拍工具。它利用AI技术高效生成真人模特穿搭图,包括模型模特、静物等图片。这个工具可以帮助用户告别传统的模特、摄影、后期制作、现场租赁,甚至是昂贵设备的限制。用户可以通过简单的操作,实现商拍自由,随心所欲地展示产品价值,省时省力又省钱。 Pixe...
淘宝星辰是淘宝天猫集团自研的大模型,它基于Transformer架构,并使用半自主开发的Megatron-ama框架进行训练。这款大模型主要以电商和生活服务为适用场景,能够从海量电商消费数据中持续学习,旨在增强电商和生活服务场景的体验。该大模型可以为商家提供商品文案编写、商品商家运营、商品数据分析、...
图应是一款基于AIGC技术的AI模特商拍工具,旨在为用户提供一个简单、高效且成本低廉的解决方案,以创造出高质量的商品图片。这款工具结合了AI模特、真人人台和AI商品图等多项功能,全面提升了商业摄影的效果,并显著降低了相关成本,您可以无需专业摄影设备或复杂的图像编辑软件,即刻获得专业级的商品展示效果,...
FancyTech(时代涌现)是一家专注于人工智能、内容大数据、审美量化整合与应用的跨平台电商数据智能应用系统研发商。其入门级产品聚焦在电商视频领域,品牌客户只需将电商店铺账号授权给FancyTech,自研模型驱动会自动生成商品表达视频,包括画外音、音乐、字幕等,并可根据用户数据反馈自动调优持续提升...