多模态-AI工具导航 | AI工具大全，国内外AI工具一站式导航网站

Agent云

企业专供全行业商品级智能体，手机端都能用的AI—PPT工具...

吱意

吱意简介：吱意是一款集合机器翻译和人工智能创作为一体的AI工具平台。它提供了机器翻译、文本分析、知识图谱等服务。这个平台可以帮助用户进行多语言之间的快速翻译，还支持译后编辑校对。此外，吱意还能为有音频无字幕视频进行翻译并添加双语字幕，以及基础文本翻译。它还能为文字创造灵感，一句话描述即可生成创...

M2UGen

M2UGen是一个由腾讯和新加坡国立大学共同研发的多模态音乐生成模型，它具备音乐生成、理解和编辑的能力。具体来说，M2UGen可以接收文字、图片、视频或音频作为输入，然后生成与之相匹配的音乐。例如，给它一段文字，如诗句或故事，它能够创作出与文字内容相应的音乐；对于图片，它能创作出匹配的音乐，让图片仿...

AppAgent

AppAgent是一个多模态智能体，由腾讯和德州大学达拉斯分校的研究团队合作开发。它是一种基于大型语言模型的多模态手机用户代理框架，可模拟人类在智能手机上的操作。AppAgent可以通过自主学习和模仿人类的点击和滑动手势，在手机上执行复杂的任务，与应用程序进行交互。它通过引入一种基于大型语言模型的多...

Google Gemini

Google Gemini是由谷歌推出的一款人工智能多模态大模型，于2023年12月6日发布。这个模型具有强大的功能，能够同时识别文本、图像、音频、视频和代码五种类型的信息。它还能理解并生成主流编程语言的高质量代码，如Python、Java、C++，并且进行了全面的安全性评估。这个模型标志着人工智能...

Ferret-UI

Ferret-UI是苹果公司与哥伦比亚大学研究团队联合发布的一个多模态AI大语言模型。它专为增强对移动端用户界面（UI）屏幕的理解而设计，具备引用、定位和推理功能。这个模型能够理解手机屏幕上的内容并执行任务，专注于移动端和用户交互。主要特点包括：指代和定位：能够理解和引用UI屏幕上的特定元素，如图标...

Yi大模型

Yi大模型是由李开复博士领导的AI公司“零一万物”发布的一款开源的中英双语预训练大模型。这个模型在多个性能指标上取得了国际最佳性能认可，被称为“全球最强开源模型”。Yi-34B模型特别之处在于它拥有全球最长的200K上下文窗口，能够处理40万汉字的超长文本输入，这在语言模型中是非常重要的，因为它对于...

M2UGen

BuboGPT

BuboGPT是字节跳动推出的一种先进的大型语言模型（LLM），它具有将文本、图像和音频等多模态输入进行整合的能力，并且具备将回复与视觉对象进行对接的独特功能，可以执行跨模态交互并做到对多模态的细粒度理解。这显示出BuboGPT在对齐或未对齐的任意图像音频数据理解方面有着出色的对话能力。项目地址：h...

Mini-Gemini

Mini-Gemini是一个简单而有效的框架，用于增强多模态视觉语言模型（VLMs），由中国香港中文大学和 SmartMore 的研究人员共同推出。尽管VLMs在促进基本视觉对话和推理方面取得了进展，但与先进的模型如GPT-4和Gemini相比，性能差距仍然存在。Mini-Gemini试图从高分辨率...

盘古大模型

盘古大模型 3.0 是一个面向行业的AI大模型系列，旨在提升核心竞争力，协助客户、合作伙伴、开发者在各行业落地人工智能并创造价值。盘古大模型 3.0系列包含自然语言、视觉、多模态、预测、科学计算大模型等五个基础大模型，可以为用户提供知识问答、文案生成、代码生成，以及多模态大模型的图像生成、图像理解等...

腾讯混元大模型

腾讯混元大模型，这是一款由腾讯全方位自研的大型通用语言模型，拥有强悍的参数规模超过千亿级别，预训练语料库超过2万亿tokens。其独步全球的中文理解与创作能力，以及出色的逻辑推理能力和稳定的任务执行能力，都令人震撼。在2023年这短短的不到两个月内，腾讯混元大模型已经取得了举足轻重的成就。9月6日，...

GPT-4

GPT-4是OpenAI开发的最新一代大型语言模型。它能够接受文本和图像输入，生成类似人类的文本输出。GPT-4在多种专业和学术基准上表现出了接近人类的水平，例如在模拟律师资格考试中取得前10%的成绩。此外，GPT-4在处理复杂任务、理解多语言和图文混合内容方面有显著的改进。它还能处理长达2.5万字...

阿里翻译

我们生活在一个多元化世界，而随着全球化的进程，语言表达出现了前所未有的挑战和要求。阿里翻译，是阿里巴巴集团倾力推出的实时在线翻译网站，特色之处在于全面支持200多种语言的翻译服务，能够紧贴各领域的翻译需求，帮助用户随时随地突破语言障碍。不仅如此，阿里翻译进一步赋予了翻译高级别的可能性，如文档翻译、图...

跃问StepChat

AI工具箱专注于人工智能的工具导航,收录了国内外5000+个AI工具！为用户提供丰富的AI资源。帮助您加入人工智能浪潮，自动化高效完成任务！...

跃问StepChat

AI工具箱专注于人工智能的工具导航,收录了国内外5000+个AI工具！为用户提供丰富的AI资源。帮助您加入人工智能浪潮，自动化高效完成任务！...

<< 1 1/1 >>

Agent云

吱意

M2UGen

AppAgent

Google Gemini

Ferret-UI

Yi大模型

M2UGen

BuboGPT

Mini-Gemini

盘古大模型

腾讯混元大模型

GPT-4

阿里翻译

跃问StepChat

跃问StepChat

在线客服