多模态 - 智狐AI导航

逻辑智能

逻辑智能（InsiderX）是一款企业级AI工具平台，支持构建智能化工作流，具备多模态感知和自主决策能力，可处理文本、图像和语音数据，实现业务流程自动化。平台支持私有知识库构建、数据安全保障及内容审查，广泛应用于金融、法律、生物医药等行业，助力企业提升效率和降低成本。

AI项目与工具 2025年06月12日 28 点赞 0 评论 699 浏览

Being

Being-M0是由北京大学、中国人民大学等机构联合研发的首个大规模人形机器人通用动作生成模型。基于百万级动作数据集 MotionLib 和 MotionBook 编码技术，实现动作序列的高效表示与生成。该模型支持文本驱动动作生成、动作迁移及多模态数据处理，可应用于人形机器人控制、动画制作、VR/AR、人机交互及运动康复等多个领域，显著提升动作生成的多样性和语义对齐精度。

AI项目与工具 2025年06月11日 13 点赞 0 评论 699 浏览

千川AI

通过使用自然语言处理（NLP）技术，AI可以理解给定内容的上下文、语气和意图，并生成相关且吸引人的书面输出。

AI写作对话 2025年06月05日 27 点赞 0 评论 699 浏览

MobA

MobA是一种基于多模态大型语言模型的移动智能体，通过高级全局智能体（GA）和低级局部智能体（LA）的两级架构，实现任务规划、分解与执行，支持跨应用操作和自动化流程。其反思模块助力高效处理复杂任务，广泛应用于个人助理、智能家居控制、移动设备自动化及教育等领域。

AI项目与工具 2025年06月12日 35 点赞 0 评论 699 浏览

悟道大模型

北京智源研究院开发的一系列超大规模智能模型系统，悟道大模型旨在在语言处理领域达到或超越国际先进水平。

Ai平台模型 2025年06月05日 62 点赞 0 评论 700 浏览

ImageRAG

ImageRAG 是一种基于检索增强生成（RAG）技术的图像生成工具，通过动态检索相关图像提升文本到图像模型的生成能力。它能够增强对罕见概念的理解与生成，提升图像的真实度和相关性，支持多模态生成与个性化定制。无需额外训练即可适配多种 T2I 模型，广泛应用于创意设计、品牌推广、教育及影视等领域。

AI项目与工具 2025年06月12日 12 点赞 0 评论 700 浏览

UniFluid

UniFluid是由谷歌DeepMind与麻省理工学院联合开发的统一自回归框架，支持图像生成与视觉理解任务。它通过连续视觉标记处理多模态输入，结合Gemma模型和VAE技术，实现高质量图像生成与强大视觉理解能力。该框架在图像编辑、视觉问答和图像描述等任务中表现出色，具备良好的下游任务迁移能力，适用于创意设计、内容创作等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 700 浏览

AutoGLM

AutoGLM-Web是一款基于大型语言模型开发的AI浏览器助手，具备网页浏览、信息检索、内容总结及邮件自动回复等功能。它通过自进化在线课程强化学习框架不断优化性能，支持多场景应用，适用于办公自动化、学术研究、电商运营及客户服务等领域。

AI项目与工具 2025年06月12日 74 点赞 0 评论 702 浏览

UNI

UNI-CourseHelper是一款基于AI技术的学习辅助工具，支持多模态问答、长文解析、思维链推理等功能，覆盖多个学科领域。通过Markdown格式展示答案，支持图片和文档提问，适用于学生、教师及研究人员，提升学习效率与理解深度。

AI项目与工具 2025年06月12日 86 点赞 0 评论 702 浏览

DeepSeek服务器繁忙怎么解决？16个免费R1满血版平替

本文介绍了16款可替代DeepSeek R1满血版的AI工具，涵盖本地部署、API调用及多平台解决方案。这些工具支持深度思考、联网搜索、多模态交互等功能，部分平台还提供高速专线、文档解析、图片识别等增强特性，满足不同场景下的AI需求。

AI项目与工具 2025年06月12日 62 点赞 0 评论 704 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期