多模态 - 智狐AI导航

Ichigo

Ichigo是一款开源的多模态AI语音助手，采用混合模态模型，支持实时处理语音和文本交织序列。它通过统一的Transformer架构实现跨模态联合推理，提供低延迟的实时性能，并支持多语言、多轮对话及模糊输入处理。Ichigo适用于智能家居、个人助理、客户服务、教育和健康咨询等多种应用场景，展现了高效、灵活的技术优势。

AI项目与工具 2025年06月12日 96 点赞 0 评论 616 浏览

AddressCLIP

AddressCLIP 是一种基于 CLIP 技术的端到端图像地理定位模型，由中科院自动化所与阿里云联合开发。它通过图像与地址文本对齐和地理匹配技术，实现街道级别的精确定位，无需依赖 GPS。模型在多个数据集上表现优异，适用于城市管理、社交媒体、旅游导航等多个场景，具备良好的灵活性和多模态结合潜力。

AI项目与工具 2025年06月12日 30 点赞 0 评论 617 浏览

MiniMax

MiniMax-01是由MiniMax推出的高性能AI模型系列，包含语言模型MiniMax-Text-01和视觉多模态模型MiniMax-VL-01。该系列采用线性注意力机制，支持处理长达400万token的上下文，性能接近国际领先模型。具备强大的语言理解、多模态处理及长文本分析能力，适用于企业、教育、科研及开发等多个领域。API定价合理，提供高效的长文本处理与多模态交互解决方案。

AI项目与工具 2025年06月12日 30 点赞 0 评论 617 浏览

BetterYeah

斑头雁BattleYeah AI，AI机器人构建平台，简单、易用、全新交互形式，API无缝集成至企业系统，帮助企业实现AI生产力革命。

Ai平台模型 2025年06月05日 67 点赞 0 评论 618 浏览

A2A

A2A是谷歌推出的首个智能体交互协议，旨在实现不同框架和供应商构建的AI智能体之间的高效协作。它支持多模态交互、长期任务管理和实时反馈，基于HTTP、JSON-RPC等标准设计，便于与现有系统集成。A2A具备安全性、可扩展性和用户体验协商能力，适用于企业流程自动化、跨平台客服、招聘优化、供应链协同和智能办公等多个场景。

AI项目与工具 2025年06月12日 59 点赞 0 评论 619 浏览

cpmGO

cpmGO是面壁智能推出的端侧智能助手，专为汽车座舱设计，支持多模态交互与本地化处理，保障隐私并适应弱网环境。其基于MiniCPM模型优化，具备智能任务处理、快速响应及灵活定制能力，适用于多种智能汽车场景，提升人车交互的便捷性与安全性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 623 浏览

EMMA

EMMA是一款基于Gemini模型的端到端自动驾驶多模态模型，可直接从原始相机传感器数据生成驾驶轨迹并执行多种任务，如3D对象检测、道路图元素识别及场景理解。该模型利用自然语言处理技术实现跨任务协作，并展现出强大的泛化能力，但在某些方面仍需改进。

AI项目与工具 2025年06月12日 38 点赞 0 评论 623 浏览

Vidu 1.5

Vidu 1.5是一款基于多模态视频大模型的AI生成工具，支持参考生视频、图生视频和文生视频生成，通过精准的语义理解能力，在30秒内完成高质量视频创作，适用于影视、动漫、广告等多行业场景，助力创作者高效产出多样化内容。

AI项目与工具 2025年06月12日 80 点赞 0 评论 624 浏览

Second Me 是由心识宇宙开发的开源 AI 身份模型，支持创建个性化且私有的 AI 代理，代表用户的真实自我。它提供 Chat Mode 和 Bridge Mode 两种交互模式，适用于不同场景下的沟通与信息反馈。支持本地运行，保障数据隐私。Second Me 采用分层记忆模型、个性化对齐架构等技术，具备多角色适应、智能记忆管理和链式推理能力，广泛应用于个人助理、职业发展、社交互动、学习辅导

AI项目与工具 2025年06月12日 67 点赞 0 评论 625 浏览

LibreChat

一个开源多模态AI对话平台，它支持与多种AI模型服务的集成，包括OpenAI、Azure、Anthropic和Google等。

AI写作对话 2025年06月05日 92 点赞 0 评论 625 浏览

多模态

首页

多模态

列表

默认

浏览次数

发布日期