SpatialVLA SpatialVLA是一款由多机构联合研发的空间具身通用操作模型,具备强大的3D空间理解能力与跨平台泛化控制能力。通过Ego3D位置编码和自适应动作网格技术,实现精准的环境感知与动作生成。支持零样本任务执行与快速微调,适用于工业、物流、医疗等多个领域,推动机器人技术的发展与应用。 AI项目与工具 2025年06月12日 39 点赞 0 评论 630 浏览
商汤如影SenseAvatar 商汤如影作为商汤科技旗下的产品,展现了其在人工智能领域的深厚实力和创新能力。通过提供多功能的大模型服务,商汤如影有助于推动各行业的智能化升级,实现降本增效,促进创新。 创作工具 2026年06月23日 0 点赞 0 评论 632 浏览
LongVU LongVU是一款由Meta AI团队研发的长视频理解工具,其核心在于时空自适应压缩机制,可有效减少视频标记数量并保留关键视觉细节。该工具通过跨模态查询与帧间依赖性分析,实现了对冗余帧的剔除及帧特征的选择性降低,并基于时间依赖性进一步压缩空间标记。LongVU支持高效处理长视频,适用于视频内容分析、搜索索引、生成描述等多种应用场景。 AI项目与工具 2025年06月12日 65 点赞 0 评论 633 浏览
Mistral Medium 3 Mistral Medium 3是Mistral AI推出的一款多模态语言模型,兼具高性能与低成本优势,适用于企业级应用。支持混合云部署、定制化微调及多模态任务处理,可广泛应用于编程辅助、智能客服、数据分析及知识管理等领域,具备良好的扩展性和系统集成能力。 AI项目与工具 2025年06月11日 76 点赞 0 评论 633 浏览
xLAM xLAM 是 Salesforce 开源的一款大型语言模型,专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能,并基于 Transformer 架构实现。它在多个基准测试中表现出色,适用于自动化任务、模板共享、插件开发和教育等多个应用场景。 AI项目与工具 2025年06月12日 55 点赞 0 评论 635 浏览
《DeepSeek从入门到精通》 《DeepSeek从入门到精通》是一份系统介绍DeepSeek技术特点、应用场景及使用方法的指南。文章涵盖提示语设计、模型选择、AI伦理、实战案例等内容,旨在帮助用户提升AI交互效率,掌握高级提示语设计技巧,推动人机协作能力的发展。适用于开发者、研究人员及AI初学者。 AI项目与工具 2025年06月12日 99 点赞 0 评论 635 浏览
SANA 1.5 SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器,专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术,能够在不同计算预算下灵活调整模型性能。支持多语言输入,并具备开源特性,适用于创意设计、影视制作、教育等多个领域。实验表明,其生成质量接近行业领先水平,同时显著降低计算成本。 AI项目与工具 2025年06月12日 56 点赞 0 评论 638 浏览
Fox Fox-1是一系列由TensorOpera开发的小型语言模型,基于大规模预训练和微调数据,具备强大的文本生成、指令遵循、多轮对话和长上下文处理能力。该模型在多个基准测试中表现出色,适用于聊天机器人、内容创作、语言翻译、教育辅助和信息检索等多种应用场景。 AI项目与工具 2025年06月12日 60 点赞 0 评论 639 浏览