StarVector StarVector 是一个开源多模态视觉语言模型,支持图像和文本到可编辑 SVG 文件的转换。采用多模态架构,结合图像编码与语言模型,生成结构紧凑、语义丰富的 SVG 内容。基于 SVG-Stack 数据集训练,适用于图标设计、艺术创作、数据可视化等多种场景,具备良好的性能和扩展性。 AI项目与工具 2025年06月12日 68 点赞 0 评论 478 浏览
Pixel Reasoner Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。 AI项目与工具 2025年06月11日 30 点赞 0 评论 479 浏览
蓝心大模型BlueLM 蓝心大模型(BlueLM)是vivo推出的自研通用大模型矩阵,包含十亿、百亿、千亿三个参数量级共5款,主要面向端侧和云端服务,用于复杂逻辑推理等应用场景。 Ai平台模型 1970年01月01日 0 点赞 0 评论 481 浏览
xLAM xLAM 是 Salesforce 开源的一款大型语言模型,专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能,并基于 Transformer 架构实现。它在多个基准测试中表现出色,适用于自动化任务、模板共享、插件开发和教育等多个应用场景。 AI项目与工具 2025年06月12日 55 点赞 0 评论 483 浏览
TinyTroupe TinyTroupe是一款基于大型语言模型的Python库,专注于生成逼真的虚拟人物行为。它通过构建虚拟角色(TinyPerson)与环境(TinyWorld),实现个性化、高自由度的行为模拟,并支持多智能体间的互动。该工具适用于市场研究、产品测试、用户体验优化等多个领域,为企业提供洞察力与决策支持。 --- AI项目与工具 2025年06月12日 69 点赞 0 评论 484 浏览
百度灵医Bot 百度灵医Bot作为百度推出的医疗大模型应用,通过其强大的语言处理能力和专业医疗知识库,为用户提供了全面、安全、智能的医疗健康服务。 创作工具 1970年01月01日 0 点赞 0 评论 486 浏览
RoboBrain RoboBrain是由智源研究院开发的开源具身大脑模型,支持任务规划、可操作区域感知和轨迹预测等功能。其基于LLaVA框架,采用多阶段训练策略,具备高分辨率图像处理和长历史帧记忆能力。适用于多机器人协作、复杂任务执行及实时优化场景,依托ShareRobot数据集提升模型性能,广泛应用于机器人操作领域。 AI项目与工具 2025年06月12日 78 点赞 0 评论 487 浏览
ItiNera ItiNera是一款由香港大学与麻省理工学院合作开发的智能城市行程规划系统,基于大型语言模型和空间优化技术,为用户提供个性化、高效、连贯的Citywalk路线规划服务。系统包含兴趣点数据库构建、请求解析、偏好感知检索、空间优化及行程生成五大模块,支持实时动态信息更新,适用于个人旅游、城市漫步、短途旅行等多种场景。 AI项目与工具 2025年06月12日 16 点赞 0 评论 489 浏览
YouMind YouMind是一款以AI为核心的内容整理与创作平台,支持从多种信息源中提取关键信息并生成创意作品。凭借Anthropic、OpenAI和Meta的顶级语言模型技术支持,它能够提供高效、稳定的服务,同时保障用户隐私安全。无论是学术研究、内容创作还是教育培训,YouMind都能显著提升用户的信息处理能力和创作效率。 AI项目与工具 2025年06月12日 82 点赞 0 评论 492 浏览
SANA 1.5 SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器,专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术,能够在不同计算预算下灵活调整模型性能。支持多语言输入,并具备开源特性,适用于创意设计、影视制作、教育等多个领域。实验表明,其生成质量接近行业领先水平,同时显著降低计算成本。 AI项目与工具 2025年06月12日 56 点赞 0 评论 493 浏览