开源 - 智狐AI导航

Stagehand

Stagehand 是一款基于自然语言处理的 AI 工具，专注于网页自动化操作。其核心功能包括自然语言驱动的 `act`、`extract` 和 `observe` API，支持原子化指令执行和多模型适配。Stagehand 可实现网页测试、数据抓取、表单操作及内容监控等多样化任务，广泛应用于网页测试、数据分析、办公自动化等领域。

AI项目与工具 2025年06月12日 51 点赞 0 评论 831 浏览

OpenMemory MCP

OpenMemory MCP 是一款基于开放模型上下文协议（MCP）的开源工具，支持 AI 工具间共享上下文信息，提升交互效率。具备本地化存储、统一管理界面、标准化 API 及多平台兼容性，适用于软件开发、项目管理等场景。数据全程本地处理，确保隐私与安全，采用 Docker 部署并结合零知识证明技术增强安全性。</p>

AI项目与工具 2025年06月11日 51 点赞 0 评论 831 浏览

VoiceCanvas

VoiceCanvas 是一款开源的多语言语音合成平台，基于 AI 技术提供高质量文字转语音服务，支持超过 50 种语言。用户可通过上传简短音频实现个性化声音克隆，并集成多种语音服务以保障输出质量。平台适用于内容创作、教育、企业及个人等多种场景，提升语音内容制作效率。

AI项目与工具 2025年06月11日 96 点赞 0 评论 831 浏览

Vanna.AI

一个基于人工智能的Python软件包，只需提出问题即可从去数据库里找到相应的数据，帮助生成Snowflake、BigQuery、Athena和Postgres等数据库的SQL。

Ai编程建站 2025年06月05日 95 点赞 0 评论 829 浏览

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 828 浏览

OpenEMMA

OpenEMMA是一个开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型（MLLMs），能够处理视觉数据和复杂驾驶场景的推理任务。它通过链式思维推理机制提升轨迹规划和感知任务性能，并集成了优化的YOLO模型以提高3D边界框预测的准确性。此外，OpenEMMA支持人类可读的输出，适用于多种驾驶环境，包括城市道路、高速公路、夜间及复杂天气条件下的驾驶。

AI项目与工具 2025年06月12日 36 点赞 0 评论 828 浏览

Multiverse

Multiverse是由Enigma Labs开发的全球首个基于AI生成的多人游戏模型，支持实时交互与动态世界生成，确保玩家视角一致。其核心技术包括联合动作向量和双视角通道堆叠，有效解决多人游戏中的同步难题。模型训练成本低，可在普通PC上运行，且项目全面开源，适用于多人游戏开发、VR/AR、AI训练、教育等多个领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 825 浏览

DUIX

硅基智能打造的AI数字人智能交互平台。通过将数字人交互能力开源，开发者可自行接入多方大模型、语音识别（ASR）、语音合成（TTS）能力，实现数字人实时交互。

Ai开源项目 2025年06月05日 84 点赞 0 评论 824 浏览

DevDocs

DevDocs是一款面向开发者的技术文档爬取与处理工具，支持1至5层深度爬取，具备智能去重、多线程处理及内容清洗功能。其支持Markdown和JSON格式输出，并集成MCP协议，便于与AI工具对接。该工具可通过Docker快速部署，适用于AI训练、文档整理、知识管理等多种场景，提升开发效率与数据可用性。

AI项目与工具 2025年06月12日 16 点赞 0 评论 823 浏览

OpenThinker

OpenThinker-32B 是一款由多所高校联合开发的开源推理模型，拥有 328 亿参数和 16,000 token 上下文支持，以高效的数据利用和严格的质量控制著称。模型基于少量数据实现优异性能，适用于数学、科学、代码生成等多种推理任务。全面开源，提供模型权重、代码和数据集，支持研究与开发扩展。

AI项目与工具 2025年06月12日 23 点赞 0 评论 822 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期