开源 - 智狐AI导航

Docling

Docling 是一款开源工具，支持多种文档格式的解析与转换，包括 PDF、DOCX、PPTX、图片和 HTML。它通过高级 PDF 理解和 OCR 技术，将文档内容转换为统一的结构化格式（如 Markdown 和 JSON）。Docling 可与 LlamaIndex 和 LangChain 集成，增强文档的检索和问答能力，并提供简洁的命令行界面，适用于自动化文档处理、数据科学、知识管理和信息检

AI项目与工具 2025年06月12日 41 点赞 0 评论 601 浏览

LangBot

LangBot 是一款开源的多平台即时通讯机器人，支持多种主流通信工具及大语言模型。具备多模态交互、多轮对话、插件扩展和安全管理等功能，适用于企业客服、个人助理、社区管理、教育辅导和内容创作等场景，提供灵活、安全的自动化服务。

AI项目与工具 2025年06月12日 18 点赞 0 评论 601 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 600 浏览

VideoSrt

VideoSrt是一个可以识别视频语音自动生成字幕SRT文件的开源软件工具。适用于快速、批量的为媒体（视频/音频）生成中/英文字幕、文本文件的业务场景。

Ai开源项目 2025年06月05日 31 点赞 0 评论 600 浏览

WordToCard

一个能将Word文档内容智能转化为精美知识卡片的图文制作开源免费工具，能将 Word 文档自动转换为结构清晰、美观大方的图文卡片。

排版编辑 2025年06月05日 79 点赞 0 评论 599 浏览

Wan2.1

Wan2.1是阿里云推出的开源AI视频生成模型，支持文生视频与图生视频，具备复杂运动生成和物理模拟能力。采用因果3D VAE与视频Diffusion Transformer架构，性能卓越，尤其在Vbench评测中表现领先。提供专业版与极速版，适应不同场景需求，已开源并支持多种框架，便于开发与研究。

AI项目与工具 2025年06月12日 47 点赞 0 评论 599 浏览

All GPTs

All GPTs目录是一个综合性在线资源，列出了各种GPT（预训练生成式转换器）模型、AI代理和应用程序。它是一个集中的地方，可以找到和探索基于AI的解决方案。

GPTs应用 2025年06月05日 76 点赞 0 评论 598 浏览

Qwen3

Qwen3 是阿里巴巴推出的下一代大型语言模型，支持“思考模式”和“非思考模式”，适用于复杂与简单任务。具备 119 种语言支持，优化了编码与 Agent 能力，数据量达 36 万亿 token，采用四阶段训练流程。提供多种模型配置，涵盖从轻量级到企业级应用。在多项基准测试中表现优异，广泛应用于文本生成、机器翻译、法律文书、技术文档、医疗辅助等领域。

AI项目与工具 2025年06月11日 11 点赞 0 评论 598 浏览

极客编辑器

极客编辑器是一款所见即所得富文本沉浸式写作排版编辑器，它注重高效创作，可多开文档编辑，同时支持Markdown语法输入及一键排版。

排版编辑 2025年06月05日 21 点赞 0 评论 597 浏览

AbletonMCP

AbletonMCP 是一个开源工具，通过模型上下文协议（MCP）将 Ableton Live 与 Claude AI 连接，实现音乐制作过程中的 AI 辅助。支持双向通信，允许用户通过 AI 创建和编辑 MIDI 与音频轨道、选择乐器和效果、控制播放等。技术上采用 JSON 协议和套接字通信，适用于音乐创作、实时制作、教学及音频后期处理等多种场景。

AI项目与工具 2025年06月12日 99 点赞 0 评论 596 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期