开源工具 - 智狐AI导航

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 555 浏览

TimesFM 2.0

TimesFM 2.0是谷歌推出的开源时间序列预测模型，采用仅解码器架构，支持处理长达2048个时间点的单变量序列，具备灵活的预测频率选择与分位头预测功能。模型通过大规模自监督预训练，覆盖多个领域，具有优秀的泛化能力。适用于零售、金融、交通、环境监测等多个场景，为数据分析与决策提供支持。

AI项目与工具 2025年06月12日 69 点赞 0 评论 554 浏览

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 548 浏览

Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型，具备高效计算能力和紧凑结构，支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构，结合高效与精准优势，支持无位置编码（NoPE）处理128K tokens上下文。内存需求降低72%，推理时仅激活1B参数，适用于边缘设备部署、长文本分析及企业级应用开发，适合资源受限环境下的AI研究与

AI项目与工具 2025年06月11日 42 点赞 0 评论 541 浏览

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 537 浏览

Devika

Devika是一款开源的AI编程工具，支持自然语言指令解析、复杂任务分解以及跨平台代码生成。凭借其先进的AI搜索与推理能力，Devika能够协助开发者高效完成从概念到实现的全过程，涵盖新功能开发、代码重构、Bug修复及自动化测试等多个应用场景。同时，其模块化架构便于扩展，确保了在不同项目中的灵活性与实用性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 536 浏览