OCR - 智狐AI导航

TextIn Tools

是一款免费在线OCR工具，包含文字识别、表格识别，PDF转文件等功能，识别率高，体验好，免费。

创作工具 2026年06月23日 0 点赞 0 评论 505 浏览

Audiocraft/MusicGen

一个简单而可控的音乐生成LM，具有文本和旋律调节。

创作工具 2026年06月23日 0 点赞 0 评论 513 浏览

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型，采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理，强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本，适用于研究、开发及各类应用场景，展现卓越性能。

AI项目与工具 2025年06月12日 67 点赞 0 评论 535 浏览

Zerox

Zerox是一款基于GPT-4o-mini模型的开源OCR工具，支持多种文件格式，具备零样本识别能力，可高效处理扫描文档和复杂布局内容。其输出为Markdown格式，便于编辑与使用，同时提供API接口，适用于企业文档管理、学术研究、法律金融等多个场景，显著提升文档处理效率和准确性。

AI项目与工具 2025年06月12日 20 点赞 0 评论 537 浏览

T

T-Rex Label是一款基于AI的自动标注工具，依托T-Rex2模型实现一键标注和零样本检测功能。它通过视觉提示简化标注流程，无需额外训练即可直接应用于多种场景，包括农业、工业、生物医药等。用户可通过GitHub账号快速登录并上传数据，利用AI自动生成初步标注结果，随后人工检查与修正，最终导出为常用格式供模型训练使用。

AI项目与工具 2025年06月12日 83 点赞 0 评论 540 浏览

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 547 浏览

超级助理

超级助理是百度智能云发布的AI浏览器插件，可以随时感知用户的需求，在解析复杂问题、辅助文案创作、智能文档处理、对话式搜索和全文翻译等场景中提供帮助。

Ai办公效率 2025年06月05日 16 点赞 0 评论 549 浏览

AI Comic Translate

只需上传您想要翻译的漫画图片，用户只需上传您想要翻译的漫画图片，AI Comic Translate将自动识别文本并在几分钟内生成高质量的翻译。

Ai图片处理 2025年06月05日 39 点赞 0 评论 550 浏览

Versatile

Versatile-OCR-Program是一款开源多模态OCR工具，支持从教育材料中提取文本、公式、表格等结构化数据，输出为JSON或Markdown格式，准确率高达90%-95%。它基于DocLayout-YOLO、Google Vision和MathPix等技术，支持多语言处理，适用于教育数据集制作、教学辅助、AI模型训练及个人学习等场景。

AI项目与工具 2025年06月11日 77 点赞 0 评论 555 浏览

白描网页版

图片转文字/ 图片转Excel表格/PDF转Word

格式转换 2025年06月05日 40 点赞 0 评论 560 浏览

OCR

首页

OCR

列表

默认

浏览次数

发布日期