Marker Marker 是一款开源的高精度文档转换工具,支持 PDF、Word 等多种格式向 Markdown、JSON 和 HTML 的转换。它利用深度学习技术自动去除干扰元素,支持多语言处理,具备表格、代码块、公式识别及图像提取等功能,适用于学术研究、技术文档、教育资料等多种场景。同时支持硬件加速和批量处理,提升转换效率与用户体验。 AI项目与工具 2025年06月12日 26 点赞 0 评论 215 浏览
SmolDocling SmolDocling-256M-preview 是一款轻量级多模态文档处理模型,能将图像文档高效转换为结构化文本,支持文本、公式、图表等多种元素识别。模型参数量仅256M,推理速度快,适合学术与技术文档处理。具备OCR、布局识别、格式导出等功能,并兼容Docling,适用于文档数字化、科学研究及移动环境应用。 AI项目与工具 2025年03月22日 98 点赞 0 评论 201 浏览
Pandoc 一款强大的跨平台文档格式转换工具,支持数十种文件格式的相互转换,涵盖常见的文本、标记语言、电子书、演示文稿等类型,被广泛应用于学术写作、技术文档、博客写作等场景。 格式转换 2025年06月05日 91 点赞 0 评论 127 浏览