Docling 是一款开源的文档解析与转换工具,能够高效处理多种文档格式(如 PDF、DOCX、PPTX、图片和 HTML),并将其转换为 Markdown 或 JSON 格式。该工具具备强大的 PDF 理解能力,支持光学字符识别(OCR),并能与 LlamaIndex 和 LangChain 等工具无缝集成,提升文档检索与问答的能力。Docling 提供了一个简洁的命令行界面,便于用户快速处理文档。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部