检索

GLM

GLM-4-Flash是一款由智谱AI开发的免费大模型API,具备强大的多轮对话、多语言处理能力以及网页检索和代码执行等功能。它利用深度学习技术,尤其是Transformer架构,来实现高效的语言处理和生成。该工具广泛应用于客户服务、内容创作、语言翻译、教育辅助和编程辅助等多个领域,为用户提供了一个全面而高效的AI解决方案。

水木AI知识库

水木AI知识库由水木AI社区发起,旨在持续收集高质量AI行业报告,AI学习资料,供相关从业者阅读学习。

AutoGLM沉思

AutoGLM沉思是一款由智谱推出的AI代理工具,支持深度研究与多步骤推理,能自主调用浏览器进行信息检索与网页操作。适用于市场分析、技术比较、产品推荐、旅游规划及教育辅助等场景,完全免费且不限量使用,突破了传统API限制,覆盖多平台信息源。

EXAONE 3.5

EXAONE 3.5是一款由LG AI研究院开发的开源AI模型,包含多种参数规模版本,专长于长文本处理和复杂场景下的推理任务。其核心技术包括检索增强生成与多步推理,可显著减少错误信息并提升准确性。此外,EXAONE 3.5还具备双语支持及强大的上下文理解能力,适用于聊天机器人、语言翻译、内容创作等多个领域。

Docling

Docling 是一款开源工具,支持多种文档格式的解析与转换,包括 PDF、DOCX、PPTX、图片和 HTML。它通过高级 PDF 理解和 OCR 技术,将文档内容转换为统一的结构化格式(如 Markdown 和 JSON)。Docling 可与 LlamaIndex 和 LangChain 集成,增强文档的检索和问答能力,并提供简洁的命令行界面,适用于自动化文档处理、数据科学、知识管理和信息检

Airweave

Airweave 是一款开源数据同步工具,支持将多种数据源(如 API、数据库、网站等)同步到图数据库和向量数据库中,提升数据检索效率。其核心功能包括无代码集成、多租户支持、数据分块、自动同步及版本控制。支持多种向量数据库,并提供灵活的部署方式,适用于企业开发、数据分析、SaaS 平台及内容管理等多个场景。

PaSa

PaSa是由字节跳动研发的基于强化学习的学术论文检索系统,能够模仿人类研究者行为,自动调用搜索引擎、分析论文内容并追踪引文网络,提供精准全面的学术文献检索服务。其核心技术包括Crawler和Selector两个智能体,结合强化学习优化,显著提升了搜索效率与准确率。PaSa适用于学术研究、高校教学、知识产权分析等多个领域,具备高效检索和复杂查询处理能力。

LongRAG

LongRAG是一个专为长文本问答设计的双视角鲁棒检索增强生成框架,包含混合检索器、LLM增强信息提取器、CoT引导过滤器和LLM增强生成器。它通过整合全局上下文与细节信息,解决长文本中的复杂问答挑战,并在多个数据集上展现优异性能。此外,其自动化微调数据构建能力增强了模型的指令遵循能力和领域适用性。

ReasonIR

ReasonIR-8B 是由 Meta AI 开发的推理密集型检索模型,基于 LLaMA3.1-8B 训练,采用双编码器架构,提升复杂查询处理能力。结合合成数据生成工具,增强模型在长上下文和抽象问题中的表现。在多个基准测试中表现优异,适用于问答系统、教育、企业知识管理和科研等领域。

SurveyX

SurveyX 是一款基于大型语言模型的学术综述生成工具,由多所高校联合开发。它通过用户输入的标题和关键词,自动生成高质量、结构化的学术综述,适用于多个研究领域。系统具备高效的文献检索与整合能力,结合智能大纲生成和内容优化技术,提升综述的准确性和逻辑性。同时支持动态更新和多模态展示,广泛应用于科研、教学及行业分析场景。