长文本

Jina

Jina-embeddings-v3 是一款基于 Transformer 架构的文本嵌入模型,支持多语言处理和长文本分析。通过 LoRA 适配器和 Matryoshka 表示学习技术,模型能够生成高质量的嵌入向量,适用于多种任务,包括查询-文档检索、聚类、分类和文本匹配。其高性能和成本效益使其适用于生产环境及边缘计算场景。

LongCite

LongCite是清华大学研发的一项旨在提升大型语言模型在长文本问答中可信度和可验证性的项目。它通过生成细粒度的句子级引用,帮助用户验证模型回答的准确性。LongCite包含LongBench-Cite评估基准、CoF自动化数据构建流程、LongCite-45k数据集,以及基于该数据集训练的模型。这些模型能够处理长文本内容,提供准确的问答服务,并附带可追溯的引用,增强信息的透明度和可靠性。

MiniCPM 3.0

MiniCPM 3.0是一款由面壁智能开发的高性能端侧AI模型,具有40亿参数。它采用LLMxMapReduce技术,支持无限长文本处理,增强了上下文理解能力。MiniCPM 3.0在Function Calling方面表现出色,接近GPT-4o的水平。该模型还包括RAG三件套,提升了中文检索和内容生成的质量。模型已开源,量化后仅占用2GB内存,适合端侧设备部署,保障数据安全和隐私。

LongWriter

LongWriter是一款由清华大学与智谱AI合作开发的长文本生成模型,能够生成超过10,000字的连贯文本。该模型基于增强的长上下文大型语言模型,采用了直接偏好优化(DPO)技术和AgentWrite方法,能够处理超过100,000个token的历史记录。LongWriter适用于多种应用场景,包括学术研究、内容创作、出版行业、教育领域和新闻媒体等。

书生·浦语

书生·浦语是上海人工智能实验室开发的一款开源AI大模型,具备卓越的推理能力和超长文本处理功能。该模型能够处理高达一百万词元的文本输入,支持联网搜索并整合信息,显著提升了处理复杂问题的能力。书生·浦语秉持开源理念,免费提供商用授权,旨在通过高质量开源资源赋能创新,推动AI技术的发展和应用。它支持多种功能,包括超长文本处理、增强推理能力、自主信息搜索与整合等,并提供了多样化的参数版本,以满足不同的应用

智谱AI开放平台

智谱AI开放平台是一个面向开发者的大模型开发平台,集成了多种先进模型和技术资源。该平台支持统一API接入,涵盖AI视频生成、文生图、多模态视觉、长文本等多种大模型。平台还提供定制化知识解决方案和互动体验,支持云上私有化部署。适用于软件开发者、数据科学家、AI研究者、企业决策者和创业者等人群。