自然语言处理

Tesseract

Tesseract是一款开源的光学字符识别(OCR)引擎,支持多语言识别和多种图像格式。其具备高精度的文字识别能力,适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行,并提供丰富的编程接口和自定义训练功能,便于开发者集成和优化识别效果。

Perplexity Deep Research

Perplexity Deep Research 是一款基于 AI 的深度研究工具,能执行多轮搜索并整合海量信息,生成结构化研究报告,支持多种格式导出。具备强大的推理能力与高效处理速度,适用于金融、市场、技术等多个领域,也可用于个人场景。在准确性方面优于多个主流模型,提供免费与付费两种使用模式。

CodeName Goose

一款开源代码智能体Agent,Codename Goose不仅能自动生成代码,还能安装、执行、测试。

Ola

Ola是一款由多机构联合开发的全模态语言模型,支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略,逐步扩展模型的多模态理解能力,同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器,结合局部-全局注意力机制,实现高效多模态处理,在多项任务中表现优异。

HippoRAG 2

HippoRAG 2是俄亥俄州立大学开发的检索增强生成框架,旨在提升RAG系统在模拟人类长期记忆方面的表现。它通过个性化PageRank算法、深度段落整合和知识图谱构建,实现高效的多跳推理与上下文感知检索。系统具备持续学习能力,可实时吸收新知识,适用于智能问答、知识管理、教育、医疗及法律金融等领域。

Excelly

Excelly-AI是一个文本转Excel公式的工具,它基于最先进的自然语言处理技术,可以处理复杂的语言结构和语义,并毫不费力地将纯文本转换为功能强大的Excel公式。

Bearly.AI

Bearly,AI阅读总结、写作和内容生成助手。

MiLoRA

MiLoRA是一种参数高效的大型语言模型微调方法,通过奇异值分解将权重矩阵分为主要和次要两部分,专注于次要部分的优化以降低计算成本,同时保持模型的高精度和高效性。它在自然语言处理任务中表现出色,适用于文本分类、情感分析、问答系统等多个领域,并在多租户环境和实时内容生成中展现出显著优势。 ---

OpenAudio S1

OpenAudio S1是Fish Audio推出的文本转语音(TTS)模型,基于200万小时音频数据训练,支持13种语言。采用双自回归架构和RLHF技术,生成自然流畅的语音,支持50多种情感和语调标记。具备零样本和少样本语音克隆功能,仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版,满足

学术云端AI写作助手

学术云端AI写作助手是一款面向学生、教师和研究人员的高效学术写作工具。其核心功能包括智能选题、摘要生成、段落布局建议、智能纠错、文献检索与引用、内容生成等,旨在提升论文写作效率和质量。支持多种论文类型,适用于选题规划、论文撰写及教学辅助等多种场景,具备良好的实用性与专业性。