开源

Trace.moe

一个开源动漫场景搜索引擎,根据图像反向搜索动漫场景,帮助用户通过截图追溯原始动漫,完全免费无广告。

Eliza

Eliza是一个基于TypeScript的开源多代理模拟框架,专为创建、部署和管理自主AI代理而设计。其主要功能涵盖多代理架构支持、角色文件框架、检索增强生成系统(RAG)、跨平台集成以及高度可扩展性。Eliza适用于聊天机器人、业务流程自动化、自主代理及游戏NPC等多种应用场景。

SurveyGO卷姬

SurveyGO是一款由清华大学与面壁智能团队联合开发的开源AI论文写作工具,支持根据用户输入的主题快速生成结构清晰、内容详实的综述文章。其核心技术LLMxMapReduce-V2利用文本卷积算法整合多篇文献,提升信息完整性与逻辑性。支持中英文双语输出,适用于科研、教学、行业分析等多种场景,显著提升文献综述的写作效率与质量。

Casibase

一个开源的AI知识库和对话系统,支持多种主流 AI 模型,具备企业级功能和多语言界面,适合企业知识管理和智能对话场景。

Umi

Umi-OCR 是一款离线 OCR 工具,支持图片、截图和 PDF 文档的文字识别,具备数学公式与二维码识别功能,可生成可搜索 PDF。支持多语言识别与界面切换,提供命令行和 HTTP 接口调用,适用于文档数字化、数据录入、教育等多个场景。

Fish Speech 1.5

Fish Speech 1.5是一款基于深度学习的文本转语音(TTS)工具,支持多语言文本输入,通过Transformer、VITS、VQVAE和GPT等技术实现高质量语音合成。它具备零样本和少样本语音合成能力,延迟时间短,无需依赖音素,泛化性强,且支持本地化部署。Fish Speech 1.5可应用于有声读物、辅助技术、语言学习及客户服务等多个领域。

FlashMLA

FlashMLA 是 DeepSeek 开发的开源 MLA 解码内核,针对 NVIDIA Hopper 架构 GPU 优化,提升可变长度序列处理效率。支持 BF16 精度、页式 KV 缓存及分块调度,内存带宽达 3000 GB/s,算力达 580 TFLOPS。适用于大语言模型推理和 NLP 任务,具备高性能与低延迟特性,支持快速部署与性能验证。

DeepFaceLive

DeepFaceLive是一款基于人工智能的面部合成技术,它可以将一个人的面部表情和动作合成到另一个人的脸上,从而实现非常逼真的面部合成效果。

HelpKit AI

HelpKit AI是一款基于GPT模型的智能问答,它可以将Notion​知识库转化为一个智能的、全天候的AI助手,提供准确即时的回答。

Tesseract

Tesseract是一款开源的光学字符识别(OCR)引擎,支持多语言识别和多种图像格式。其具备高精度的文字识别能力,适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行,并提供丰富的编程接口和自定义训练功能,便于开发者集成和优化识别效果。