Awesome Chinese LLM 整理了开源的中文大语言模型(LLM),主要关注规模较小、可私有化部署且训练成本较低的模型,目前已收录了100多个相关资源。 Ai学习资源 2025年06月05日 44 点赞 0 评论 428 浏览
Awesome MCP Servers Awesome MCP Servers 是一个开源项目,整合了超过 3000 个基于 Model Context Protocol (MCP) 的服务器资源,覆盖浏览器自动化、金融、游戏、安全、科研等多个领域。它支持本地和云部署,提供丰富的开发工具和社区支持,使 AI 模型能够高效调用外部数据和服务,提升应用灵活性与功能性。 AI项目与工具 2025年06月12日 74 点赞 0 评论 430 浏览
Zonos Zonos是一款由Zyphra开发的高保真文本到语音(TTS)模型,支持零样本语音克隆和多语言生成,具备精细的情感与语音参数控制能力。其采用Transformer和SSM混合架构,基于大规模语音数据训练,适用于有声读物、虚拟助手、多媒体创作及无障碍技术等多个领域。模型开源且支持实时语音生成,具有广泛的应用潜力。 AI项目与工具 2025年06月12日 69 点赞 0 评论 431 浏览
JoyCaption JoyCaption是一款开源图像提示词生成工具,支持多种图像风格和内容类型,具备丰富的生成模式和灵活的提示控制功能。它适用于社交媒体、图像标注、内容创作、视觉辅助及教育等多个场景,能够生成高质量的描述性字幕和提示词,提升图像处理和创作效率。该工具性能优越,且完全免费开放。 AI项目与工具 2025年01月16日 91 点赞 0 评论 431 浏览
Video Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积(STC)连接器和音频分支,显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。 AI项目与工具 2025年06月12日 50 点赞 0 评论 431 浏览
StableV2V StableV2V是一款基于文本、草图和图片输入的开源视频编辑工具,利用Prompted First-frame Editor(PFE)、Iterative Shape Aligner(ISA)和Conditional Image-to-video Generator(CIG)三大模块,实现视频中物体的精准编辑与替换,同时保持编辑内容与原始视频在动作和深度信息上的高度一致性,适用于电影制作、教育、 AI项目与工具 2025年06月12日 21 点赞 0 评论 434 浏览
Arxiv 一款能够一键将arXiv上的论文转换为Markdown格式的浏览器插件,无论该论文呈现的是摘要、PDF版本还是HTML版本。 Ai开源项目 2025年06月05日 100 点赞 0 评论 434 浏览
ACI.dev ACI.dev 是一个开源 AI 基础设施平台,支持 600 多种预构建工具集成,涵盖主流应用如 Gmail、Slack 和 Notion。提供灵活的函数调用和 MCP 服务器访问方式,具备多租户认证、动态工具发现及自然语言权限管理功能。平台兼容多种 LLM 框架,支持多语言开发,具备监控与日志功能,适用于智能体开发与部署。 AI项目与工具 2025年06月11日 77 点赞 0 评论 434 浏览
GOT-OCR2.0 创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。 Ai平台模型 1970年01月01日 0 点赞 0 评论 434 浏览
DeepFloyd DeepFloyd IF是一个强大的文本到图像生成模型,能够生成高分辨率和逼真度的图像。它结合了先进的语言理解和图像生成技术,提供了多种功能,如超分辨率、风格迁移和零样本学习。 Ai绘画生成 1970年01月01日 0 点赞 0 评论 434 浏览