谛韵DiffRhythm DiffRhythm(谛韵)是一款由西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模型技术,能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示,即可快速获得高质量音乐作品。其支持多语言输入,具备歌词对齐、风格定制、非自回归生成等技术优势,广泛应用于音乐创作、影视配乐、教育及个人创作等领域。 AI项目与工具 2025年06月12日 70 点赞 0 评论 407 浏览
Hunyuan3D 2.0 Hunyuan3D 2.0是腾讯推出的3D资产生成系统,支持从文本和图像生成高分辨率3D模型。系统采用两阶段生成流程,包含几何生成与纹理合成两个核心模块,具备高精度、高质量输出能力。支持多平台使用,涵盖游戏开发、UGC创作、电商、工业设计等多个应用场景,并提供多个开源模型供研究与开发使用。 AI项目与工具 2025年06月12日 89 点赞 0 评论 407 浏览
Goku Goku是由香港大学与字节跳动联合开发的AI视频生成模型,支持文本到图像、文本到视频、图像到视频等多种生成方式。其核心优势在于高质量的视频输出、低制作成本及多模态生成能力。Goku+作为扩展版本,专注于广告视频创作,具备稳定的动作表现和丰富的表情交互。模型基于大规模数据集和先进架构,适用于广告、教育、娱乐等多个领域,提升了内容创作效率与质量。 AI项目与工具 2025年02月11日 29 点赞 0 评论 408 浏览
XVERSE XVERSE-MoE-A36B是一款由中国元象公司开发的先进MoE(混合专家模型)开源大模型。该模型具备2550亿总参数和360亿激活参数,性能卓越,训练时间缩短30%,推理性能提升100%。它采用前沿的MoE架构,通过稀疏激活、专家网络和门控机制等技术,实现了高效性能和低成本部署。适用于自然语言处理、内容创作、智能客服、教育辅助、信息检索及数据分析等多个领域。 AI项目与工具 2025年06月12日 66 点赞 0 评论 408 浏览
BestGpts BestGPTs.app是一个提供ChatGPT定制版本的平台。它旨在提供符合用户需求的先进人工智能能力。我们的平台旨在改革企业和个人如何使用AI以提升他们的运营。 GPTs应用 2025年06月05日 72 点赞 0 评论 408 浏览
MeshPad MeshPad 是一款基于草图输入的交互式 3D 网格生成与编辑工具,可将二维草图快速转化为高质量三维模型并支持实时修改。采用三角形序列表示和 Transformer 模型,实现高效、精准的网格生成与调整。通过推测性预测策略,提升计算效率,缩短编辑时间。生成的网格在精度上优于现有方法,适用于艺术设计、建筑设计和工业设计等多个领域。 AI项目与工具 2025年06月12日 86 点赞 0 评论 408 浏览
Reverb ASR Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具,采用20万小时高质量英语语音数据训练,具备高精度语音转录能力,支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容,并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景,为用户提供灵活且高效的语音转文字解决方案。 AI项目与工具 2025年06月12日 55 点赞 0 评论 408 浏览
Voice Changer Voice Changer是一款基于状态空间模型的音频处理工具,可将音频中的语音转换为不同音色,同时保留情感和表达细节。用户可通过选择预设声音库或克隆个人声音实现个性化转换,并对语音细节进行精细调整。该工具广泛应用于内容创作、游戏配音、有声书制作及品牌音频开发等领域,提供高质量的音频输出和灵活的控制选项。 AI项目与工具 2025年06月12日 48 点赞 0 评论 408 浏览
SparkAi系统 SparkAi系统支持GPT4.0、Midjourney绘画、GPT3.5 API绘画、GPT联网功能、绘画广场功能、Prompt功能,后台自定义添加,用户也可自定义添加+实时语音识别输入、用户会员套餐、用户每日签到功能、支持手机电脑不同布局页面自适应。 Ai开源项目 2025年06月05日 32 点赞 0 评论 408 浏览
ChatTTSPlus ChatTTSPlus 是一款基于深度学习的语音合成工具,它通过 TensorRT 技术实现了显著的性能提升,同时支持语音克隆、模型压缩与加速等功能。该工具不仅适用于桌面端,还能够部署于移动设备,满足多种应用场景需求,包括有声读物制作、语言学习辅助、客户服务及娱乐等领域。 --- AI项目与工具 2025年06月12日 13 点赞 0 评论 408 浏览