训练模型 - 智狐AI导航

ClearerVoice

ClearerVoice-Studio 是一个基于复数域深度学习算法的开源语音处理框架，集成了语音增强、分离及音视频说话人提取等功能。它通过先进的 FRCRN 和 MossFormer 系列模型，实现了高效的语音信号处理，并具备强大的预训练能力和灵活的接口设计。该框架广泛应用于智能助手、会议记录、电话会议、公共安全等领域，助力提升语音处理技术的实际应用价值。

AI项目与工具 2025年06月12日 81 点赞 0 评论 701 浏览

火山方舟

火山方舟是一个开放的大模型生态平台，它提供了一系列功能，包括模型广场、模型体验、模型训练推理和模型应用。这个平台旨在加速大模型能力渗透到千行百业，助力模型提供方和使用...

Ai平台模型 1970年01月01日 0 点赞 0 评论 684 浏览

Lobe

Lobe通过一个免费、易于使用...

Ai平台模型 1970年01月01日 0 点赞 0 评论 677 浏览

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架，采用两阶段流程：先生成场景深度图，再进行细节渲染。通过注意力机制实现文本与图像的精准对齐，无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域，具备良好的兼容性和性能优势。

AI项目与工具 2025年06月12日 32 点赞 0 评论 675 浏览

NeMo

NeMo 是一款基于 NVIDIA 技术的端到端云原生框架，专为生成式 AI 模型的设计与部署而打造。它具备模块化架构、多模态支持、优化算法及分布式训练能力，可应用于语音识别、自然语言处理、文本到语音转换、对话式 AI 等多个领域，同时支持预训练模型微调和端到端开发流程，为企业提供高效灵活的解决方案。

AI项目与工具 2025年06月12日 38 点赞 0 评论 663 浏览

CDial

CDial-GPT是一项由清华大学研发的基于大型中文对话数据集LCCC的预训练对话生成模型。该模型提供LCCC-base和LCCC-large两个版本的数据集，并具备预训练、微调、多模态学习等功能，能够生成高质量的对话回应。其应用场景涵盖客户服务、智能助手、在线教育等多个领域。

AI项目与工具 2025年06月12日 63 点赞 0 评论 660 浏览

Diff

Diff-Instruct是一种基于积分Kullback-Leibler散度的知识迁移方法，用于从预训练扩散模型中提取知识并指导生成模型的训练。它能够在无需额外数据的情况下，通过最小化IKL散度提升生成模型的性能。Diff-Instruct适用于多种场景，包括预训练扩散模型的蒸馏、现有GAN模型的优化以及视频生成等。

AI项目与工具 2025年06月12日 61 点赞 0 评论 651 浏览

Scale AI

更好的数据会带来更好的性能...

Ai平台模型 1970年01月01日 0 点赞 0 评论 638 浏览

CogVideo

目前最大的通用领域文本生成视频预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。

Ai平台模型 2025年06月05日 16 点赞 0 评论 637 浏览

MetaMorph

MetaMorph是一款基于多模态大模型的工具，通过Visual-Predictive Instruction Tuning（VPiT）技术实现文本和视觉token的生成。它在视觉理解和生成领域表现优异，能够克服其他生成模型的常见失败模式，同时有效处理专业术语和复杂语义问题。MetaMorph展示了统一建模方法的优势，支持多模态数据的高效处理，并在视觉生成与理解基准测试中取得竞争力表现。

AI项目与工具 2025年06月12日 53 点赞 0 评论 620 浏览

训练模型

首页

训练模型

列表

默认

浏览次数

发布日期