模型 - 智狐AI导航

LayerDiffusion

LayerDiffusion是一种创新的AI工具，利用大规模预训练的潜在扩散模型生成具有透明度的图像。该技术引入了“潜在透明度”的概念，将图像的alpha通道透明度信息编码到潜在空间中。LayerDiffusion不仅可以生成单个透明图像，还能生成多个透明图层，支持条件控制生成和图层内容结构控制，确保高质量的图像输出。此外，它还能够生成多个透明图层，并通过共享注意力机制和低秩适应确保图层间的和谐混

AI项目与工具 2024年01月01日 69 点赞 0 评论 491 浏览

Stable video diffusion online

免费激活您的图像，用 Stable Video Diffusion online 让图片动起来！

Ai视频生成 2026年06月27日 0 点赞 0 评论 493 浏览

RWKV

RWKV-7是一种先进的大模型架构，超越传统注意力机制，具备强大的上下文学习能力和高效的训练稳定性。其动态状态更新和学习率调整机制提升了模型性能，适用于文本生成、机器翻译、情感分析、对话系统及多语言处理等多种应用场景。

AI项目与工具 2025年06月12日 37 点赞 0 评论 494 浏览

大模型GPT中文调教指南

ChatGPT中文调教指南为Awesome ChatGPT Prompts 的汉化版。ChatGPT中文调教指南分享了各种ChatGPT有趣的玩法

Ai提示指令 2025年06月05日 52 点赞 0 评论 494 浏览

AssemblyAI

一个提供将音频文件、视频文件和实时语音转录为文字的平台，提供了一个简单的API，允许用户访问用于转录和语音理解的即可用的AI模型。

Ai语音工具 2025年06月05日 57 点赞 0 评论 494 浏览

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 494 浏览