生成 - 智狐AI导航

DiffusionBee

DiffusionBee是一款基于Stable Diffusion技术的离线AI艺术创作工具，支持用户通过文本提示或草图生成高质量艺术作品，同时提供图像编辑和自定义模型训练功能，适用于艺术创作、内容制作、广告设计及教育等多个领域，注重用户隐私保护。

AI项目与工具 2025年06月12日 35 点赞 0 评论 673 浏览

Audio

Audio-SDS是由NVIDIA研发的音频处理技术，基于文本提示引导音频生成，支持音效生成、音源分离、FM合成及语音增强等多种任务。该技术无需重新训练模型，即可将预训练音频扩散模型扩展为多功能工具，具备高效推理能力，适用于游戏、音乐制作、教育及智能家居等多个领域。

AI项目与工具 2025年06月11日 81 点赞 0 评论 673 浏览

ChatArt Pro

一个多功能的AI写作工具，通过提供多种写作模板和功能，帮助用户提高写作效率和质量，适用于多种写作场景和需求。它易于使用，输出内容质量高，且不断更新以满足用户需求。

AI写作对话 2025年06月05日 30 点赞 0 评论 672 浏览

DupDub

DupDub是一款由出门问问开发的AI内容生成平台，集成了AI写作、文本转语音、视频编辑等多项功能，支持70多种语言和500多种真实语音效果。它通过简化创作流程，帮助内容创作者快速生成高质量的视频、文本和音频内容，适用于营销、教育、无障碍辅助等多种应用场景，有效提升工作效率与内容影响力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 672 浏览

Revid AI

Revid AI 是一款AI驱动的视频生成工具，支持从脚本创作到视频发布的全流程操作。用户可输入创意自动生成视频内容，涵盖多种风格与语言模板，具备简单易用的编辑功能及一键发布能力。适用于社交媒体、品牌营销、教育分享及电商展示等多个场景，提升内容创作效率与传播效果。

AI项目与工具 2025年06月12日 18 点赞 0 评论 672 浏览

FLOAT

FLOAT是一款基于音频驱动的虚拟人像生成模型，利用运动潜在空间和流匹配技术，实现时间一致性视频生成。它支持情感增强，生成自然且富有表现力的虚拟人物，广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域，同时具备高效的采样和生成能力。

AI项目与工具 2025年06月12日 18 点赞 0 评论 672 浏览

OpenAudio S1是Fish Audio推出的文本转语音（TTS）模型，基于200万小时音频数据训练，支持13种语言。采用双自回归架构和RLHF技术，生成自然流畅的语音，支持50多种情感和语调标记。具备零样本和少样本语音克隆功能，仅需10到30秒音频即可生成高保真声音。适用于视频配音、播客、游戏角色语音、虚拟助手、游戏娱乐、教育培训及客服系统等场景。提供40亿参数完整版和5亿参数开源版，满足

AI项目与工具 2025年06月11日 28 点赞 0 评论 672 浏览

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 672 浏览

HoloPart

HoloPart 是一种基于扩散模型的 3D 分割工具，能准确识别并补全被遮挡的语义部件，支持几何与材质编辑等任务。其两阶段方法结合局部与全局注意力机制，提升分割精度与一致性。适用于动画制作、几何优化及数据生成等领域，已在多个数据集上取得优异性能。

AI项目与工具 2025年06月11日 84 点赞 0 评论 672 浏览

MiniMax Audio

MiniMax Audio是一款基于人工智能的语音合成工具，支持多语言、多情感及声音克隆功能，可将文本快速转换为自然流畅的语音。它具备降噪、超长文本合成、实时语音生成等特性，适用于视频配音、播客制作、游戏配音等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 672 浏览

生成

首页

生成

列表

默认

浏览次数

发布日期