模型 - 智狐AI导航

TANGOFLUX

TANGOFLUX是一款高效文本到音频生成模型，具备约5.15亿参数量，能够在3.7秒内生成30秒高质量音频。它采用CLAP-Ranked Preference Optimization框架优化音频输出，支持多种应用场景，包括多媒体内容创作、音频制作、播客、教育及虚拟助手开发。其开源特性推动了相关领域的技术进步。

AI项目与工具 2025年06月12日 73 点赞 0 评论 486 浏览

大模型GPT中文调教指南

ChatGPT中文调教指南为Awesome ChatGPT Prompts 的汉化版。ChatGPT中文调教指南分享了各种ChatGPT有趣的玩法

Ai提示指令 2025年06月05日 52 点赞 0 评论 485 浏览

LayerDiffusion是一种创新的AI工具，利用大规模预训练的潜在扩散模型生成具有透明度的图像。该技术引入了“潜在透明度”的概念，将图像的alpha通道透明度信息编码到潜在空间中。LayerDiffusion不仅可以生成单个透明图像，还能生成多个透明图层，支持条件控制生成和图层内容结构控制，确保高质量的图像输出。此外，它还能够生成多个透明图层，并通过共享注意力机制和低秩适应确保图层间的和谐混

AI项目与工具 2024年01月01日 69 点赞 0 评论 485 浏览

Cerebellum

Cerebellum是一款结合Claude 3.5 Sonnet与Selenium WebDriver的智能化浏览器助手，通过构建网页浏览的有向图模型，利用LLM技术分析页面内容和交互元素，智能规划操作路径并动态调整策略。它支持多浏览器操作，可精确模拟用户行为，广泛应用于网页自动化测试、数据抓取、内容管理及电子商务等多个领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 484 浏览

豆包·语音播客模型

豆包·语音播客模型是字节跳动旗下火山引擎推出的语音播客工具，基于流式模型构建，可将文本秒级转化为双人对话式播客。具有低成本、高时效、强互动特点，解决了传统AI播客内容重复、不够口语化的问题。支持低时延与可打断、深度搜索、高效创作、超长文本转播客等功能，适用于教育、娱乐、心理咨询、内容营销和有声读物制作等场景。

AI项目与工具 2025年06月11日 72 点赞 0 评论 484 浏览