生成 - 智狐AI导航

DeepClaude

DeepClaude 是一款高性能开源 AI 工具，融合 DeepSeek R1 和 Claude 模型，具备推理、创造力和代码生成能力。它提供零延迟响应、端到端加密和本地 API 管理，保障数据安全。支持高度自定义，适用于智能客服、代码生成、推理分析及教育等多场景，满足多样化需求。

AI项目与工具 2025年06月12日 71 点赞 0 评论 935 浏览

Kokoro

Kokoro-TTS是一款由hexgrad开发的轻量级文本转语音工具，基于StyleTTS 2与ISTFTNet架构，支持多种语音风格和自然语调，具备实时处理能力。支持美式与英式英语，提供10种语音包，适用于教育、游戏、客服等多种场景。支持本地部署与API集成，确保数据安全与高效运行。

AI项目与工具 2025年06月12日 33 点赞 0 评论 937 浏览

Text2CAD

Text2CAD 是一款基于人工智能的在线 CAD 设计工具，能够将自然语言描述快速转换为高精度的 CAD 模型。支持多种格式导出，具备快速设计、精准转换、易修改、云存储与协作等功能，适用于工业设计、教育、原型开发、VR/游戏设计及个性化定制等多个领域。平台提供不同版本的订阅服务，满足不同用户需求。

AI项目与工具 2025年06月11日 22 点赞 0 评论 938 浏览

Woxo

Woxo是一款基于人工智能的视频生成工具，专为社交媒体内容创作者设计。它通过AI技术将文本或概念转化为高质量视频，提供内容创意、快速编辑及定时发布等功能，支持多种社交媒体平台，显著提升视频制作效率。其多平台兼容性和批量创作能力使其成为高效内容生产的理想选择。

AI项目与工具 2025年06月12日 91 点赞 0 评论 939 浏览

GigaTok

GigaTok 是一款基于语义正则化的高参数视觉分词器，支持自回归图像生成，具备优异的图像重建与生成能力。通过一维架构和非对称扩展策略，实现高效计算与稳定训练。适用于图像生成、编辑、数据增强及多模态应用，具有广泛的技术拓展性。

AI项目与工具 2025年06月11日 74 点赞 0 评论 944 浏览

ILLUME

ILLUME是一款基于大型语言模型的统一多模态大模型，集成了视觉理解与生成能力，采用“连续图像输入 + 离散图像输出”架构，通过语义视觉分词器和三阶段训练流程，实现了高效的数据利用和多模态任务处理能力。模型能够无缝整合视觉理解与生成功能，广泛应用于视频分析、医疗诊断、自动驾驶及艺术创作等领域。

AI项目与工具 2025年06月12日 54 点赞 0 评论 945 浏览

Sloyd AI

Sloyd,一个 3D 建模平台，我们的文本转 3D 模型 AI 生成器专门用于将文本提示转换为详细的 3D 模型，可简化创建 3D 模型的过程。

3D&游戏 2025年06月05日 43 点赞 0 评论 947 浏览

NotebookLlama

NotebookLlama是一款基于Meta开发的开源工具，能够将PDF文档自动转换为高质量播客内容。它通过LLaMa模型完成PDF预处理、文本转播客脚本、增加戏剧性元素以及文本转语音合成等步骤，无需人工干预即可生成专业水准的播客。NotebookLlama提供了详细的教程和操作指南，并支持多种应用场景，包括教育、新闻、企业培训和有声书制作等。

AI项目与工具 2025年06月12日 29 点赞 0 评论 947 浏览