深度学习 - 智狐AI导航

STranslate

STranslate是一款面向Windows用户的多功能翻译和OCR工具，支持多种语言翻译，包括划词、截图和监听剪贴板等多种方式，并集成了多家翻译服务接口。它还具备基于PaddleOCR技术的离线OCR功能，支持中文、英文、日文和韩文的识别。此外，该工具还具备快捷键操作、历史记录和在线升级等功能，是提高工作效率的理想工具。

AI项目与工具 2025年06月12日 10 点赞 0 评论 772 浏览

AnimePro FLUX

AnimePro FLUX是一款基于Flux模型优化的动漫风格图像生成工具，支持高质量二次元插画创作。它具备灵活的生成步数控制、高效的硬件兼容性以及出色的细节和色彩表现，广泛应用于艺术创作、游戏开发、动画制作及教育等领域。

AI项目与工具 2025年06月12日 16 点赞 0 评论 772 浏览

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段，生成高度可控且逼真的动画，保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异，适用于虚拟现实、游戏、人机交互等多个领域。

AI项目与工具 2025年06月11日 24 点赞 0 评论 771 浏览

Stable Audio Open Small

Stable Audio Open Small 是由 Stability AI 与 Arm 联合开发的轻量级文本到音频生成模型，参数量降至 3.41 亿，适配移动设备和边缘计算场景。基于深度学习与模型压缩技术，支持快速生成音效、音乐片段等音频内容，适用于实时音频生成任务。具备高效运行、低功耗、多场景应用等特点，可用于音乐创作、游戏音效、视频配乐等领域。

AI项目与工具 2025年06月11日 35 点赞 0 评论 771 浏览

PixVerse V4

PixVerse V4 是一款基于 AI 的视频生成工具，支持通过文本或图片快速生成高质量视频，最快仅需 5 秒。具备音效生成、人声配音、视频风格转换等功能，适用于多种创作场景。其在语义理解、物理表现和特效处理方面有显著提升，适合个人创作、广告营销、教育及影视娱乐等领域使用。

AI项目与工具 2025年06月12日 97 点赞 0 评论 770 浏览

Jodi

Jodi是由中国科学院计算技术研究所和中国科学院大学推出的扩散模型框架，基于联合建模图像域和多个标签域，实现视觉生成与理解的统一。它支持联合生成、可控生成和图像感知三种任务，利用线性扩散Transformer和角色切换机制，提升生成效率和跨领域一致性。Jodi使用Joint-1.6M数据集进行训练，包含20万张高质量图像和7个视觉域标签，适用于创意内容生成、多模态数据增强、图像编辑与修复等场景。

AI项目与工具 2025年06月11日 32 点赞 0 评论 769 浏览