开源 - 智狐AI导航

EasyVideoTrans

EasyVideoTrans是一款开源的AI视频翻译工具，支持从视频中提取音频并翻译字幕，同时提供多样化的声音风格以实现自然的配音效果。它适用于视频创作者、教育机构、企业培训及品牌宣传等领域，能够快速生成高质量的中文版本视频，满足跨语言沟通的需求。

AI项目与工具 2025年06月12日 39 点赞 0 评论 752 浏览

CodeGeeX

CodeGeeX是一款基于大模型的全能的智能编程助手。它可以实现代码的生成与补全、自动添加注释、代码翻译以及智能问答等功能，能够帮助开发者显著提高工作效率。

Ai编程建站 2025年06月05日 94 点赞 0 评论 752 浏览

谛韵DiffRhythm

DiffRhythm（谛韵）是一款由西北工业大学与香港中文大学（深圳）联合开发的端到端音乐生成工具，基于潜扩散模型技术，能在10秒内生成包含人声和伴奏的完整歌曲。用户只需提供歌词和风格提示，即可快速获得高质量音乐作品。其支持多语言输入，具备歌词对齐、风格定制、非自回归生成等技术优势，广泛应用于音乐创作、影视配乐、教育及个人创作等领域。

AI项目与工具 2025年06月12日 70 点赞 0 评论 753 浏览

LiberSonora

一个基于AI的、开源有声书工具集，LiberSonora提供智能字幕提取、AI标题生成、多语言翻译等功能，并且支持 GPU 加速、批量离线处理。

Ai开源项目 2025年06月05日 65 点赞 0 评论 754 浏览

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 754 浏览

Reverb ASR

Reverb ASR是一款基于深度学习的开源自动语音识别与说话人分离工具，采用20万小时高质量英语语音数据训练，具备高精度语音转录能力，支持逐字稿控制及多种解码模式。其显著特点是擅长处理长时间语音内容，并在长篇幅识别任务中超越其他开源模型。Reverb ASR适用于播客、会议记录、法庭记录等多个应用场景，为用户提供灵活且高效的语音转文字解决方案。

AI项目与工具 2025年06月12日 55 点赞 0 评论 754 浏览

DeepWiki

DeepWiki是一款由Devin团队开发的AI代码阅读助手，基于自然语言处理技术，帮助用户理解GitHub代码库并提供详细的文档级解答。支持深度研究、交互式图表生成、私有仓库文档创建等功能，适用于开源项目学习、代码审查、团队协作及教育培训等场景。目前已索引超3万仓库，处理超40亿行代码，对开源项目免费开放。

AI项目与工具 2025年06月11日 36 点赞 0 评论 754 浏览

BlinkShot

BlinkShot 是一款基于 AI 的实时图像生成工具，支持用户通过输入描述性提示快速生成高质量图像。它采用 Together AI 的 Flux Schnell 技术，提供自定义分辨率和生成步骤功能，适合艺术创作、设计、游戏开发、广告营销等多个领域。工具基于开源技术开发，具备良好的可扩展性和可观察性。

AI项目与工具 2025年06月12日 19 点赞 0 评论 754 浏览

Rasa

一个开源的AI机器学习框架，专注于构建自然语言对话系统，如聊天机器人和语音助手，Rasa广泛应用于客户服务、智能助手、企业自动化等多个领域。

Ai开源项目 2025年06月05日 50 点赞 0 评论 755 浏览

HunyuanVideo

HunyuanVideo是一款由腾讯开源的视频生成模型，具备130亿参数量，支持物理模拟、高文本语义还原、动作一致性和电影级画质等功能。它通过时空压缩的潜在空间训练，融合Causal 3D VAE与Transformer架构，实现图像和视频的统一生成，广泛应用于电影制作、音乐视频创作、游戏开发以及教育等领域。

AI项目与工具 2025年06月12日 87 点赞 0 评论 755 浏览

开源

首页

开源

列表

默认

浏览次数

发布日期