开源项目 - 智狐AI导航

SoraWebui

一个开源项目，允许用户使用 OpenAI Sora 模型使用文本在线生成视频，从而简化视频创建，并具有轻松的一键网站部署功能。

Ai开源项目 2025年06月05日 62 点赞 0 评论 761 浏览

PDF2Audio

PDF2Audio 是一款开源工具，支持将 PDF 文档转换为音频内容，适用于播客制作、教育、业务演示等多个场景。其核心功能包括 PDF 转文本、生成播客脚本、文本转语音转换、多语言支持及高级编辑功能。用户可通过自定义选项调整文本生成模型、语音风格等，支持批量处理和多种模板适配，方便用户根据需求生成高质量音频。

AI项目与工具 2025年06月12日 35 点赞 0 评论 772 浏览

Make-A-Character

创新的3D角色生成框架，它通过文本描述快速创建逼真的3D角色，具有高度的定制性和逼真度。它结合了最新的人工智能技术，提供了一个直观、灵活且高效的角色创建解决方案，适用于多...

Ai平台模型 1970年01月01日 0 点赞 0 评论 774 浏览

Open NotebookLM

Open NotebookLM是一个开源工具，能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型，生成自然流畅的对话式音频，并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件，适用于教育、科研、商业分析等多个领域。

AI项目与工具 2025年06月12日 37 点赞 0 评论 779 浏览

Llama Tutor

Llama Tutor 是一款基于 AI 的开源个性化学习平台，利用 Llama 3.1 和 Together AI 技术生成定制化学习计划，涵盖多学科领域，提供互动式学习体验和精准解答。支持个人学习、学术教育、职业发展和语言学习等应用场景，致力于打造高效、有趣的沉浸式学习环境。

AI项目与工具 2025年06月12日 77 点赞 0 评论 779 浏览

AgentCPM

AgentCPM-GUI是由清华大学与面壁智能团队联合开发的开源端侧GUI代理系统，专为中文应用场景优化。基于MiniCPM-V模型，支持通过截图输入并自主执行用户指令，具备高精度GUI元素识别与OCR能力。采用强化微调和紧凑动作空间设计，提升任务执行效率与移动端适配性。适用于智能助手、自动化测试、老年人辅助及企业应用等领域。

AI项目与工具 2025年06月11日 18 点赞 0 评论 780 浏览

GPT-SoVITS

一个强大的语音合成工具，特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换，支持多种语言，并提供了易于使用的WebUI工具。

Ai平台模型 1970年01月01日 0 点赞 0 评论 782 浏览

Circuit Tracer

Circuit Tracer 是 Anthropic 推出的开源工具，用于研究大型语言模型的内部工作机制。它通过生成归因图揭示模型在生成特定输出时的决策路径，帮助研究人员追踪模型的决策过程、可视化特征关系并测试假设。支持多种主流模型如 Gemma 和 Llama，提供交互式可视化界面，便于探索和分析模型行为。其功能包括生成归因图、可视化与交互、模型干预以及支持多种模型。

AI项目与工具 2025年06月11日 95 点赞 0 评论 782 浏览

OpenScholar

OpenScholar是一款由华盛顿大学与艾伦AI研究所联合研发的检索增强型语言模型，专为科学家设计，能够高效检索并综合海量科学文献信息，生成基于文献的事实性回答。该工具具备强大的跨学科适用性，涵盖计算机科学、生物医学等多个领域，同时支持自我反馈迭代优化，显著提升回答质量和引用可靠性。所有相关资源已完全开源，便于全球学者使用与研究。

AI项目与工具 2025年06月12日 30 点赞 0 评论 786 浏览

YT Navigator

YT Navigator 是一款基于 AI 的 YouTube 内容检索工具，支持自然语言查询、语义搜索和视频内容交互。用户可快速定位视频片段并获取时间戳，提升信息获取效率。适用于研究、学习、创作和分析等场景，具备频道管理、安全会话等功能。采用向量嵌入与 BM25 算法结合的搜索机制，提高搜索准确率，项目已开源。

AI项目与工具 2025年06月12日 57 点赞 0 评论 792 浏览

开源项目

首页

开源项目

列表

默认

浏览次数

发布日期