多语言

PDF2Audio

PDF2Audio 是一款开源工具,支持将 PDF 文档转换为音频内容,适用于播客制作、教育、业务演示等多个场景。其核心功能包括 PDF 转文本、生成播客脚本、文本转语音转换、多语言支持及高级编辑功能。用户可通过自定义选项调整文本生成模型、语音风格等,支持批量处理和多种模板适配,方便用户根据需求生成高质量音频。

ScholarCopilot

ScholarCopilot是一款由加拿大滑铁卢大学与卡内基梅隆大学联合开发的学术写作辅助工具,基于Qwen-2.5-7B模型构建。其核心技术包括动态检索引用与生成内容联合优化,实现高准确性的学术文本生成。支持语境感知续写、章节自动生成、多语言写作、一键引用等功能,并具备错误检测与溯源验证能力。适用于论文撰写、教学、科研协作及期刊审稿等多种场景,显著提升学术写作效率与质量。

PixVerse V2.5

PixVerse V2.5是一款由爱诗科技开发的AI视频生成工具,其主要功能包括模型优化、提高生成速度、支持4K分辨率、Performance模式、运动笔刷、运镜控制以及文本内容生成。这些功能共同提升了视频创作的动态效果和专业度,使得用户能够更快地生成高质量视频内容。PixVerse V2.5支持多种语言界面,适用于创意视频制作、广告和营销、教育和培训、社交媒体内容以及游戏和动画制作等领域。

Recap

Recap是一款基于大型语言模型的智能工具,支持文本、网页、PDF和视频等内容的快速总结与分析,提供分段摘要、可视化图表及多语言支持。适用于学术研究、教学、市场分析、内容创作和知识管理等多个场景,提升信息处理效率与理解深度。

TTS Online

TTS Online是一款免费的文本转语音工具,提供语音合成服务,支持多种语言,包括英语、法语、德语、西班牙语、阿拉伯语、中文、日语、韩语等,以及多种语音风格。

BabelDOC

BabelDOC是一款专为科学论文翻译设计的开源PDF处理工具,支持双语对照显示,保留原文格式如公式、图表等。兼容多种翻译引擎,支持自定义模型接入,适用于学术、商业和技术文档翻译,提供在线和本地部署方式,保障翻译准确性和排版一致性。

NotesGPT

NotesGPT是一款开源的AI语音笔记工具,具备语音转录、自动总结及任务生成等功能,采用先进技术保障转录准确性与任务生成效率,支持多语言并适配多种使用场景,如会议记录、学术研究及个人备忘等。

Checksub

Checksub 是一个利用人工智能技术提供视频和音频本地化服务的平台,它通过 AI 驱动的字幕生成和配音功能,帮助用户将视频内容翻译成不同语言,从而扩大观众范围。

AgenticSeek

AgenticSeek是一款完全本地化的开源AI助手,作为Manus的开源替代品,它能够在本地设备上自主执行任务,如浏览网页、编写代码和规划项目,确保用户隐私。支持多种编程语言,具备智能任务拆解与执行能力,用户可通过语音或文本交互。适用于注重隐私和希望在本地环境中使用AI工具的用户。

Open NotebookLM

Open NotebookLM是一个开源工具,能够将PDF文档转换为播客形式的音频内容。它基于Llama 3.1 405B、MeloTTS和Bark等先进AI模型,生成自然流畅的对话式音频,并支持多语言及个性化音调设置。用户可通过简单易用的Gradio界面上传PDF文件并下载MP3格式的音频文件,适用于教育、科研、商业分析等多个领域。