微微在线二维码生成器 微微二维码是专业二维码制作服务商,提供视频音频二维码生成、图片文件二维码制作、二维码表单登记系统、二维码管理系统,广泛应用于:产品宣传、企业展示、旅游、教育培训、建筑... Ai绘画生成 1970年01月01日 0 点赞 0 评论 474 浏览
Koko AI 一款具有AI生成的3D模型和语音聊天功能的社交娱乐应用,Koko AI融合了3D模型、动画表演和语音聊天技术,为用户提供了与动漫角色进行面对面的互动体验。 生活创意 2025年06月05日 87 点赞 0 评论 474 浏览
场辞 场辞,AI视频字幕制作软件,一款基于语音识别技术的视频字幕制作软件,一键智能识别字幕,提供语音转字幕、一键加字幕、视频加字幕,字幕快捷校对等功能,用AI加速你的创作。 Ai语音工具 2025年06月05日 87 点赞 0 评论 476 浏览
LOVO AI LOVO AI是一款AI配音软件。用户可以上传一段自己的录音,然后选择AI语音,软件会根据用户的录音内容进行智能识别,然后生成自然流畅的语音。 Ai语音工具 2025年06月05日 35 点赞 0 评论 477 浏览
Aero Aero-1-Audio 是一款基于 Qwen-2.5-1.5B 的轻量级音频模型,拥有 1.5 亿参数,专注于长音频处理,支持连续 15 分钟音频输入并保持上下文连贯性。在语音识别、复杂音频分析及指令驱动任务中表现出色,具备高效的训练方法和多任务处理能力,适用于语音助手、实时转写、归档理解等场景。 AI项目与工具 2025年06月11日 43 点赞 0 评论 478 浏览
URO URO-Bench 是一个面向端到端语音对话模型的综合评估工具,支持多语言、多轮对话及副语言信息处理。它包含基础和高级两个赛道,分别涵盖16个和20个数据集,覆盖开放性问答、情感生成、多语言任务等。支持多种评估指标,提供简单易用的评估流程,并兼容多种语音对话模型。适用于智能家居、个人助理、语言学习等多个实际应用场景。 AI项目与工具 2025年06月12日 47 点赞 0 评论 478 浏览
PDF to Podcast PDF to Podcast 是一款由 NVIDIA 开发的 AI 工具,能够将 PDF 文档自动转换为高质量的音频内容,如播客。该工具结合了大型语言模型、文本到语音技术以及 NVIDIA NIM 微服务架构,支持从 PDF 提取信息并生成结构化文本,再通过语音合成输出自然流畅的音频。用户可自定义生成内容的重点,并支持多种部署方式,适用于企业培训、技术简报、客户服务、医疗教育等多个领域。 AI项目与工具 2025年06月12日 32 点赞 0 评论 479 浏览
3D 3D-Speaker是一个多模态开源项目,专注于通过结合声学、语义和视觉信息,实现高精度的说话人识别和语种识别。其主要功能包括说话人日志、说话人识别、语种识别、多模态识别以及重叠说话人检测。项目提供了工业级模型、训练与推理代码,以及多样化数据集,并支持复杂环境下的语音处理任务。应用场景涵盖会议记录、法庭记录、广播制作、电话客服和安全监控等领域。 AI项目与工具 2025年06月12日 29 点赞 0 评论 479 浏览
Pemo Pemo是一款AI驱动的文档管理工具,支持多格式文档导入与管理,提供智能翻译、摘要生成、思维导图、格式转换及语音朗读等功能。用户可自定义阅读模式并进行标注与笔记,提升阅读效率与知识整理能力,适用于学习、科研、办公及日常阅读等多种场景。 AI项目与工具 2025年06月11日 25 点赞 0 评论 480 浏览