支持

Transkriptor

Transkriptor是一款基于AI技术的在线音频和视频转录工具,支持100多种语言,兼容多种文件格式。它提供包括转录、翻译、编辑、多格式导出及AI聊天助手在内的全面功能,旨在满足用户对语音数据处理的需求。其应用场景广泛,如会议记录、教育、法律记录等,可大幅提升工作效率和准确性。

AgileGen

AgileGen是一个基于人机协作的生成式软件开发框架,通过Gherkin语言定义用户需求并生成代码,支持快速原型设计和迭代优化。其主要功能包括需求收集与澄清、场景设计、代码生成及反馈迭代,同时具备记忆池机制以提升决策效率。适用于初创公司、教育领域及企业内部工具开发等场景。

RealtimeSTT

RealtimeSTT是一款开源的实时语音转文本库,具备高精度语音活动检测、GPU加速的实时转录能力以及语音唤醒功能。支持多语言识别,适用于语音助手、会议记录、实时字幕等场景,提供灵活的音频输入与预处理机制,便于开发者快速集成和扩展。

Bark

Bark是一款开源的文本到音频转换模型,由Suno AI开发,能够生成逼真的多语言语音及多种音频类型,包括音乐和背景噪音,并支持非语言交流的声音。该模型提供预训练模型,适用于研究和商业用途。其主要功能涵盖文本到音频转换、多语言支持、音频多样性和非语言交流模拟。Bark在多语言内容创作、音频内容生成和非语言交流场景中具有广泛应用。

Kotae

Kotae是一款专为中小企业设计的智能聊天机器人平台,基于ChatGPT技术开发,支持80多种语言,可快速自然地响应客户咨询。用户无需编程即可在5分钟内完成配置和部署,通过分析网站内容、培训材料和FAQ生成准确回答。支持品牌定制和实时对话管理,适用于自动化客户服务、提升满意度及收集客户反馈等场景。

Dolphin

Dolphin是由清华大学与海天瑞声联合开发的面向东方语言的语音识别大模型,支持40种语言及22种中文方言,具备高精度语音转文字能力。采用CTC-Attention架构,结合E-Branchformer和Transformer技术,提升识别效率与准确性。模型开源,支持自定义语言与地区设置,适用于会议记录、语音输入、智能助手等多种场景。

字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费

豆包MarsCode是一款由字节跳动开发的免费AI编程工具,提供AI驱动的云端集成开发环境(IDE)和智能编程扩展。其主要功能包括代码补全、生成、优化、注释生成、代码解释和错误修复等。MarsCode支持云函数开发,集成API测试、存储和部署工具,并能自动生成JSON Schema。此外,MarsCode扩展支持多种编程语言和IDE,涵盖从代码编辑到单元测试生成的多个辅助功能,显著提升了编码效率和

FakeYou | 语音克隆和仿声

FakeYou 是一款功能强大的文本到语音工具,可以帮助用户生成个性化的语音内容,同时支持实时语音克隆和仿声模拟体验。

Learn Prompting

Learn Prompting 是一个开源平台,致力于教授 AI 提示工程相关知识,涵盖从基础到高级的内容。其主要功能包括智能推荐、深度解析、模拟对话、学习进度跟踪等,同时提供体系化课程及实际应用场景案例。该工具适用于教育、语言学习、内容创作、数据分析等多个领域,助力用户提升 AI 技术的应用能力。

Aqua Voice

Aqua Voice 是一款AI驱动的语音转录与文档编辑工具,支持语音转文字、自然语言指令编辑、自动格式优化及多语言处理。它适用于高效写作、辅助输入及跨平台办公场景,兼容多种主流应用,提升文本创作效率与准确性。