语音
Ciallo TTS
Ciallo TTS是一款开源的文本转语音工具,支持300多种语言和口音,提供语速、语调调节功能,并具备即时试听和长文本处理能力。适用于学习、工作、创作等场景,提升信息获取与内容制作的效率。
FireRedASR
FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。
Audio Enhancer
一个在线音频增强工具,Audio Enhancer使用人工智能算法来帮助用户轻松地减少音频文件中的背景噪音,用于改善音频录音的清晰度和整体质量。
App Intents
App Intents 是苹果推出的全新框架,支持开发者将 Siri 和 Apple Intelligence 集成到 iOS 和 macOS 应用中,实现语音控制、自动化操作及内容搜索等功能,大幅提升应用的智能化和便捷性。其核心技术包括意图定义、参数解析和对话管理,适用于邮件、智能家居、笔记、日程管理和健康追踪等多种场景。
