Mini Mini-Omni 是一个开源的端到端语音对话模型,具备实时语音输入和输出的能力,能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别(ASR)或文本到语音(TTS)系统,直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法,通过批量并行策略提高性能,同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能,适用于智能助手、客户服务 AI项目与工具 2025年06月12日 93 点赞 0 评论 519 浏览
水印一键去去去 一个免费在线的去水印工具,它使用人工智能技术,支持批量去除图片中的文字、标志,多余物体等多种水印,不压画质,保证高质不糊图。 图片处理 2025年06月05日 44 点赞 0 评论 517 浏览
Flux AI 一款由Flex.1驱动的图像生成器,Flux AI可以快速生成高质量、逼真的Flux AI图像,包括完美的Flux AI生成的手部细节。 Ai绘画生成 2025年06月05日 89 点赞 0 评论 517 浏览
创视元数字人 创视元通过其简单易用的界面和先进的AI技术,使得数字人视频创作变得快速、便捷。无论是企业宣传、教育培训还是其他应用场景,创视元都能提供高效的解决方案。 创作工具 1970年01月01日 0 点赞 0 评论 516 浏览
EZ 一款开源AI文档翻译助手,帮助用户使用 OpenAI 等大型语言模型API快速且经济高效地翻译文档。支持txt、word、csv、excel、pdf、ppt等多种文档格式的翻译,适用于各种需要文档翻译的场景。 Ai开源项目 2025年06月05日 61 点赞 0 评论 510 浏览
录音识别王 录音识别王,支持录音实时转文字、视频转文字、智能配音及图片转文字等功能,高效精准的录音识别技术,智能提取音频中的文字,支持TXT、WORD等格式导出,适用于各种录音制作场景。 字幕配音 2025年06月05日 11 点赞 0 评论 507 浏览
PixCake像素蛋糕 像素蛋糕PixCake是一款专为商业摄影师和设计师打造的简单易用的AI修图工具,可让让照片的肤色、肤质、妆容、胖瘦等方面得到优化和提升。 Ai图片处理 2025年06月05日 41 点赞 0 评论 505 浏览
Imageye 一款用于嗅探、分析网页图片并提供批量下载等功能的浏览器扩展程序。Imageye支持批量下载和图片过滤功能,适用于 Chrome 和 Firefox 浏览器。 图片处理 2025年06月05日 93 点赞 0 评论 501 浏览
Aconvert 一款免费的在线格式转换工具,支持多达 110 多种文件格式转换,包括 PDF、文档、电子书、图片、音频、视频和压缩文件等。 格式转换 2025年06月05日 28 点赞 0 评论 499 浏览