Whisper语音识别模型 Whisper 是一种通用的语音识别模型。它在不同音频的大型数据集上进行训练,也是一个多任务模型,可以执行多语言语音识别以及语音翻译和语言识别。 Ai开源项目 2025年06月05日 90 点赞 0 评论 541 浏览
Deepfakes Web 一个使用人工智能技术通过交换脸部来轻松生成视频的在线应用程序。该应用程序在云端运行,确保用户数据的隐私。 Ai图片处理 2025年06月05日 23 点赞 0 评论 541 浏览
琅琊 琅琊是中国科学院海洋研究所推出的一款海洋人工智能大模型,专注于全球海洋状态变量的中短期高精度预报。它采用先进的机器学习技术与海洋科学知识相结合的方式,提供1至7天的温度、盐度和海流等关键指标的高分辨率预报,显著提高海洋预报的准确性与可靠性。未来版本将扩展至更多复杂海洋现象的预测,增强灾害预警能力。 --- AI项目与工具 2025年06月12日 12 点赞 0 评论 541 浏览
Llasa TTS Llasa TTS是基于LLaMA架构的开源文本转语音模型,支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构,具备多语言支持及长文本处理能力,适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本,支持零样本学习,提升语音自然度和表现力。 AI项目与工具 2025年06月12日 71 点赞 0 评论 540 浏览
Ivy Ivy-VL是一款专为移动端和边缘设备设计的轻量级多模态AI模型,具备约30亿参数,专注于视觉问答、图像描述及复杂推理等任务,能够有效降低计算资源需求,同时在多模态任务中表现出色,尤其适用于增强现实、智能家居及移动学习等领域。 AI项目与工具 2025年06月12日 21 点赞 0 评论 540 浏览
scade.pro scade.pro 是一款无代码AI集成平台,提供超过1500种AI模型和可视化工作流构建工具,支持用户通过拖放节点快速创建和部署AI应用。其功能包括模板驱动的开发、性能监控、多场景适配等,广泛应用于客户服务、内容创作、市场分析等多个领域。 AI项目与工具 2025年06月12日 61 点赞 0 评论 540 浏览
SongCreator SongCreator是一款基于AI技术的音乐生成工具,由清华大学深圳国际研究生院与香港中文大学等机构联合开发。它采用双序列语言模型(DSLM)和注意力掩码策略,支持歌词到歌曲、歌词到声乐、伴奏到歌曲等多种音乐生成任务,并允许用户灵活调整生成内容的声学特性。SongCreator适用于音乐制作、教育、娱乐、内容创作等多个领域,为用户提供高效便捷的音乐解决方案。 AI项目与工具 2025年06月12日 88 点赞 0 评论 540 浏览
Kiln AI Kiln AI 是一款开源 AI 开发工具,支持多平台使用,提供零代码微调、合成数据生成及团队协作功能。内置交互式工具,兼容多种模型和 AI 提供商,支持 Git 版本控制与自动部署,适用于智能客服、医疗、教育、金融等场景,注重数据隐私与安全性。 AI项目与工具 2025年06月12日 59 点赞 0 评论 539 浏览
FunClip FunClip是一款由阿里巴巴达摩院通义实验室开发的开源、本地部署的视频剪辑工具。它主要通过自动化语音识别技术,帮助用户基于语音转文字的结果,选择特定文本片段或说话人进行视频剪辑。其特点包括高精度的中文ASR模型、热词定制化、说话人识别功能、Gradio交互界面,以及支持多段剪辑和自动生成SRT字幕文件。 AI项目与工具 2024年07月01日 55 点赞 0 评论 539 浏览
子曰翻译2.0 子曰翻译2.0是网易有道推出的最新翻译大模型,通过数据优化、算法升级和严格评估体系,实现翻译质量与效率的显著提升。支持中英互译、专业领域翻译及多场景应用,涵盖学术、医疗、文学等领域,具备高准确性、流畅性和适应性,适用于多种翻译需求。 AI项目与工具 2025年06月12日 93 点赞 0 评论 538 浏览