MakeAnything MakeAnything是由新加坡国立大学Show Lab团队开发的多领域程序性序列生成框架,能够根据文本或图像生成高质量的分步教程。它采用扩散变换器和ReCraft模型,支持从文本到过程和从图像到过程的双向生成。覆盖21个领域,包含超24,000个标注序列,具备良好的逻辑连贯性和视觉一致性,适用于教育、艺术、工艺传承及内容创作等多种场景。 AI项目与工具 2025年06月12日 85 点赞 0 评论 205 浏览
Amazon Q Amazon Q是亚马逊专为IT专业人士和开发人员设计的AI助手,具备智能问答、代码理解和生成、数据源连接、个性化服务、内容创作及业务流程自动化等功能。它通过自然语言处理和机器学习技术,帮助企业提升工作效率,实现数字化转型。Amazon Q能够连接多种数据源,理解企业内部信息,并提供定制化的信息和答案。 AI项目与工具 2025年06月12日 60 点赞 0 评论 205 浏览
vidyo.ai Vidyo.ai是一款基于人工智能的视频编辑工具,可将长视频自动剪辑为适合社交媒体的短视频片段。其主要功能涵盖智能剪辑、尺寸适配、字幕生成、播放速度调节及音频优化等。该工具支持多语言操作,适合内容创作者和品牌方高效制作高质量视频内容。 AI项目与工具 2025年06月12日 43 点赞 0 评论 204 浏览
AudioGen.co 一款由AI驱动的可以生成各种音频内容的平台,包括样品、乐器、音效和纹理。用户可以生成高质量的、适合制作专业的具有无限的变化音乐的声音 Ai语音工具 2025年06月05日 96 点赞 0 评论 204 浏览
Glama AI 一款集成多种AI模型和智能代理服务的多功能聊天工具,Glama支持文件分析、实时搜索、图表生成和企业级安全,适用于高效信息处理和协作。 AI写作对话 2025年06月05日 99 点赞 0 评论 204 浏览
MultiTalk MultiTalk是由中山大学深圳校区、美团和香港科技大学联合推出的音频驱动多人对话视频生成框架。它根据多声道音频输入、参考图像和文本提示,生成包含人物互动且口型与音频一致的视频。通过Label Rotary Position Embedding (L-RoPE) 方法解决多声道音频与人物绑定问题,并采用部分参数训练和多任务训练策略,保留基础模型的指令跟随能力。MultiTalk适用于卡通、歌唱及 AI项目与工具 2025年06月11日 11 点赞 0 评论 203 浏览
Resona V2A 专注于将视频内容自动转化为高质量音频。Resona V2A通过分析视频中的视觉元素,Resona V2A 能够生成与视频内容相匹配的声音设计、音效和环境音。 Ai视频生成 2025年06月05日 11 点赞 0 评论 203 浏览