Vid2World Vid2World是由清华大学和重庆大学联合开发的创新框架,能够将全序列、非因果的被动视频扩散模型(VDM)转换为自回归、交互式、动作条件化的世界模型。该模型基于视频扩散因果化和因果动作引导两大核心技术,解决了传统VDM在因果生成和动作条件化方面的不足。Vid2World支持高保真视频生成、动作条件化、自回归生成和因果推理,适用于机器人操作、游戏模拟等复杂环境,具有广泛的应用前景。 AI项目与工具 2025年06月11日 33 点赞 0 评论 732 浏览
gling Gling是一款集成了先进AI技术的视频编辑工具,主要功能涵盖自动去除不良拍摄片段、消除沉默及填充词、生成AI字幕、自动缩放画面、降低背景噪音等。它还能够为视频生成优化标题与章节,适用于个人视频博主、播客制作人、在线教育者及企业培训等多个领域,助力提升视频质量和效率。 AI项目与工具 2025年06月12日 78 点赞 0 评论 732 浏览
Aconvert 一款免费的在线格式转换工具,支持多达 110 多种文件格式转换,包括 PDF、文档、电子书、图片、音频、视频和压缩文件等。 格式转换 2025年06月05日 28 点赞 0 评论 731 浏览
KataList Ai 一个利用AI将剧本转化为视觉故事的工具。通过KataList Ai可以生成创意提案、故事板和视频,并提供音乐和旁白等一站式服务。 Ai视频生成 2025年06月05日 37 点赞 0 评论 731 浏览
Spikes Studio Spikes Studio是一个将长视频转化为YouTube、TikTok和Reels病毒视频的工具。它具有强大的AI编辑器,自动添加字幕等功能。 视频剪辑 2025年06月05日 51 点赞 0 评论 731 浏览
Clipchamp Clipchamp,可帮助你创作内容的智能工具,有自动生成字幕、文本转语音、调整视频大小等功能,现在是Microsoft旗下公司。 视频剪辑 2025年06月05日 83 点赞 0 评论 731 浏览
HRAvatar HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。 AI项目与工具 2025年06月11日 43 点赞 0 评论 730 浏览
SAM 2.1 SAM 2.1是一款由Meta开发的先进视觉分割模型,支持图像和视频的实时分割处理。其核心功能包括用户交互式分割、多对象跟踪、数据增强以及遮挡处理等。通过引入Transformer架构和流式记忆机制,SAM 2.1显著提升了对复杂场景的理解能力。该工具具有广泛的应用场景,涵盖内容创作、医疗影像分析、自动驾驶等多个领域。 AI项目与工具 2025年06月12日 49 点赞 0 评论 730 浏览