视频

VideoFusion

VideoFusion 是一款开源的短视频处理工具,支持自动去除黑边、水印和字幕,智能旋转视频方向,提升画质,并兼容多种视频格式。具备批量处理、自定义设置和实时进度反馈功能,适用于视频创作者、自媒体运营及企业等多场景应用。

创视元数字人

创视元通过其简单易用的界面和先进的AI技术,使得数字人视频创作变得快速、便捷。无论是企业宣传、教育培训还是其他应用场景,创视元都能提供高效的解决方案。

VoxCraft Ai

北京生数科技有限公司开发的一款强大的AI生成3D工具,VoxCraft Ai基于底层通用多模态大模型,具备优越的多模态生成能力。

NutWorld

NutWorld是由新加坡国立大学、南洋理工大学与Skywork AI联合开发的视频处理框架,能够高效地将单目视频转换为动态3D高斯表示(Gaussian Splatting)。它基于时空对齐高斯(STAG)表示法,实现视频的时空连贯建模,支持高保真视频重建和多种下游任务,如新视图合成、视频编辑、帧插值和深度预测。该工具具备实时处理能力,适用于视频创作、AR/VR、自动驾驶等多个领域。

LatentSync

LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架,基于音频条件的潜在扩散模型,无需中间3D或2D表示,可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法,提升视频时间一致性,并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。

Aitubo

Aitubo是一款基于先进Flux模型的AI图像和视频生成平台,支持用户通过文本提示生成高质量图像,并具备背景移除、图像放大增强、AI外扩绘画以及人脸交换等功能,广泛应用于游戏开发、动漫制作、艺术创作及广告营销等领域。

LTXV

LTXV-13B 是 Lightricks 推出的开源 AI 视频生成模型,拥有 130 亿参数,可在消费级显卡上高效运行,生成速度比同类产品快 30 倍。支持文本、图像转视频及多关键帧调节,具备多尺度渲染和高压缩率技术,适用于影视、广告、游戏、教育等多个领域,提升内容创作效率与质量。

Motion Dreamer

Motion Dreamer是由香港科技大学(广州)研发的视频生成框架,采用两阶段架构生成物理合理的视频内容。通过引入“实例流”实现从稀疏到密集的运动控制,支持用户以少量提示生成时间连贯的视频。其随机掩码训练策略增强了模型的推理能力与泛化性能,已在多个数据集上验证其优越性。适用于视频创作、动画制作、VR/AR及自动驾驶等多个领域。

Aconvert

一款免费的在线格式转换工具,支持多达 110 多种文件格式转换,包括 PDF、文档、电子书、图片、音频、视频和压缩文件等。

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术,能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术,结合精确的表情编码器和物理渲染模型,实现高精度重建和实时渲染(约155 FPS)。支持材质编辑、跨视角渲染和动画化,适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。