视频

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具,支持实时语音转文字功能,具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型,可处理中英文混合语音,并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景,同时确保用户数据的安全与隐私。 ---

京亦智能视频创作

AI视频生成神器,AI老照片生成视频,AI拥抱视频制作,AI搞笑视频制作,AI精美视频制作

Stable Virtual Camera

Stable Virtual Camera 是 Stability AI 推出的 AI 工具,能够将 2D 图像转换为具有真实深度和透视感的 3D 视频。用户可通过自定义相机轨迹生成多种宽高比的视频,支持最长 1000 帧的高质量输出。其核心技术包括生成式 AI、神经渲染和多视图一致性优化,确保视频在不同视角间过渡自然且保持 3D 一致性。适用于广告、内容创作及教育等多个领域。

ReCamMaster

ReCamMaster 是由浙江大学与快手科技联合开发的视频重渲染框架,支持根据用户指定的相机轨迹生成新视角视频。采用预训练模型与帧维度条件机制,实现视频视角、运动轨迹的灵活调整。具备视频稳定化、超分辨率、外扩等功能,适用于视频创作、后期制作、自动驾驶和虚拟现实等领域,提升视频内容的表现力与质量。

存了个图

一款支持从国外主流网站下载视频和图片的专业下载工具,存了个图提供从平台如YouTube、Instagram、TikTok、Pinterest、Facebook、Rumble、Triller、Likee、Vimeo、Nicovideo、Reddit 等下载视频、图片和字幕,并支持4K分辨率下载与编辑功能。

VideoPainter

VideoPainter是由多所高校及科研机构联合开发的视频修复与编辑框架,采用双分支架构,结合轻量级上下文编码器和扩散模型,实现高效背景保留与前景生成。支持插件式操作,具备长视频对象一致性维持能力,并构建了大规模视频修复数据集,广泛应用于影视、广告、教育等领域。

15个AI数字人制作工具,快速生成口播和直播视频

AI数字人通过AI技术模拟真人外貌与行为,实现自然对话与情感表达。本文介绍多款数字人制作工具,支持视频创作、营销推广、教育培训等场景,功能包括3D内容生成、自定义编辑、后期包装等,适用于个人及企业用户,助力内容生产效率提升。

AI Face Studio

AI Face Studio 是一款先进的 AI 面部变换与编辑工具,专为创意项目设计,提供人脸交换、衣物更换、视频转换、人脸编辑和风格转换等多种功能。

LongVU

LongVU是一款由Meta AI团队研发的长视频理解工具,其核心在于时空自适应压缩机制,可有效减少视频标记数量并保留关键视觉细节。该工具通过跨模态查询与帧间依赖性分析,实现了对冗余帧的剔除及帧特征的选择性降低,并基于时间依赖性进一步压缩空间标记。LongVU支持高效处理长视频,适用于视频内容分析、搜索索引、生成描述等多种应用场景。

VACE

VACE是由阿里巴巴通义实验室推出的视频生成与编辑框架,支持文本到视频、参考生成、视频扩展、遮罩编辑等多种任务。其核心是Video Condition Unit(VCU),可整合多模态输入,实现任务灵活组合。支持480P和720P分辨率,适用于创意视频制作、视频修复、风格转换及互动创作等场景,具备高灵活性和广泛的应用潜力。