视频

FancyVideo

FancyVideo是一款由360公司与中山大学合作开发的AI文生视频模型,采用创新的跨帧文本引导模块(CTGM)。它能够根据文本描述生成连贯且动态丰富的视频内容,支持高分辨率视频输出,并保持时间上的连贯性。作为开源项目,FancyVideo提供了详尽的文档和代码库,便于研究者和开发者深入研究和应用。主要功能包括文本到视频生成、跨帧文本引导、时间信息注入及时间亲和度细化等。

讯飞译制

讯飞译制是一款基于语音识别与机器翻译技术的智能字幕制作与翻译平台,支持多语言转换与自动字幕生成,提供高精度识别、智能时间码匹配、多格式导出及配音功能,适用于短视频出海、教学视频、广告宣传等多种场景,提升内容传播效率与国际化水平。

VACE

VACE是由阿里巴巴通义实验室推出的视频生成与编辑框架,支持文本到视频、参考生成、视频扩展、遮罩编辑等多种任务。其核心是Video Condition Unit(VCU),可整合多模态输入,实现任务灵活组合。支持480P和720P分辨率,适用于创意视频制作、视频修复、风格转换及互动创作等场景,具备高灵活性和广泛的应用潜力。

GEN3C

GEN3C是由NVIDIA、多伦多大学和向量研究所联合开发的生成式视频模型,基于点云构建3D缓存,结合精确的相机控制和时空一致性技术,实现高质量视频生成。支持从单视角到多视角的视频创作,具备3D编辑能力,适用于动态场景和长视频生成。在新型视图合成、驾驶模拟、影视制作等领域有广泛应用前景。

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具,支持实时语音转文字功能,具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型,可处理中英文混合语音,并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景,同时确保用户数据的安全与隐私。 ---

录咖

录咖,一站式音视频处理平台,提供AI视频对话、AI字幕、AI语音转文字,录屏、剪辑、转GIF/音频等服务,同时支持云存储和分享。

Picsart

Picsart是全球最大的数字创作平台。它的人工智能工具允许各级创作者设计、编辑、绘制和分享照片和视频内容。Picsart已经积累了世界上最大的开源内容集合之一,包括照片、贴纸、背...

存了个图

一款支持从国外主流网站下载视频和图片的专业下载工具,存了个图提供从平台如YouTube、Instagram、TikTok、Pinterest、Facebook、Rumble、Triller、Likee、Vimeo、Nicovideo、Reddit 等下载视频、图片和字幕,并支持4K分辨率下载与编辑功能。

Tabcut特看

致力于帮助全球商家做好短视频/直播营销,同时给达人带来更高的创作效益。

VideoPainter

VideoPainter是由多所高校及科研机构联合开发的视频修复与编辑框架,采用双分支架构,结合轻量级上下文编码器和扩散模型,实现高效背景保留与前景生成。支持插件式操作,具备长视频对象一致性维持能力,并构建了大规模视频修复数据集,广泛应用于影视、广告、教育等领域。