视频

HumanDiT

HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。

ConceptMaster

ConceptMaster是一款基于扩散Transformer模型的多概念视频生成框架,可在无需测试调优的情况下生成高质量、概念一致的视频。通过解耦多概念嵌入并独立注入模型,有效解决身份解耦问题,尤其擅长处理高度相似的视觉概念。该工具支持多概念视频定制、高质量数据收集和全面的基准测试,适用于视频创作、动画制作、游戏开发及产品展示等领域。

Krea Video

Krea Video为视频创作者提供简单高效的创作工具。

万彩微影

一款智能短视频制作软件合集,通过AI技术企业和自媒体及个人可以快速智能制作短视频作品,万彩微影广泛用于宣传,微课,动画短片等领域,适合在抖音快手等平台传播吸粉。

Stable Artisan

Stable Artisan是一款基于Discord平台的图像和视频生成机器人服务,利用Stability AI的AI技术和模型,如Stable Diffusion 3和Stable Video Diffusion,使用户能够通过自然语言提示生成高质量的图像和视频。此外,它还提供了一系列图像编辑工具,包括搜索替换、背景去除、高清放大、扩展外延、控制素描和结构等功能,适用于创意人士、设计师、内容创作

StoryTribe

可以轻松创建令人惊叹的插图和故事板。不需绘要任何画技巧。在几分钟内自定义角色、道具、背景和对话气泡。

Verbalate Ai

Verbalate是一款通用的视频翻译和唇语同步工具,能够轻松地将音频/视频内容转换为多种语言,并具备语音克隆和唇语同步功能。

Cody Former

一个开源的人工智能图像处理工具,Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型,支持多语言、多模态处理,具备文本、图像及短视频分析能力。提供多种模型尺寸,适配不同硬件环境,优化了单 GPU/TPU 性能,推理速度提升显著。内置图像安全分类器,增强内容安全性。支持多种开发工具和部署方式,适用于人脸识别、物体检测、智能助手、文本分析等场景。

SlidesOrator

一款将静态PPT转化为互动演示内容的工具,主要功能有旁白生成、数字人播报、实时问答等。用户上传PDF文件后,能快速生成互动演示,适用于教育、企业培训、产品介绍等场景。