视频

cre8tiveAI

Cre8tiveAI 是一款基于深度学习的人工智能平台,提供一系列创新工具,用于图像和视频的编辑与优化。其主要功能包括提高分辨率、优化人脸、生成个性化插图、人像裁剪、静态图像转动态视频等。适用于社交媒体内容创作、电子商务、广告营销、设计插画等多个领域,支持从个人用户到团队协作的不同需求。

GAS

GAS是一种从单张图像生成高质量、视角一致且时间连贯虚拟形象的AI工具,结合3D人体重建与扩散模型技术,支持多视角合成与动态姿态动画。其统一框架提升模型泛化能力,适用于游戏、影视、体育及时尚等领域,具备高保真度与真实感。

Emu3

Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型,结合了多模态自回归技术和单一Transformer架构,能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像,还能预测视频发展并理解图文内容,广泛应用于内容创作、广告营销、教育、娱乐等多个领域。

phenaki

phenaki一种从文本生成视频的模型,提示可以随时间变化,视频可以长达数分钟。

彩云小译

彩云小译,兼具中日韩英同声传译、双语对照网页翻译、文献翻译、文档翻译、视频字幕翻译功能。

CogVideo

目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。

Presentory

一款基于AI 的演示PPT生成制作工具,作为创新且用户友好的视频演示软件,提供各种 AI 功能。它允许用户创建、直播和录制令人惊叹的虚拟演示视频,每次都能吸引观众的注意力。

Chat Video

Chat Video 基于AI的高效视频学习工具,具有语音识别、摘要总结、AI 问答等功能。

豆包PixelDance

豆包PixelDance是一款由字节跳动开发的AI视频生成工具,基于DiT架构,支持文生视频和图生视频功能。它具备强大的语义理解能力,可生成长达10秒的连贯视频片段,并拥有丰富的运镜效果。该工具支持多种艺术风格和视频比例,适用于影视、广告、短视频等多种场景,极大简化了视频创作流程。

VPP

VPP(Video Prediction Policy)是清华大学与星动纪元联合开发的AIGC机器人模型,基于视频扩散模型实现未来场景预测与动作生成。支持高频预测与跨机器人本体学习,显著降低对真实数据的依赖。在复杂任务中表现出色,适用于家庭、工业、医疗、教育等多个领域。其开源特性推动了具身智能机器人技术的发展。