视频

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

Vidu 1.5

Vidu 1.5是一款基于多模态视频大模型的AI生成工具,支持参考生视频、图生视频和文生视频生成,通过精准的语义理解能力,在30秒内完成高质量视频创作,适用于影视、动漫、广告等多行业场景,助力创作者高效产出多样化内容。

千禾智能AI视频换脸

实现超逼真的视频换脸,高精度的视频抠像,流畅自然的视频插帧,快速高效的视频人脸修复,以及清晰锐利的视频无损放大

风平智能

风平智能提供一站式AI解决方案,涵盖虚拟数字人定制、AI短视频生成、数字人直播、IP培育及交易等功能。平台利用先进AI技术,支持多语言互动,服务于金融、教育、医疗等行业,推动数字人技术在元宇宙时代的广泛应用。

阶跃视频

阶跃视频是一款基于AI技术的视频生成工具,提供多样化的主题选择和智能化的描述优化功能,支持用户快速生成高质量短视频。它涵盖城市、自然、科幻等多种创作主题,并通过示例视频为用户提供灵感来源,适用于教育、创意、娱乐及营销等多个场景。

MMBench

MMBench-Video是一个由多家高校和机构联合开发的长视频多题问答基准测试平台,旨在全面评估大型视觉语言模型(LVLMs)在视频理解方面的能力。平台包含约600个YouTube视频片段,覆盖16个类别,并配备高质量的人工标注问答对。通过自动化评估机制,MMBench-Video能够有效提升评估的精度和效率,为模型优化和学术研究提供重要支持。

Deforum

一款开源免费软件工具,一种基于Stable Diffusion的动画生成工具,它可以根据文本描述或参考视频生成连续的图像序列,并将它们拼接在一起以创建视频。

喵御宅Mfuns

一个以动漫、游戏、音乐、舞蹈等为主题的多元内容平台,喵御宅Mfuns提供各种原创和转载的视频、图片、文字等内容。

MMAudio

MMAudio是一款基于多模态联合训练的音频合成工具,通过深度学习技术实现视频到音频、文本到音频的精准转换。它具备强大的同步模块,确保生成的音频与视频帧或文本描述时间轴完全对应,适用于影视制作、游戏开发、虚拟现实等多种场景,极大提升了跨模态数据处理的能力和应用效率。