视频

腾讯广告妙思

一站式AI广告创意平台,基于腾讯自研的混元大模型开发,并集成了AIGC技术。它能够快速生成广告图片和其他创意内容,相比传统人工制作,不仅效率更高,创意视角也更丰富。

VideoRAG

VideoRAG是一种基于检索增强生成(RAG)技术的工具,旨在提升长视频的理解能力。它通过提取视频中的多模态信息(如OCR、ASR和对象检测),并将其与视频帧和用户查询结合,增强大型视频语言模型的处理效果。该技术轻量高效,易于集成,适用于视频问答、内容分析、教育、媒体创作及企业知识管理等多个领域。

ViVa AI

Sora同架构视频生成模型,支持文本生成视频、图片生成视频以及 4K 分辨率放大功能,另外也支持提示词的自动优化。

Ovis2

Ovis2是阿里巴巴国际团队开发的多模态大语言模型,采用结构化嵌入对齐技术提升视觉与文本的融合效果。支持视频、图像和多语言处理,强化了思维链推理和复杂场景下的OCR能力。提供多个参数规模的版本,适用于研究、开发及各类应用场景,展现卓越性能。

FlagevalMM

FlagEvalMM是一个由北京智源人工智能研究院开发的开源多模态模型评测框架,专注于评估处理文本、图像、视频等多模态任务的模型性能。它支持多种任务和指标,采用解耦评测与推理的设计,提供统一的评测流程,集成丰富模型库并兼容多种后端引擎。该工具适用于学术研究、工业应用、模型开发、教育领域及内容创作等多个场景。

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术,结合扩散模型与时间注意力机制,基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块,确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸,广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域,具备高分辨率生成能力和良好的时间连贯性。

Vimeo

vimeo是美国非常流行的原创视频分享平台,一个高清视频播客网站,这里分享的视频都经过精心拍摄剪辑,不同于类型繁多的YouTube。

Pikadditions

Pikadditions是Pika推出的一项AI视频编辑工具,支持将图片无缝融入视频中,生成自然且引人入胜的效果。用户只需上传视频和图片,并输入简短提示,即可完成合成。功能操作简便,适用于创意视频制作、教育、影视、个人娱乐及企业宣传等多个领域,有效降低视频制作门槛和成本。

Infinity AI

Infinity AI是一款基于深度学习技术的人工智能工具,可将输入的剧本或对话内容转化为高质量视频。其核心功能包括生成式视频模型、数字人克隆技术和视频定制服务。用户可通过简单的操作实现一键视频生成,并利用AI克隆体制作个性化视频内容。这款工具广泛应用于教育、娱乐、新闻传媒、企业培训等场景,显著提升内容创作效率。

Ruyi

Ruyi是一款基于DiT架构的图生视频大模型,支持多分辨率和多时长的视频生成,具有首帧、首尾帧控制、运动幅度调整及镜头方向控制等功能。它通过Casual VAE模块和Diffusion Transformer实现视频数据的压缩与生成,旨在降低动漫和游戏内容的开发周期和成本。目前,Ruyi-Mini-7B版本已开源。