生成

GaussianCity

GaussianCity是由南洋理工大学S-Lab团队开发的高效3D城市生成框架,基于3D高斯绘制技术,采用紧凑的BEV-Point表示方法降低显存和存储需求。其空间感知的BEV-Point解码器可生成高质量3D城市场景,支持多样化视角和实时渲染,适用于游戏、影视、城市规划等领域。相比现有方法,其生成速度提升60倍,兼具高效与高质量特性。

VideoPoet

VideoPoet是一款基于大模型的AI视频生成工具,支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计,能够处理和转换不同类型的输入信号,无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

fal

Fal 是一款面向开发者的 AI 工具平台,专注于音频、视频和图像生成与处理。它具备高性能推理引擎、跨平台支持、自然语言处理功能及实时交互式应用支持。通过灵活的按需付费模式,Fal 可广泛应用于创意设计、广告营销、游戏开发、教育培训和电子商务等领域。

绘蛙AI视频

绘蛙新推出的AI图生视频工具,支持模特图一键变成视频。

Vivago AI

北京智象未来科技有限公司面向全球市场推出的一款综合性在线 AI 创作平台,提供视频生成、图片生成、图片agent编辑,数字人生成,3D模型等功能。

Voice Design

Voice Design是一款由ElevenLabs研发的AI语音生成工具,通过描述声音特征或虚构角色来快速生成独特的人类化语音。它支持32种语言,适用于视频旁白、广告配音、播客制作、游戏开发及虚拟助手等多个场景,为内容创作者提供高效且多样化的语音解决方案。

VITRON

VITRON是一款由多家顶尖机构联合研发的像素级视觉大型语言模型,具备强大的图像与视频处理能力,涵盖理解、生成、分割及编辑等功能。它融合了编码器-LLM-解码器架构、视觉-语言编码和视觉专家系统,支持多种视觉任务,广泛应用于图像编辑、视频创作、教育辅助、电商营销和新闻报道等领域。

千禾智能AI视频换脸

实现超逼真的视频换脸,高精度的视频抠像,流畅自然的视频插帧,快速高效的视频人脸修复,以及清晰锐利的视频无损放大

Crayo AI

Crayo AI是一款面向内容创作者的AI短视频生成工具,利用自然语言处理和计算机视觉技术,帮助用户一键生成适用于抖音、TikTok等平台的短视频。该工具提供多种功能,包括AI脚本生成、语音旁白、图像生成、视频编辑和自动字幕生成,简化了视频制作流程,使创作者能够更专注于创意和故事叙述,从而提升内容的吸引力和传播力。