文本到视频

Etna

是由七火山科技开发的一个平...

Ai视频生成 2026年06月23日 0 点赞 0 评论 716 浏览

ConsisID

ConsisID是一款由北京大学和鹏城实验室开发的文本到视频生成工具，其核心技术在于通过频率分解保持视频中人物身份的一致性。该模型具备高质量视频生成能力、无需微调的特点以及强大的可编辑性，同时拥有优秀的泛化性能。其主要功能包括身份保持、高质量视频生成、文本驱动编辑以及跨领域人物处理，广泛应用于个性化娱乐、虚拟主播、影视制作、游戏开发及教育模拟等领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 712 浏览

腾讯混元文生视频

腾讯混元文生视频是一款利用AI技术生成高质量视频内容的工具，可根据文本提示生成具有大片质感的视频。它支持多语言输入，涵盖高清画质、流畅镜头切换及自然场景模拟等功能，适用于电影制作、广告设计、教育培训等多种应用场景。

AI项目与工具 2025年06月12日 22 点赞 0 评论 703 浏览

Phantom

Phantom是由字节跳动研发的视频生成框架，支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术，结合文本和图像提示，实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能，适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练，具备强大的跨模态理解和生成能力。

AI项目与工具 2025年06月12日 72 点赞 0 评论 685 浏览

Vace AI

Vace AI 是一款集成视频生成与编辑功能的 AI 工具，支持文本到视频、参考图像生成视频等功能，并提供风格转换、主体移除、画面扩展等编辑选项。基于先进模型技术，可精准保留关键视觉元素，生成高质量视频，适用于短视频制作、创意内容生成及广告设计等多种场景。

AI项目与工具 2025年06月12日 92 点赞 0 评论 681 浏览

ID

ID-Animator是一款由腾讯光子工作室、中科大和中科院合肥物质科学研究院联合开发的零样本人类视频生成技术。它能够根据单张参考面部图像生成个性化视频，并根据文本提示调整视频内容。ID-Animator通过结合预训练的文本到视频扩散模型和轻量级面部适配器，实现高效的身份保真视频生成。其主要功能包括视频角色修改、年龄和性别调整、身份混合以及与ControlNet等现有条件模块的兼容性。

AI项目与工具 2024年01月01日 67 点赞 0 评论 680 浏览

智谱清影

智谱清影是一款基于AI的视频生成工具，用户可以通过输入文本或上传图片，生成10秒、4K、60帧的高质量视频。支持多种风格和背景音乐，适用于个人创作者和专业制作团队。该工具基于CogVideoX模型，提升了视频的连贯性和逻辑一致性，并支持API调用。

AI项目与工具 2025年06月12日 29 点赞 0 评论 675 浏览

VideoPoet是一款基于大模型的AI视频生成工具，支持从文本、图像或视频输入中合成高质量的视频内容及匹配的音频。其核心优势在于多模态大模型设计，能够处理和转换不同类型的输入信号，无需特定数据集或扩散模型即可实现多种风格和动作的视频输出。主要功能包括文本到视频转换、图像到视频动画、视频风格化、视频编辑和扩展、视频到音频转换以及多模态学习等。技术原理涉及多模态输入处理、解码器架构、预训练与任务适应

AI项目与工具 2024年01月01日 98 点赞 0 评论 662 浏览

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 656 浏览

LanDiff

LanDiff是一种结合自回归语言模型和扩散模型的文本到视频生成框架，采用粗到细的生成策略，有效提升语义理解与视觉质量。其核心功能包括高效语义压缩、高质量视频生成、语义一致性保障及灵活控制能力。支持长视频生成，降低计算成本，适用于视频制作、VR/AR、教育及社交媒体等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 649 浏览

文本到视频

首页

文本到视频

列表

默认

浏览次数

发布日期