文本到视频

首页

文本到视频

列表

默认

浏览次数

发布日期

Seaweed

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 656 浏览

WaveSpeedAI

WaveSpeedAI

WaveSpeedAI 是一款集图像与视频生成于一体的 AI 平台，提供多个高性能模型，支持高质量图像生成、个性化风格定制及视频内容创作。平台具备超快速生成能力，适用于创意设计、广告制作和视频内容生产等领域，提供易用接口和企业级部署选项。

AI项目与工具 2025年06月11日 40 点赞 0 评论 769 浏览

ShotAdapter

ShotAdapter

ShotAdapter是一款由Adobe与UIUC联合开发的文本到多镜头视频生成框架，通过过渡标记和局部注意力掩码策略，实现角色身份一致性和镜头内容精准控制。支持用户通过文本提示调节镜头数量、时长和背景，适用于影视、广告、教育、游戏等领域，具备高效、灵活和可扩展的技术特点。

AI项目与工具 2025年06月11日 73 点赞 0 评论 538 浏览

VideoDrafter

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 742 浏览

Lumiere

Lumiere

Lumiere

谷歌研究院开发的基于空间时间的文本到视频扩散模型。采用了创新的空间时间U-Net架构，能够一次性生成整个视频的时间长度，确保了生成视频的连贯性和逼真度。

Ai开源项目 2025年06月05日 74 点赞 0 评论 718 浏览

CogVideo

CogVideo

目前最大的通用领域文本生成视频预训练模型，含94亿参数。CogVideo将预训练文本到图像生成模型（CogView2）有效地利用到文本到视频生成模型，并使用了多帧率分层训练策略。

Ai平台模型 2025年06月05日 16 点赞 0 评论 717 浏览

微信公众账号

微信扫一扫加关注