DiTCtrl DiTCtrl是一种基于多模态扩散变换器架构的视频生成工具,能够利用多个文本提示生成连贯且高质量的视频内容,无需额外训练即可实现零样本多提示视频生成。它通过KV共享和潜在混合策略优化不同提示间的平滑过渡,同时在MPVBench基准上表现出色,适用于电影、游戏、广告及新闻等多个领域。 AI项目与工具 2025年06月12日 18 点赞 0 评论 545 浏览
ConsisID ConsisID是一款由北京大学和鹏城实验室开发的文本到视频生成工具,其核心技术在于通过频率分解保持视频中人物身份的一致性。该模型具备高质量视频生成能力、无需微调的特点以及强大的可编辑性,同时拥有优秀的泛化性能。其主要功能包括身份保持、高质量视频生成、文本驱动编辑以及跨领域人物处理,广泛应用于个性化娱乐、虚拟主播、影视制作、游戏开发及教育模拟等领域。 AI项目与工具 2025年06月12日 18 点赞 0 评论 545 浏览
PlaiDay PlaiDay和Orchestra平台展现了AI技术在个性化内容生成和其他领域的潜力,为用户提供了一个易于使用且功能强大的视频创作环境。 Ai视频生成 1970年01月01日 0 点赞 0 评论 546 浏览
Emu3 Emu3是一款由北京智源人工智能研究院开发的原生多模态世界模型,结合了多模态自回归技术和单一Transformer架构,能够在图像、视频和文本之间实现无缝转换。它不仅能够根据文本生成高质量图像,还能预测视频发展并理解图文内容,广泛应用于内容创作、广告营销、教育、娱乐等多个领域。 AI项目与工具 2025年06月12日 58 点赞 0 评论 547 浏览
CogVideo 目前最大的通用领域文本生成视频预训练模型,含94亿参数。CogVideo将预训练文本到图像生成模型(CogView2)有效地利用到文本到视频生成模型,并使用了多帧率分层训练策略。 Ai平台模型 2025年06月05日 16 点赞 0 评论 547 浏览
豆包PixelDance 豆包PixelDance是一款由字节跳动开发的AI视频生成工具,基于DiT架构,支持文生视频和图生视频功能。它具备强大的语义理解能力,可生成长达10秒的连贯视频片段,并拥有丰富的运镜效果。该工具支持多种艺术风格和视频比例,适用于影视、广告、短视频等多种场景,极大简化了视频创作流程。 AI项目与工具 2025年06月12日 32 点赞 0 评论 549 浏览
Mora Mora是一个多智能体框架,专为视频生成任务设计,通过多个视觉智能体的协作实现高质量视频内容的生成。主要功能包括文本到视频生成、图像到视频生成、视频扩展与编辑、视频到视频编辑以及视频连接。尽管在处理大量物体运动场景时性能稍逊于Sora,Mora仍能在生成高分辨率视频方面表现出色。 AI项目与工具 2024年01月01日 75 点赞 0 评论 551 浏览
擎舵 擎舵是百度营销推出的多模态AIGC创意生产平台,专注于视频、图片、文字等内容的智能生成。平台通过百度大模型技术支持,实现一键生成视频、图片、文字,自动识别视频素材内容,生成营销图,制作数字人视频,支持图片数字人生成及数字人形象与语音定制。擎舵服务于教育、汽车、旅游等多个行业,提供全流程AI赋能,帮助用户提升营销效率。 AI项目与工具 2025年06月12日 17 点赞 0 评论 551 浏览
团队快剪 团队快剪是由闪剪智能开发的一款专为团队带货打造的AI视频创作系统,集成了爆款脚本库、短视频拍摄模板和商品素材管理功能,旨在帮助本地生活服务商家和品牌提高视频内容创作和团... Ai视频生成 1970年01月01日 0 点赞 0 评论 552 浏览