MovieDreamer MovieDreamer是一个由浙江大学与阿里巴巴联合开发的AI视频生成框架,专为长视频设计。该框架结合自回归模型和扩散渲染技术,生成复杂的长视频内容。它支持多层次叙事一致性、高质量视觉渲染和多模态脚本,适用于电影预告片、VR叙事、教育视频和游戏内剧情等多种场景。 AI项目与工具 2025年06月12日 34 点赞 0 评论 519 浏览
RelightVid RelightVid是一款基于时序一致性扩散模型的视频重照明工具,由多所高校和研究机构联合开发。它支持通过文本提示、背景视频或HDR环境贴图对视频进行细粒度和一致的场景编辑,具备全场景和前景保留重照明功能。该模型在预训练图像照明编辑框架基础上扩展,引入时序层提升视频重照明效果,并结合真实视频与3D渲染数据生成高质量数据对。RelightVid在保持时序一致性和照明细节方面表现突出,适用于影视制作、 AI项目与工具 2025年06月11日 53 点赞 0 评论 510 浏览
CityDreamer4D CityDreamer4D是由南洋理工大学S-Lab开发的4D城市生成模型,通过分离动态与静态元素,结合模块化架构生成逼真城市环境。支持无边界扩展、风格化处理、局部编辑及多视角一致性,适用于城市规划、自动驾驶和虚拟现实等领域。采用高效鸟瞰图表示法与神经场技术,提升生成效率与质量。 AI项目与工具 2025年06月12日 55 点赞 0 评论 503 浏览
混元DiT 混元DiT(Hunyuan-DiT)是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型,具备细粒度的中英文理解能力,能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器,通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外,混元DiT在 AI项目与工具 2024年01月01日 64 点赞 0 评论 495 浏览
FLOAT FLOAT是一款基于音频驱动的虚拟人像生成模型,利用运动潜在空间和流匹配技术,实现时间一致性视频生成。它支持情感增强,生成自然且富有表现力的虚拟人物,广泛应用于虚拟主播、视频会议、社交媒体、游戏以及电影制作等多个领域,同时具备高效的采样和生成能力。 AI项目与工具 2025年06月12日 18 点赞 0 评论 495 浏览
FlipSketch FlipSketch 是一种创新的AI工具,能够将静态草图转化为基于文本描述的动画。它通过微调草图风格的帧生成、参考帧机制和双注意力合成技术,保持草图视觉特征的一致性,同时实现流畅的动态转换。FlipSketch 在保持手绘艺术性的同时提供直观的动画制作体验,适用于教育、影视、产品演示和数字艺术等领域。 AI项目与工具 2025年06月12日 73 点赞 0 评论 495 浏览
LTX Video LTX Video是一款基于开源架构的AI视频生成工具,利用先进的扩散Transformer技术和2亿参数的DiT架构,能够在短时间内生成高质量视频。其功能涵盖实时生成、运动一致性保障、开源可扩展性及广泛的硬件兼容性,适用于游戏、广告、影视等多种行业,为用户提供高效的视频生成解决方案。 AI项目与工具 2025年06月12日 34 点赞 0 评论 495 浏览
Add Add-it是一款无需训练的图像编辑工具,允许用户通过文本指令在图像中插入新对象。其核心功能包括保持场景结构一致性、确保对象自然融合、支持非真实感图像处理等。Add-it采用扩展的注意力机制和主题引导潜在混合技术,无需额外训练即可实现高质量图像编辑。广泛适用于广告、内容创作、影视制作等领域。 AI项目与工具 2025年06月12日 30 点赞 0 评论 494 浏览
Phantom Phantom是由字节跳动研发的视频生成框架,支持从参考图像中提取主体并生成符合文本描述的视频内容。它采用跨模态对齐技术,结合文本和图像提示,实现高质量、主体一致的视频生成。支持多主体交互、身份保留等功能,适用于虚拟试穿、数字人生成、广告制作等多种场景。模型基于文本-图像-视频三元组数据训练,具备强大的跨模态理解和生成能力。 AI项目与工具 2025年06月12日 72 点赞 0 评论 488 浏览
GoCharlie GoCharlie 是一个专为零售行业设计的全栈 AI 平台,集成了定制化的大型语言模型 Charlie。它支持多模态数据处理,包括文本、图像、视频和音频,为企业提供内容创作、客户服务、营销活动策划及数据分析等全方位解决方案,帮助企业提升运营效率和客户满意度。 AI项目与工具 2025年06月12日 32 点赞 0 评论 484 浏览