HumanDiT HumanDiT是一种由浙江大学与字节跳动联合开发的高保真人体视频生成框架,基于扩散变换器(DiT)实现姿态引导的视频生成。它支持长序列、多分辨率视频生成,并通过关键点扩散变换器(Keypoint-DiT)确保动作的连贯性与自然性。引入前缀潜在参考策略以保持个性化特征,结合姿态适配器和细化模块提升细节质量。适用于虚拟人、动画制作、沉浸式体验及视频续写等多种场景。 AI项目与工具 2025年06月12日 41 点赞 0 评论 285 浏览
3DTown 3DTown是由哥伦比亚大学联合Cybever AI等机构开发的AI工具,能够从单张俯视图生成高精度的3D城镇场景。它采用区域化生成和空间感知3D修复技术,将输入图像分解为重叠区域,分别生成3D内容并修复缺失结构,确保几何和纹理一致性。支持多种风格的场景生成,适用于虚拟世界构建、游戏开发、机器人模拟等领域,优于现有方法。 AI项目与工具 2025年06月11日 17 点赞 0 评论 285 浏览
PersonaMagic PersonaMagic 是一种基于文本条件策略的人脸生成技术,通过动态嵌入学习和双平衡机制实现高保真个性化图像生成。该工具可依据文本提示调整人脸风格、表情和背景,同时保持身份特征。支持单图像训练,降低数据需求,并可与其他模型结合使用。实验显示其在文本对齐和身份保持方面表现优异,适用于娱乐、游戏、影视及营销等多个领域。 AI项目与工具 2025年06月12日 67 点赞 0 评论 285 浏览
Vidu 1.5 Vidu 1.5是一款基于多模态视频大模型的AI生成工具,支持参考生视频、图生视频和文生视频生成,通过精准的语义理解能力,在30秒内完成高质量视频创作,适用于影视、动漫、广告等多行业场景,助力创作者高效产出多样化内容。 AI项目与工具 2025年06月12日 80 点赞 0 评论 285 浏览
Seaweed Seaweed-7B 是一款由字节跳动开发的视频生成模型,拥有约 70 亿参数,支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能,适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术,结合多阶段训练与优化策略,提升生成效率与质量,兼顾性能与成本效益。 AI项目与工具 2025年06月11日 80 点赞 0 评论 285 浏览
BookAI BookAI是一款结合AI技术的创新性交互平台,通过聊天机器人形式实现用户与书籍的互动交流。其主要功能包括多语言支持、智能对话、内容分析、个性化推荐、社交互动及阅读进度追踪等。BookAI不仅适用于个人阅读,还可用于语言学习、教育领域、图书馆服务以及企业培训等多个场景,为用户提供丰富且高效的阅读体验。 AI项目与工具 2025年06月12日 39 点赞 0 评论 286 浏览
RLCM RLCM是由康奈尔大学开发的一种基于强化学习的文本到图像生成框架,通过微调一致性模型以适应特定任务的奖励函数,显著提升生成效率与图像质量。其核心技术包括强化学习、策略梯度优化及任务导向的奖励机制,适用于艺术创作、数据集扩展、图像修复等多个领域,具有高效的推理能力和对复杂任务的适应性。 AI项目与工具 2025年06月12日 69 点赞 0 评论 287 浏览