LatentSync LatentSync是由字节跳动与北京交通大学联合研发的端到端唇形同步框架,基于音频条件的潜在扩散模型,无需中间3D或2D表示,可生成高分辨率、动态逼真的唇同步视频。其核心技术包括Temporal Representation Alignment (TREPA)方法,提升视频时间一致性,并结合SyncNet监督机制确保唇部动作准确。适用于影视制作、教育、广告、远程会议及游戏开发等多个领域。 AI项目与工具 2025年06月12日 95 点赞 0 评论 533 浏览
Bing Video Creator Bing Video Creator是微软推出的AI视频生成工具,基于OpenAI的Sora模型,用户可通过输入文本描述快速生成5秒短视频。支持9:16格式,提供快速模式和标准模式,初始有10次免费生成机会。功能包括视频生成、多种风格选择、视频存储和分享等,适用于广告、教学、创意和个人娱乐等多种场景。 AI项目与工具 2025年06月11日 80 点赞 0 评论 532 浏览
AvatarFX AvatarFX是由Character.AI开发的AI视频生成工具,通过上传图片和选择语音,可生成角色说话、唱歌和表达情感的动态视频。支持多角色、多轮对话及长视频生成,具备高时间一致性。采用扩散模型与音频条件化技术,确保动作与语音同步。适用于互动故事、虚拟直播、娱乐表演及教育内容创作,提供高效、高质量的视频生成体验。 AI项目与工具 2025年06月11日 12 点赞 0 评论 530 浏览
TrackGo TrackGo是一种先进的AI视频生成技术,利用自由形状的遮罩和箭头提供精确的运动控制。其核心技术TrackAdapter无缝集成到预训练的视频生成模型中,通过调整时间自注意力层来激活与运动相关的区域。TrackGo在视频质量、图像质量和运动忠实度方面表现出色,适用于影视制作、动画制作、虚拟现实(VR)、增强现实(AR)和游戏开发等多个领域。 AI项目与工具 2025年06月12日 64 点赞 0 评论 528 浏览
奇觅 奇觅是由美图公司推出的专注于游戏行业的广告AI制作与投放一体化平台。利用先进的AI技术,提供灵感生成、广告制作和广告投放等服务,帮助广告策划人员和广告主提升创意和投放效果... Ai视频生成 1970年01月01日 0 点赞 0 评论 525 浏览
妙刷 妙刷是一款由美团推出的AI创作工具,支持修图、文本生图、音频生图及视频生成等功能,可将日常素材转化为艺术作品,如拟人化宠物、魔幻风景等,同时定期更新玩法和特效以保持新鲜感。 AI项目与工具 2025年06月12日 99 点赞 0 评论 525 浏览
Aitubo Aitubo是一款基于先进Flux模型的AI图像和视频生成平台,支持用户通过文本提示生成高质量图像,并具备背景移除、图像放大增强、AI外扩绘画以及人脸交换等功能,广泛应用于游戏开发、动漫制作、艺术创作及广告营销等领域。 AI项目与工具 2025年06月12日 42 点赞 0 评论 524 浏览
Etna模型 一个文字转视频的AIGC模型,Etna能够根据简短的文本描述生成相应的视频内容,支持生成时长为8-15秒的视频,且视频流畅度极高,每秒可达60帧。 Ai视频生成 2025年06月05日 28 点赞 0 评论 523 浏览
OmniSync OmniSync是由中国人民大学、快手科技和清华大学联合开发的通用对口型框架,基于扩散变换器实现视频中人物口型与语音的精准同步。它采用无掩码训练范式,直接编辑视频帧,支持无限时长推理,保持自然面部动态和身份一致性。通过渐进噪声初始化和动态时空分类器自由引导(DS-CFG)机制,提升音频条件下的口型同步效果。OmniSync适用于影视配音、虚拟现实、AI内容生成等多个场景。 AI项目与工具 2025年06月11日 27 点赞 0 评论 523 浏览