DistriFusion DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理,它能够在不增加额外训练负担的情况下,将推理速度提升高达六倍,同时保持图像质量。其技术原理包括Patch Parallelism(分片并行)、异步通信、位移补丁并行性等,适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A AI项目与工具 2025年06月12日 50 点赞 0 评论 581 浏览
Emu Video Meta开发的文本到视频生成模型,Emu Video使用扩散模型根据文本提示创建视频,首先生成图像,然后根据文本和生成的图像创建视频。 Ai视频生成 2025年06月05日 40 点赞 0 评论 579 浏览
S2V S2V-01是MiniMax研发的视频生成模型,基于单图主体参考架构,可快速生成高质量视频。它能精准还原图像中的面部特征,保持角色一致性,并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出,具备电影感镜头效果,适用于短视频、广告、游戏、教育等多种场景,具有高效、稳定和高自由度的特点。 AI项目与工具 2025年06月12日 100 点赞 0 评论 579 浏览
novelcrafter Novelcrafter是一款面向小说作者的AI辅助写作工具,集成了角色设定、情节规划、灵感捕捉等功能,同时支持AI交互式对话与大纲细化,助力从创意萌芽到最终成稿的全流程。具备高度灵活性和隐私保障,适合各类写作需求。 AI项目与工具 2025年06月12日 60 点赞 0 评论 579 浏览
Koko AI 一款具有AI生成的3D模型和语音聊天功能的社交娱乐应用,Koko AI融合了3D模型、动画表演和语音聊天技术,为用户提供了与动漫角色进行面对面的互动体验。 生活创意 2025年06月05日 87 点赞 0 评论 579 浏览
Video Video-LLaVA2是一款由北京大学ChatLaw课题组开发的开源多模态智能理解系统。该系统通过时空卷积(STC)连接器和音频分支,显著提升了视频和音频的理解能力。其主要功能包括视频理解、音频理解、多模态交互、视频问答和视频字幕生成。时空建模和双分支框架是其核心技术原理。Video-LLaVA2广泛应用于视频内容分析、视频字幕生成、视频问答系统、视频搜索和检索、视频监控分析及自动驾驶等领域。 AI项目与工具 2025年06月12日 50 点赞 0 评论 579 浏览
roomGPT RoomGPT是一款基于AI技术的室内设计工具,用户上传房间照片后,可在几秒内生成多种设计方案,涵盖不同主题、色彩搭配及家具布局。它还提供成本估算功能,帮助用户在保持预算可控的前提下实现理想的设计效果,广泛适用于个人住宅、商业空间、房地产营销及教育领域。 AI项目与工具 2025年06月12日 79 点赞 0 评论 579 浏览
Kaiber Kaiber是一个视频生成引擎,用户可以根据自己的图片或文字描述创建视频。它为音乐家提供了Spotify Canvas等功能,为艺术家提供了灵感,为创作者提供了内容,为未来主义者提供了乐... Ai视频生成 2026年06月25日 0 点赞 0 评论 578 浏览