SynCamMaster SynCamMaster是一款由多家顶尖高校与企业联合研发的多视角视频生成工具,支持从任意视点生成高质量开放世界视频。其核心技术包括结合6自由度相机姿态、多视图同步模块以及预训练文本到视频模型的增强版本。SynCamMaster不仅能在不同视角间保持动态同步,还能实现新视角下的视频合成与渲染,广泛应用于影视制作、游戏开发、虚拟现实及监控系统等领域。 AI项目与工具 2025年06月12日 56 点赞 0 评论 421 浏览
乾元BigBangTransformer BBT-2-12B-Text基于中文700亿tokens进行预训练,经过指令微调的BBT-2基础模型可以回答百科类和日常生活的问题。BBT-2.5-13B-Text基于中文+英文 2000亿tokens进行预训练。 Ai平台模型 1970年01月01日 0 点赞 0 评论 420 浏览
FaceChain FaceChain是一个由阿里巴巴达摩院开发的开源AI生成框架,专为创建个人数字形象而设计。用户上传个人照片后,可生成独特且个性化的数字写真。该框架采用先进的机器学习技术,支持多风格写真生成、个性化训练、姿态控制和自定义提示词等功能,满足不同用户的多样化需求。 AI项目与工具 2024年01月01日 50 点赞 0 评论 419 浏览
VtripGPT VtripGPT是一款专为旅游领域设计的AI大模型,采用Transformer架构,结合增量预训练和微调技术,可生成高质量的旅游相关文本回复。它具备对话生成、个性化旅游攻略提供、行程定制、商品推荐以及智能问答等功能,旨在提升旅游规划效率并优化用户体验。VtripGPT已成功应用于多个国家和地区,覆盖了从旅游攻略生成到商品推荐的多种应用场景。 AI项目与工具 2025年06月12日 50 点赞 0 评论 417 浏览
秒画Sensemirage 商汤秒画Sensemirage是一款基于AI大模型的文生图创作平台,可以让用户通过输入文字描述,快速生成高质量的图像。 Ai绘画生成 2025年06月05日 72 点赞 0 评论 417 浏览
SynCD SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集,用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像,结合共享注意力机制和3D资产引导,确保对象一致性。该数据集支持无调优模型训练,提升图像质量和身份保持能力,广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。 AI项目与工具 2025年06月12日 92 点赞 0 评论 414 浏览
OpenVision OpenVision是加州大学圣克鲁兹分校推出的多模态视觉编码器系列,具备从5.9M到632.1M参数的多种模型,适用于不同硬件环境。其采用渐进式多阶段分辨率训练策略,训练效率比同类模型高2至3倍,在多模态任务中表现优异。支持可变大小patch输入,兼具灵活性与高效性,广泛应用于工业检测、机器人视觉、自动驾驶及科研教育等领域。 AI项目与工具 2025年06月11日 58 点赞 0 评论 414 浏览
Photo AI Photo AI 是一种革命性的人工智能工具,使用ai为您提供专业水准的照片拍摄,用于在各种设置中生成逼真的图像。 Ai图片处理 2025年06月05日 38 点赞 0 评论 411 浏览