高分辨率 - 智狐AI导航

Hallo2

Hallo2是一款由复旦大学、百度公司和南京大学合作开发的音频驱动视频生成模型。它能够将单张图片与音频结合，并通过文本提示调节表情，生成高分辨率4K视频。Hallo2采用了补丁下降、高斯噪声等数据增强技术，提升了视频的视觉一致性和时间连贯性，同时通过语义文本标签提高了生成内容的可控性与多样性。该模型适用于电影、游戏、虚拟助手等多个领域，展现出强大的内容生成能力。

AI项目与工具 2025年06月12日 80 点赞 0 评论 561 浏览

FlashVideo

FlashVideo是由字节跳动团队研发的高分辨率视频生成框架，采用两阶段方法优化计算效率。第一阶段在低分辨率下生成高质量内容，第二阶段通过流匹配技术提升至1080p，仅需4次函数评估。其特点包括高效计算、细节增强、快速预览及多场景应用，适用于广告、影视、教育等领域。

AI项目与工具 2025年06月12日 26 点赞 0 评论 564 浏览

Turbo logo

在几分钟内制作令人惊叹的徽标

Ai绘画生成 2026年06月23日 0 点赞 0 评论 568 浏览

AI Pet Photos

AI Pet Photos 是一款在线服务平台，通过人工智能技术为宠物（特别是猫和狗）生成定制的艺术肖像。该平台提供多种艺术风格供用户选择，并支持自定义背景和文字，确保生成的高分辨率图像适合打印或在线分享。主要应用场景包括个人纪念、礼物赠送、社交媒体分享、定制商品以及宠物摄影业务。

AI项目与工具 2025年06月12日 96 点赞 0 评论 569 浏览

MAETok

MAETok是一种基于掩码建模的图像标记化方法，通过自编码器结构学习更具语义丰富性的潜在空间，提升图像生成质量与训练效率。它支持高分辨率图像生成，具备多特征预测能力和灵活的潜在空间设计，适用于娱乐、数字营销、计算机视觉等多个领域。实验表明其在ImageNet数据集上表现优异。

AI项目与工具 2025年06月12日 67 点赞 0 评论 572 浏览

Emu Video

Meta开发的文本到视频生成模型，Emu Video使用扩散模型根据文本提示创建视频，首先生成图像，然后根据文本和生成的图像创建视频。

Ai视频生成 2025年06月05日 40 点赞 0 评论 575 浏览

DistriFusion是一个专为加速高分辨率扩散模型在多GPU环境中生成图像的分布式并行推理框架。通过将图像分割成多个小块并分配至不同设备上进行独立处理，它能够在不增加额外训练负担的情况下，将推理速度提升高达六倍，同时保持图像质量。其技术原理包括Patch Parallelism（分片并行）、异步通信、位移补丁并行性等，适用于多种现有的扩散模型。应用场景包括AI艺术创作、游戏和电影制作、VR/A

AI项目与工具 2025年06月12日 50 点赞 0 评论 577 浏览

Magic3D

Magic3D是GPU制造商Nvidia在2023年2月宣布推出Magic3D，这是一种生成式AI技术，可以根据文本提示生成3D模型。

Ai绘画生成 2026年06月23日 0 点赞 0 评论 579 浏览

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型，能够生成1024×1024像素的高分辨率图像，质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块，HART实现了高效的图像生成，并在多个指标上表现出色，包括重构FID、生成FID以及计算效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 580 浏览

ConsistentDreamer

ConsistentDreamer 是由华为慕尼黑研究中心开发的图像到 3D 资产生成技术，能通过单张图像生成多视图一致的 3D 网格。该技术采用多视图先验图像引导和分数蒸馏采样优化，结合动态权重平衡和多种损失函数，提升 3D 表面质量和纹理精度。支持复杂场景编辑、风格转换、物体修改等功能，适用于室内场景、艺术风格转换及跨视图一致性任务。

AI项目与工具 2025年06月12日 60 点赞 0 评论 582 浏览

高分辨率

首页

高分辨率

列表

默认

浏览次数

发布日期