图像 - 智狐AI导航

EasyAnimate

EasyAnimate是一款由阿里巴巴研发的AI视频生成工具，支持通过文本或图片生成视频。用户可以上传图片作为视频的起始和结束画面，增加视频编辑的灵活性。该工具最长可生成1分钟的视频，适用于内容创作、教育、营销等多个领域。用户可以通过简单的操作快速生成高质量的视频内容。

AI项目与工具 2025年06月12日 24 点赞 0 评论 686 浏览

Amuse AI

Amuse 2.0是一款由AMD开发的AI图像生成工具，专为AMD硬件优化，支持在PC上生成高质量图像。它具备设计模式，可将用户的草图和文本提示转化为图像，并提供AI滤镜功能，便于个性化风格的创作。Amuse 2.0 Beta版本集成了AMD XDNA超级分辨率技术，能有效提升图像分辨率。此外，该工具还提供了平衡、快速和质量三种模式，以满足不同用户的需求和偏好。

AI项目与工具 2025年06月12日 94 点赞 0 评论 875 浏览

MOFA

MOFA-Video是由腾讯AI实验室和东京大学研究人员开发的开源图像生成视频模型。该工具通过生成运动场适配器对图像进行动画处理，能够通过稀疏控制信号（如手动轨迹、面部关键点序列或音频）实现对视频生成过程中动作的精准控制。MOFA-Video支持零样本学习，能够将多种控制信号组合使用，生成复杂的动画效果，并能生成较长的视频片段。 ---

AI项目与工具 2025年06月12日 22 点赞 0 评论 601 浏览

Unique3D

Unique3D是一款由清华大学团队开发的开源框架，专注于单张图像到3D模型的转换。它利用多视图扩散模型和法线扩散模型，结合多级上采样策略和ISOMER算法，能够在短时间内生成高保真度且纹理丰富的3D网格模型。Unique3D能够从单个2D图像生成3D网格模型、多个正交视图图像和法线贴图，并通过多级上采样过程提高图像分辨率，最终实现颜色和几何细节的高度整合。

AI项目与工具 2025年06月12日 28 点赞 0 评论 710 浏览

Gen

Gen-3 Alpha是一款由Runway公司研发的AI视频生成模型，能够生成长达10秒的高清视频片段，支持文本到视频、图像到视频的转换，并具备精细的时间控制及多种高级控制模式。其特点在于生成逼真的人物角色、复杂的动作和表情，提供运动画笔、高级相机控制和导演模式等高级控制工具，确保内容的安全性和合规性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 597 浏览

阶跃星辰推出移动端AI智能问答助手跃问APP

跃问是一款基于阶跃星辰Step系列通用大模型开发的移动应用，具备强大的文本和图像处理能力，能够高效完成内容创作、逻辑推理、数据分析等任务。该应用支持联网搜索、文档解析、推理速度优化，并具备拍照识图和语音输入功能。跃问还提供了高效阅读、智能问答、写作翻译和多端同步等功能，为用户提供便捷的信息获取和处理体验。

AI项目与工具 2024年01月01日 61 点赞 0 评论 595 浏览

MimicBrush

MimicBrush是一款由阿里巴巴、香港大学和蚂蚁集团联合研发的AI图像编辑工具，通过参考图像模仿和自动区域识别功能，支持对象替换、样式转换和纹理调整等多种图像编辑操作。它具备实时预览、一键编辑和高度自适应的特点，广泛应用于产品设计、时尚、美容、广告、社交媒体内容创作及电子商务等多个领域。

AI项目与工具 2024年01月01日 77 点赞 0 评论 775 浏览

Stability AI开源Stable Diffusion 3 Medium文生图模型

Stable Diffusion 3 Medium是一款由Stability AI开源的文本到图像生成模型，拥有20亿个参数，适用于消费级和企业级GPU。该模型具备照片级真实感、强大的提示理解和排版能力，以及高资源效率。此外，它还支持API试用，并得到了NVIDIA和AMD的支持，以优化其性能。Stability AI致力于开放和安全的AI应用，并计划持续改进SD3 Medium。

AI项目与工具 2024年01月01日 67 点赞 0 评论 517 浏览

腾讯元器

腾讯元器是一款基于腾讯混元大模型的AI智能体创作与分发平台，提供低代码或无代码的智能体开发环境，覆盖多种业务场景和功能。它通过智能体商店、工作流模式、腾讯生态集成等功能，简化了智能体的创建、部署和分发过程，支持一键分发至腾讯的多平台渠道，适用于客服、教育、金融、法律等多个行业。

AI项目与工具 2025年06月12日 31 点赞 0 评论 671 浏览

混元DiT（Hunyuan-DiT）是腾讯混元团队开源的高性能文本到图像的扩散Transformer模型，具备细粒度的中英文理解能力，能够生成多分辨率的高质量图像。该模型结合了双语CLIP和多语言T5编码器，通过精心设计的数据管道进行训练和优化。混元DiT的主要功能包括双语文本到图像生成、细粒度中文元素理解、长文本处理能力、多尺寸图像生成、多轮对话和上下文理解、高一致性和艺术性。此外，混元DiT在

AI项目与工具 2024年01月01日 64 点赞 0 评论 656 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期