图像 - 智狐AI导航

Kandinsky

Kandinsky-3是一款基于潜在扩散模型的文本到图像生成框架，支持文本到图像生成、图像修复、图像融合、文本-图像融合、图像变化生成及视频生成等多种功能。其核心优势在于简洁高效的架构设计，能够快速生成高质量图像并提升推理效率。

AI项目与工具 2025年06月12日 84 点赞 0 评论 751 浏览

Omni Reference

Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能，允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数，用户可灵活控制参考图像的权重与风格融合程度，提升创作精度与多样性。支持 Web 和 Discord 两种平台操作，适用于角色嵌入、产品展示、场景构建等多种应用场景。

AI项目与工具 2025年06月11日 48 点赞 0 评论 750 浏览

3DIS

3DIS-FLUX是一种基于深度学习的多实例图像生成框架，采用两阶段流程：先生成场景深度图，再进行细节渲染。通过注意力机制实现文本与图像的精准对齐，无需额外训练即可保持高生成质量。适用于电商设计、创意艺术、虚拟场景构建及广告内容生成等领域，具备良好的兼容性和性能优势。

AI项目与工具 2025年06月12日 32 点赞 0 评论 750 浏览

MoshiVis

MoshiVis是一款由Kyutai开发的开源多模态语音模型，支持图像与语音的自然交互。它基于Moshi 7B架构，集成了视觉编码器和跨注意力机制，实现低延迟、自然流畅的对话体验。支持多种后端部署，适用于无障碍应用、智能家居、教育及工业场景，提升人机交互的智能化水平。

AI项目与工具 2025年06月12日 72 点赞 0 评论 750 浏览

Qwen Chat

Qwen Chat是阿里通义推出的AI交互平台，支持多模型对比、文档问答、图像理解、HTML展示及代码生成等功能。用户可通过上传文档或图片进行精准问答与内容分析，同时支持生成图表、代码等人工制品。适用于教育、开发、内容创作及企业办公等多个场景，提升工作效率与用户体验。

AI项目与工具 2025年01月13日 27 点赞 0 评论 749 浏览

腾讯混元游戏

腾讯发布的混元游戏视觉生成平台，这是依托混元大模型打造的首个工业级AIGC游戏内容生产引擎，可以优化游戏资产生成与游戏制作流程。

3D&游戏 2025年06月05日 38 点赞 0 评论 749 浏览

Vmake.ai

提供一系列多功能的 AI 驱动工具，集成了虚拟模特，消除了传统的照片拍摄。旨在帮助您电子商务提供高质量的AI设计服务。

电商运营 2025年06月05日 23 点赞 0 评论 749 浏览

Almaginate-增强版MJ

Almaginate作为一个AI创作平台，通过提供图像生成、风格转换和创意启发等功能，帮助用户以新颖的方式进行艺术创作。它可能特别适合那些寻求创新创作方法的艺术家和设计师。

Ai绘画生成 2026年06月24日 0 点赞 0 评论 749 浏览

PhotoAid

PhotoAid出品的证件照, 驾驶证, 护照, 简历, 智能证件照AI生成工具。

Ai图片处理 2025年06月05日 19 点赞 0 评论 749 浏览

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型，具备 8B 参数量，支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异，采用高效的 token 技术提升推理速度，可在端侧设备上运行。支持多种语言和音色配置，适用于智能助手、内容创作、教育、客服和医疗等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 749 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期