图像 - 智狐AI导航

DCEdit

DCEdit是一款基于双层控制机制的图像编辑工具，结合精确语义定位策略与视觉、文本自注意力优化，提升图像编辑的准确性和可控性。无需额外训练即可应用于现有扩散模型，支持复杂场景下的精细编辑任务，如对象替换、颜色调整等，适用于广告、影视、社交媒体等多个领域。

AI项目与工具 2025年06月12日 15 点赞 0 评论 502 浏览

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型，支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器，具备强大的图像感知、数学推理和OCR能力。在长上下文（128K）和复杂任务中表现优异，尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 578 浏览

Krea Stage

Krea Stage 是一款基于 AI 技术的工具，能够将 2D 图像快速转换为可编辑的 3D 场景，并支持视频生成。用户可通过直观界面实时调整物体、光影和视角，无需专业建模知识。适用于影视、游戏、艺术、VR 和广告等多个领域，提升了 3D 内容创作的效率和灵活性。

AI项目与工具 2025年06月11日 16 点赞 0 评论 781 浏览

Pollo AI

Pollo AI是一款由HIX.AI推出的AI视频创作平台，支持文本、图像及视频风格转换等多种功能，能将文字或图片快速生成高质量视频。平台具备角色一致性保障、多风格转换、高清输出等特性，适用于短视频制作、品牌推广、教学视频等领域，为用户提供高效的AI视频生成体验。

AI项目与工具 2025年06月11日 71 点赞 0 评论 889 浏览

FlexIP

FlexIP 是腾讯推出的图像合成框架，支持在保持主体身份的同时进行个性化编辑。其双适配器架构分离身份保持与编辑功能，结合动态权重门控机制实现灵活控制，并通过多模态数据训练提升生成质量与稳定性，适用于艺术创作、广告设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 31 点赞 0 评论 570 浏览

UNO

UNO是字节跳动推出的AI图像生成框架，支持单主体和多主体图像生成，解决多主体一致性难题。采用扩散变换器和渐进式跨模态对齐技术，结合通用旋转位置嵌入（UnoPE），实现高一致性与可控性。适用于虚拟试穿、产品设计、创意设计等多个领域，具备强大泛化能力，已开源并提供完整技术文档。

AI项目与工具 2025年06月11日 23 点赞 0 评论 888 浏览

PixelFlow

PixelFlow是由香港大学与Adobe联合开发的图像生成模型，支持在像素空间中直接生成高质量图像。其基于流匹配技术和多尺度生成策略，实现从低分辨率到高分辨率的逐步生成，有效降低计算成本。该模型在类别条件图像生成和文本到图像生成任务中表现优异，具备强大的语义理解和视觉表达能力。此外，PixelFlow采用端到端训练方式，支持多种ODE求解器，适用于艺术设计、内容创作、教育研究等多个领域。

AI项目与工具 2025年06月11日 100 点赞 0 评论 483 浏览

响指HaiSnap

HaiSnap是一款零代码AI应用开发平台，支持可视化操作和多模型调用，涵盖文本生成、图像识别等功能。用户可快速搭建并部署应用至云端，同时享受任务管理、小工具和小游戏等辅助功能，适用于教育、企业及个人场景，提升开发效率与用户体验。

AI项目与工具 2025年06月11日 98 点赞 0 评论 691 浏览

MiniMax MCP Server

MiniMax MCP Server 是一款基于 MCP 协议的多模态生成服务器，支持视频、图像、语音及声音克隆等功能。其具备高分辨率输出、自然语音生成与声音克隆能力，兼容多种主流客户端。平台采用客户端-服务器架构，结合 RAG 技术提升响应准确性，适用于教学、游戏开发、内容创作等多个领域。

AI项目与工具 2025年06月11日 14 点赞 0 评论 901 浏览

Seaweed

Seaweed-7B 是一款由字节跳动开发的视频生成模型，拥有约 70 亿参数，支持从文本、图像或音频生成高质量视频。具备文本到视频、图像到视频、音频驱动生成、长镜头、连贯叙事、实时生成等功能，适用于内容创作、教育、广告等多个领域。采用变分自编码器和扩散变换器技术，结合多阶段训练与优化策略，提升生成效率与质量，兼顾性能与成本效益。

AI项目与工具 2025年06月11日 80 点赞 0 评论 660 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期