图像 - 智狐AI导航

SynCD

SynCD是由卡内基梅隆大学与Meta联合开发的高质量合成训练数据集，用于提升文本到图像模型的定制化能力。它通过生成同一对象在不同视角、光照和背景下的图像，结合共享注意力机制和3D资产引导，确保对象一致性。该数据集支持无调优模型训练，提升图像质量和身份保持能力，广泛应用于个性化内容生成、创意设计、虚拟场景构建等领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 610 浏览

TabTac

TabTac是一款基于AI技术的浏览器，集成了搜索增强、网页浏览优化和办公辅助功能。它支持滑词搜索、图像识别、AI摘要、邮件撰写、语音控制等实用工具，提升信息处理效率。同时具备隐私保护机制，适用于商务、学术及日常多任务场景。

AI项目与工具 2025年06月12日 22 点赞 0 评论 883 浏览

MimicPhoto

MimicPhoto 是一款基于 AI 的图像处理工具，支持面部表情优化、动态视频生成、背景替换及智能补光等功能。用户可轻松调整笑容、眼神等细节，将静态照片转化为生动的动态视频，提升人像质量和视觉表现力，适用于摄影、电商、社交媒体及创意制作等多种场景。

AI项目与工具 2025年06月12日 69 点赞 0 评论 652 浏览

FluxSR

FluxSR是一种基于单步扩散模型的图像超分辨率工具，由多所高校与研究机构联合开发。它通过流轨迹蒸馏技术，将多步模型压缩为单步模型，实现高效且高质量的图像增强。采用TV-LPIPS感知损失和注意力多样化损失，有效提升图像细节并减少伪影。适用于老照片修复、影视制作、医学影像增强等多个领域，具备高性能与低计算成本优势。

AI项目与工具 2025年06月12日 24 点赞 0 评论 577 浏览

LOOK

LOOK是一款面向时尚设计师的AI设计工具，通过AIGC技术实现设计概念的实时可视化。支持草图转图像、批量生产、文生图、图生图及模特试穿等功能，提高设计效率与创意表达。集成多种工具，简化设计流程，适用于教育、创意开发、产品设计等多个场景。

AI项目与工具 2025年06月12日 73 点赞 0 评论 636 浏览

Chatbox AI

Chatbox AI是一款开源跨平台AI助手，支持多语言模型集成与本地部署，提供图像生成、代码辅助、文档交互等功能。用户可自由定制并参与社区开发，确保数据安全与隐私保护，适用于办公、学习、开发等多种场景，提升工作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 818 浏览

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术，结合扩散模型与时间注意力机制，基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块，确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸，广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域，具备高分辨率生成能力和良好的时间连贯性。

AI项目与工具 2025年06月12日 84 点赞 0 评论 547 浏览

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开发的开源 Android 应用，支持多种大语言模型在本地运行。具备多模态交互能力，可处理文本、图像、音频等多种输入输出任务。应用经过 CPU 推理优化，运行效率高，支持离线使用，保障数据安全。内置 Qwen、Gemma、Llama 等主流模型，适用于内容创作、智能助手、语言学习及创意设计等多种场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 770 浏览

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 550 浏览

MILS

MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型（LLM）提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化，实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务，适用于内容生成、多模态检索、视觉问答等多个场景，具备高效、灵活和无需训练的优势。

AI项目与工具 2025年06月12日 31 点赞 0 评论 582 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期