图像 - 智狐AI导航

DiffSplat

DiffSplat是一款高效的3D生成工具，能够根据文本或图像快速生成高质量的3D高斯点云。它基于预训练的文本到图像扩散模型，结合2D先验知识和3D渲染损失机制，确保生成内容在多视角下保持一致。支持文本、图像或组合输入，具备可控生成能力，适用于3D内容创作、图像重建及多种下游应用。

AI项目与工具 2025年06月12日 72 点赞 0 评论 823 浏览

Outrank

Outrank 是一款基于 AI 的 SEO 内容生成与管理工具，具备自动化关键词研究、文章生成、内容发布及性能分析等功能。它支持多语言内容创作，可与主流平台和工具集成，适用于企业、营销团队和内容创作者，帮助提升网站流量与搜索排名。

AI项目与工具 2025年06月12日 70 点赞 0 评论 576 浏览

JoggAI

JoggAI是一款基于AI技术的头像生成工具，可根据文本描述创建个性化的写实或卡通风格头像，并支持动态表情与动作。用户可通过简单操作自定义面部特征、服装、背景等细节，适用于社交媒体、数字营销、游戏开发及教育等多个领域，具备高度灵活性与易用性。

AI项目与工具 2025年06月12日 53 点赞 0 评论 725 浏览

MILS

MILS是由Meta AI开发的一种无需额外训练即可为大型语言模型（LLM）提供多模态能力的框架。它通过多步推理、评分反馈和迭代优化，实现图像、视频、音频等多模态内容的生成与理解。MILS支持零样本描述生成、风格迁移、跨模态推理等任务，适用于内容生成、多模态检索、视觉问答等多个场景，具备高效、灵活和无需训练的优势。

AI项目与工具 2025年06月12日 31 点赞 0 评论 580 浏览

OCRmyPDF

OCRmyPDF 是一款开源的命令行工具，用于将扫描 PDF 转换为可搜索、可编辑的文档。基于 Tesseract OCR 引擎，支持 100 多种语言，具备图像优化、纠偏、清洁等功能，提升识别准确率。支持多核处理与批量操作，适合高效处理大量文件，且完全离线运行，保障数据安全。

AI项目与工具 2025年06月12日 39 点赞 0 评论 548 浏览

MnnLlmApp

MnnLlmApp 是阿里巴巴基于 MNN-LLM 框架开发的开源 Android 应用，支持多种大语言模型在本地运行。具备多模态交互能力，可处理文本、图像、音频等多种输入输出任务。应用经过 CPU 推理优化，运行效率高，支持离线使用，保障数据安全。内置 Qwen、Gemma、Llama 等主流模型，适用于内容创作、智能助手、语言学习及创意设计等多种场景。

AI项目与工具 2025年06月12日 60 点赞 0 评论 769 浏览

DynamicFace

DynamicFace是由小红书团队开发的视频换脸技术，结合扩散模型与时间注意力机制，基于3D面部先验知识实现高质量、一致性的换脸效果。通过四种精细的面部条件分解和身份注入模块，确保换脸后的人脸在不同表情和姿态下保持一致性。该技术适用于视频与图像换脸，广泛应用于影视制作、虚拟现实、社交媒体等内容创作领域，具备高分辨率生成能力和良好的时间连贯性。

AI项目与工具 2025年06月12日 84 点赞 0 评论 545 浏览

Chatbox AI

Chatbox AI是一款开源跨平台AI助手，支持多语言模型集成与本地部署，提供图像生成、代码辅助、文档交互等功能。用户可自由定制并参与社区开发，确保数据安全与隐私保护，适用于办公、学习、开发等多种场景，提升工作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 816 浏览

LOOK

LOOK是一款面向时尚设计师的AI设计工具，通过AIGC技术实现设计概念的实时可视化。支持草图转图像、批量生产、文生图、图生图及模特试穿等功能，提高设计效率与创意表达。集成多种工具，简化设计流程，适用于教育、创意开发、产品设计等多个场景。

AI项目与工具 2025年06月12日 73 点赞 0 评论 635 浏览

FluxSR

FluxSR是一种基于单步扩散模型的图像超分辨率工具，由多所高校与研究机构联合开发。它通过流轨迹蒸馏技术，将多步模型压缩为单步模型，实现高效且高质量的图像增强。采用TV-LPIPS感知损失和注意力多样化损失，有效提升图像细节并减少伪影。适用于老照片修复、影视制作、医学影像增强等多个领域，具备高性能与低计算成本优势。

AI项目与工具 2025年06月12日 24 点赞 0 评论 577 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期