图像 - 智狐AI导航

Cobra

Cobra是由清华大学、香港中文大学和腾讯ARC实验室联合开发的漫画线稿上色框架，采用因果稀疏注意力机制和局部可复用位置编码技术，实现高精度、高效率的自动上色。支持颜色提示调整，提升灵活性与个性化。适用于漫画、动画、插画等多种场景，具有高效的推理能力和良好的扩展性。项目已开源，包含技术论文与模型资源。

AI项目与工具 2025年06月11日 21 点赞 0 评论 742 浏览

Pixelfox

Pixelfox 是一款基于AI技术的在线图片编辑工具，支持背景移除、AI换脸、图像修复、图片放大等多种功能。用户无需下载软件，直接在浏览器中上传图片即可快速完成编辑。操作简单、处理高效，适用于摄影、电商、社交媒体等多个领域，适合各类图像处理需求。

AI项目与工具 2025年05月06日 63 点赞 0 评论 583 浏览

Omni Reference

Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能，允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数，用户可灵活控制参考图像的权重与风格融合程度，提升创作精度与多样性。支持 Web 和 Discord 两种平台操作，适用于角色嵌入、产品展示、场景构建等多种应用场景。

AI项目与工具 2025年06月11日 48 点赞 0 评论 750 浏览

3DV

3DV-TON是一种基于扩散模型的视频虚拟试穿框架，由阿里巴巴达摩院、湖畔实验室与浙江大学联合研发。该工具通过生成可动画化的纹理化3D网格作为帧级指导，提升试穿视频的视觉质量和时间一致性。其支持复杂服装图案和多样化人体姿态，提供高分辨率基准数据集HR-VVT，适用于在线购物、时尚设计、影视制作等多个领域。

AI项目与工具 2025年06月11日 60 点赞 0 评论 589 浏览

UniTok

UniTok是由字节跳动联合高校研发的统一视觉分词器，支持视觉生成与理解任务。其采用多码本量化技术，将视觉特征分割并独立量化，显著提升离散token的表示能力。在ImageNet上实现78.6%的零样本分类准确率，图像重建质量达0.38。可作为多模态大语言模型的视觉输入模块，广泛应用于图像生成、视觉问答、内容创作及跨模态检索等场景。

AI项目与工具 2025年06月11日 22 点赞 0 评论 482 浏览

攻壳智能体

攻壳智能体是一个整合AI工具与智能体资源的平台，提供精选工具推荐、社区交流和前沿技术追踪等功能。涵盖智能体、AI浏览器、聊天助手、内容生成、数据分析等多个类别，适用于学习、办公、创作等多样化场景，助力用户高效利用人工智能技术。

AI项目与工具 2025年06月11日 85 点赞 0 评论 832 浏览

ICEdit

ICEdit是由浙江大学与哈佛大学联合开发的指令式图像编辑框架，基于扩散变换器实现自然语言驱动的图像修改。支持多轮编辑、风格转换、对象替换等功能，具有高效处理能力（单张图像约9秒）。采用LoRA-MoE混合微调策略，降低资源需求，适用于创意设计、影视制作、社交媒体等多个领域。开源且提供在线体验，便于研究与应用。

AI项目与工具 2025年06月11日 85 点赞 0 评论 812 浏览

FlexiAct

FlexiAct是由清华大学与腾讯ARC实验室联合研发的动作迁移模型，可在空间结构差异较大的场景下实现精准动作迁移，并保持目标主体的外观一致性。其核心模块包括轻量级RefAdapter和频率感知动作提取（FAE），有效提升跨主体动作迁移的灵活性与准确性。该模型适用于影视、游戏、广告等多个领域，具有良好的应用前景。

AI项目与工具 2025年06月11日 39 点赞 0 评论 870 浏览

Insert Anything

Insert Anything是由多所高校联合开发的图像插入框架，支持多种场景下的对象无缝融合，如艺术创作、虚拟试穿和影视特效等。基于大规模数据集训练，具备高分辨率输出与语义一致性保障。用户可通过掩码或文本指令实现精准控制，适用于创意设计与数字内容生成领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 537 浏览

Smart PDFs

Smart PDFs 是一款免费开源的 AI 工具，用于快速提取和总结 PDF 文档的关键信息。它支持学术论文、行业报告和技术文档等多种格式，可在数秒内生成结构清晰的章节式摘要。工具采用 Llama 3.3 模型进行智能处理，并支持图像生成和内容分享功能，适用于学术、职场和个人使用场景。

AI项目与工具 2025年06月11日 61 点赞 0 评论 559 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期