图像 - 智狐AI导航

FacePoke

FacePoke是一款基于AI的开源实时面部编辑工具，支持通过简单拖拽操作调整人物头部姿态和面部表情，使静态图像更加生动。其采用深度学习技术，具备高分辨率输出和精确控制能力，适用于数字艺术、内容创作及影视制作等领域。工具基于LivePortrait技术开发，支持本地和Docker部署，便于用户灵活使用。

AI项目与工具 2025年06月12日 86 点赞 0 评论 851 浏览

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 757 浏览

SigStyle

SigStyle是一款由多所高校与Adobe合作开发的签名风格迁移框架，能将单张风格图像的视觉特征（如几何结构、色彩和笔触）精准迁移到目标图像，同时保持内容的语义和结构。其核心技术基于个性化文本到图像扩散模型，结合超网络和时间感知注意力交换技术，实现高效且高质量的风格迁移。支持多种应用场景，如艺术创作、时尚设计、影视制作等，具备灵活性和广泛适用性。

AI项目与工具 2025年06月12日 63 点赞 0 评论 873 浏览

吐司AI换脸

吐司AI换脸是一款基于ComfyUI Workflow的图像处理工具，支持高质量人像换脸。用户只需上传目标图像和参考人脸图像，即可快速生成自然逼真的换脸效果。该工具提供精细化遮罩处理、面部修复、风格统一等功能，并兼容多种模型和版本。适用于影视、广告、艺术创作、社交媒体及游戏开发等多个领域，操作简便，效果出色。

AI项目与工具 2025年06月12日 83 点赞 0 评论 895 浏览

SigLIP 2

SigLIP 2 是 Google DeepMind 开发的多语言视觉-语言模型，具有强大的图像与文本对齐能力。它支持多种语言输入，具备零样本分类、图像-文本检索等功能，并通过 Sigmoid 损失函数和自监督学习技术提升训练效率与模型性能。其支持多种分辨率的变体，适用于文档理解、视觉问答及开放词汇任务。该模型基于 Vision Transformer 架构，具备良好的兼容性。

AI项目与工具 2025年06月12日 94 点赞 0 评论 842 浏览