图像 - 智狐AI导航

MedGemma

MedGemma是谷歌推出的开源AI模型，专注于医疗图像与文本分析。它包含4B参数的多模态模型和27B参数的纯文本模型。4B模型擅长解读医疗图像并生成诊断报告，27B模型则用于医疗文本理解与临床推理。支持本地运行或通过Google Cloud部署，适用于医疗诊断、患者分诊、临床决策辅助等场景，提升医疗服务效率与准确性。

AI项目与工具 2025年06月11日 81 点赞 0 评论 555 浏览

YOLO

腾讯AI实验室开发的一个实时目标检测工具，它能够自动识别和定位图像中的各种对象

Ai开源项目 2025年06月05日 47 点赞 0 评论 555 浏览

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架，通过 InfuseNet 注入身份特征，确保生成图像与输入图像的高度相似。结合多阶段训练策略，提升文本与图像对齐、图像质量和美学效果。支持插件化设计，兼容多种工具，适用于社交媒体、影视制作、广告营销等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 555 浏览

GoEnhance

GoEnhance换脸工具是一个100%免费的在线服务，允许用户在视频和图像中进行脸部交换，使用AI技术无缝替换人物脸部。

Ai视频生成 2026年06月24日 0 点赞 0 评论 555 浏览

Cody Former

一个开源的人工智能图像处理工具，Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。

Ai图片处理 2025年06月05日 37 点赞 0 评论 554 浏览

AIEasyPic

利用了如Stable Diffusion、ControlNet和LoRAs等模型，根据您的文本输入生成视觉效果。

Ai绘画生成 2025年06月05日 76 点赞 0 评论 553 浏览

Video Diffusion Models

Video Diffusion Models项目展示了扩散模型在视频生成领域的潜力，通过创新的梯度条件方法和自回归扩展技术，生成了具有高度时间连贯性和质量的视频样本。

Ai绘画生成 2026年06月24日 0 点赞 0 评论 553 浏览

ScholarAI

一个AI驱动的帮助学生完成记笔记、时间管理、学习计划和学术论文写作等任务的平台。它从头开始生成笔记，总结复杂的信息，并将图像中的视觉信息转换为文本。

GPTs应用 2025年06月05日 48 点赞 0 评论 552 浏览

MyTimeMachine

MyTimeMachine是一款基于深度学习的面部年龄转换工具，支持高质量的年龄回退与进展效果，同时保持个体身份特征。它通过适配器网络结合个性化与全局老化特征，能够生成高分辨率、逼真的静态图像及时间一致的视频老化效果。此外，MyTimeMachine在身份保持、外推能力及视频扩展方面具有显著优势，并广泛应用于影视制作、广告、法医学、历史重现及个人娱乐等领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 552 浏览

NeuralCam

NeuralCam是一款基于AI技术的智能相机应用，提供实时摄影指导和多种图像优化功能，包括自动人像、夜间拍摄、AI照明和智能HDR等。适用于低光环境、人像摄影、旅行记录及专业摄影等多种场景，旨在提升用户的拍摄质量和效率。支持免费下载并提供进阶订阅服务。