图像 - 智狐AI导航

Gemini

Gemini是Google DeepMind推出的全新AI模型，集成了多模态推理功能，超越了以往模型的性能，适用于科学文献洞察、竞争性编程等多种应用场景。

Ai平台模型 2025年06月05日 100 点赞 0 评论 745 浏览

VideoDrafter

一个高质量视频生成的开放式扩散模型，相比之前的生成视频模型，VideoDrafter最大的特点是能在主体不变的基础上，一次性生成多个场景的视频。

Ai开源项目 2025年06月05日 89 点赞 0 评论 747 浏览

TextHarmony

TextHarmony是一款由华东师范大学与字节跳动联合开发的多模态生成模型，擅长视觉与文本信息的生成与理解。该模型基于Slide-LoRA技术，支持视觉文本生成、编辑、理解及感知等功能，广泛应用于文档分析、场景文本识别、视觉问题回答、图像编辑与增强以及信息检索等领域。通过高质量数据集的构建与多模态预训练，TextHarmony在视觉与语言生成任务中表现出色。

AI项目与工具 2025年06月12日 47 点赞 0 评论 748 浏览

Swapper AI

一款用户通过上传产品照片，就可生成逼真的商品和时装模特图的电商助手。

电商运营 2025年06月05日 15 点赞 0 评论 748 浏览

SynthLight

SynthLight是由耶鲁大学与Adobe Research联合开发的基于扩散模型的人像重照明工具，通过物理渲染引擎生成合成数据并结合多任务训练策略，实现高质量的光照效果生成。它能够根据环境光照图重新渲染人像，生成自然的高光、阴影和漫反射效果，并适用于摄影后期、虚拟场景、游戏开发及广告设计等多个领域，具备良好的泛化能力和实用性。

AI项目与工具 2025年06月12日 73 点赞 0 评论 748 浏览