图像 - 智狐AI导航

DAM

DAM-3B是英伟达开发的多模态大语言模型，专用于图像和视频中特定区域的详细描述。支持点、边界框、涂鸦或掩码等方式指定目标区域，生成精准文本描述。其核心技术包括焦点提示与局部视觉骨干网络，有效融合全局与局部特征。DAM-3B-Video版本扩展至视频处理，适用于动态场景。模型基于Transformer架构，支持多模态输入，广泛应用于内容创作、智能交互及无障碍工具等领域。

AI项目与工具 2025年06月11日 56 点赞 0 评论 878 浏览

sCM

sCM是一种由OpenAI开发的基于扩散模型的连续时间一致性模型，通过简化理论框架与优化采样流程，实现了图像生成速度的大幅提升。该模型仅需两步采样即可生成高质量图像，且速度比传统扩散模型快50倍。得益于连续时间框架和多项技术改进，sCM不仅提高了训练稳定性，还提升了生成质量。其应用场景广泛，包括视频生成、3D建模、音频处理及跨媒介内容创作，适用于艺术设计、游戏开发、影视制作等多个行业。

AI项目与工具 2025年06月12日 50 点赞 0 评论 879 浏览

OceanDoc

OceanDoc是科大讯飞推出的AI智能办公工具，基于大语言模型和自然语言处理技术，可自动将文本转化为高质量PPT幻灯片，并提供设计建议、多语言翻译、语音控制、AI图像生成等功能。适用于办公、教育、企业等多种场景，简化演示文稿制作流程，提升效率与专业性。

AI项目与工具 2025年06月11日 44 点赞 0 评论 879 浏览

Edicho

Edicho 是一种基于扩散模型的图像编辑工具，能够在多图像间实现一致性编辑，无需额外训练。其核心技术包括 Corr-Attention 注意力模块和 Corr-CFG 去噪策略，通过显式图像对应关系提升编辑质量与一致性。适用于图像修复、风格转换、内容创作、医学影像增强等场景，具备良好的兼容性与扩展性。

AI项目与工具 2025年06月12日 67 点赞 0 评论 879 浏览

TabTac

TabTac是一款基于AI技术的浏览器，集成了搜索增强、网页浏览优化和办公辅助功能。它支持滑词搜索、图像识别、AI摘要、邮件撰写、语音控制等实用工具，提升信息处理效率。同时具备隐私保护机制，适用于商务、学术及日常多任务场景。

AI项目与工具 2025年06月12日 22 点赞 0 评论 880 浏览

Playground AI 是一款流行的人工智能绘图和图像编辑工具，主要功能包括AI文本到图像生成、创意社区作品分享、提示词智能优化和图像到图像的转换。它提供灵活的创作模式，支持用户上传现有图片或草图生成全新的艺术作品。此外，Playground AI 还提供了一个UGC创作社区，用户可以在其中发现多种风格的图片，并借鉴提示词进行创作。Playground AI 提供了免费版和多个付费版本，以满足

AI项目与工具 2024年01月01日 40 点赞 0 评论 880 浏览

AvatarFX

AvatarFX是由Character.AI开发的AI视频生成工具，通过上传图片和选择语音，可生成角色说话、唱歌和表达情感的动态视频。支持多角色、多轮对话及长视频生成，具备高时间一致性。采用扩散模型与音频条件化技术，确保动作与语音同步。适用于互动故事、虚拟直播、娱乐表演及教育内容创作，提供高效、高质量的视频生成体验。

AI项目与工具 2025年06月11日 12 点赞 0 评论 881 浏览

PhotoKit

PhotoKit 集成了强大的在线照片编辑器

创作工具 2026年06月24日 0 点赞 0 评论 881 浏览

Fotographer AI

Fotographer AI是一款基于AI技术的图像生成工具，能够快速生成专业级产品图像，并提供多样化的广告模特图像。该工具支持文本和模板定制，简化创作流程。此外，它还能即时生成博客、新闻稿等营销材料。试用期免费，同时提供企业级服务选项，包括图像生成和账户管理。

AI项目与工具 2025年06月12日 26 点赞 0 评论 882 浏览

EliGen

EliGen是由浙江大学与阿里巴巴集团联合开发的实体级可控图像生成框架，采用区域注意力机制实现对图像中实体的精确控制，支持多实体修复、风格化生成及交互式编辑。基于50万高质量注释样本训练，具备强大泛化能力，适用于虚拟场景、角色设计、数据合成及产品展示等场景。

AI项目与工具 2025年06月12日 97 点赞 0 评论 882 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期

DAM

sCM