图像 - 智狐AI导航

Ideogram AI

Ideogram AI通过其在线应用程序ideogram.ai，允许用户通过文字提示以多种艺术风格生成图像。

Ai绘画生成 2025年06月05日 22 点赞 0 评论 815 浏览

OpenAI o3

OpenAI o3是一款具备图像推理能力的AI模型，融合了神经符号学习与概率逻辑，支持多模态任务处理。它能够自主调用工具解决复杂问题，擅长编程、数学、科学等领域，同时在安全性方面进行了显著优化。o3在多基准测试中表现优异，提供透明的推理路径和高效的多任务处理能力。

AI项目与工具 2025年06月12日 85 点赞 0 评论 814 浏览

Chatbox AI

Chatbox AI是一款开源跨平台AI助手，支持多语言模型集成与本地部署，提供图像生成、代码辅助、文档交互等功能。用户可自由定制并参与社区开发，确保数据安全与隐私保护，适用于办公、学习、开发等多种场景，提升工作效率与创意表达。

AI项目与工具 2025年06月12日 66 点赞 0 评论 814 浏览

MM1.5

MM1.5是苹果公司研发的多模态大型语言模型，具备强大的文本与图像理解能力，包括视觉指代、定位及多图像推理功能。它通过数据驱动的训练方法，实现了从1B到30B参数规模的性能提升，并推出了视频和移动UI专用版本，为多模态AI技术发展提供重要参考。主要应用场景涵盖图像与视频理解、视觉搜索、辅助驾驶、智能助手及教育领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 814 浏览

百度AI搜

百度AI搜是一款基于文心大模型构建的桌面端AI搜索引擎，融合了百度多领域的资源与技术，提供智能创作、画图修图、AI阅读及精选智能体等功能。它支持文档阅读、图片处理、代码助手以及法律咨询等多样化应用，适用于学习、工作和生活中的多种场景，助力用户高效获取信息与创造价值。

AI项目与工具 2025年06月12日 56 点赞 0 评论 813 浏览

CogView

CogView-3-Plus是智谱AI研发的AI文生图模型，采用Transformer架构替代传统的UNet，优化了扩散模型中的噪声规划。它能够根据用户指令生成高质量、高美学评分的图像，支持多种分辨率，并具有实时生成图像的能力。该模型已被集成到“智谱清言”APP中，并提供API服务，适用于艺术创作、游戏设计、广告制作等多个图像生成领域。

AI项目与工具 2025年06月12日 64 点赞 0 评论 813 浏览

ICEdit

ICEdit是由浙江大学与哈佛大学联合开发的指令式图像编辑框架，基于扩散变换器实现自然语言驱动的图像修改。支持多轮编辑、风格转换、对象替换等功能，具有高效处理能力（单张图像约9秒）。采用LoRA-MoE混合微调策略，降低资源需求，适用于创意设计、影视制作、社交媒体等多个领域。开源且提供在线体验，便于研究与应用。

AI项目与工具 2025年06月11日 85 点赞 0 评论 812 浏览

Click2Mask

Click2Mask 是一种创新的图像编辑工具，通过点击操作实现局部内容的高效编辑。它采用动态遮罩生成技术，并结合混合潜在扩散（BLD）模型及基于 CLIP 的语义损失，使用户无需复杂操作即可完成图像编辑。该工具支持局部内容添加、自由形式编辑等功能，适用于数字艺术创作、照片编辑、社交媒体内容制作及广告设计等场景。

AI项目与工具 2025年06月12日 83 点赞 0 评论 812 浏览

Amazon Bedrock

Amazon Bedrock是一款由AWS推出的完全托管型AI服务平台，集成了多家顶级AI公司的基础模型，支持企业通过单一API访问高性能模型。它提供了从基础模型接入、微调到代理构建的一系列功能，包括检索增强生成（RAG）、自动推理检查及多Agent协作等特性。此外，其模型蒸馏技术能够有效提升效率并降低运行成本，广泛适用于文本生成、虚拟助手、图像生成等多种应用场景。

AI项目与工具 2025年06月12日 88 点赞 0 评论 812 浏览

Boow

Boow-VTON是一种基于先进图像生成技术和数据增强方法的虚拟试衣技术，无需精确遮罩即可实现高质量试穿效果。该工具通过试穿定位损失和注意力机制，精准识别试穿区域并确保服装自然贴合人体，支持多服装试穿且操作简便。其应用场景包括在线购物、时尚零售、个性化推荐、社交媒体互动及服装设计等多个领域，具有广泛的商业应用价值。

AI项目与工具 2025年06月12日 49 点赞 0 评论 812 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期