图像

OpenAI o3

OpenAI o3是一款具备图像推理能力的AI模型,融合了神经符号学习与概率逻辑,支持多模态任务处理。它能够自主调用工具解决复杂问题,擅长编程、数学、科学等领域,同时在安全性方面进行了显著优化。o3在多基准测试中表现优异,提供透明的推理路径和高效的多任务处理能力。

Lucidpic AI

lucidpic 根据一系列预先制定的参数,比如人种、姿势、年龄、性别等来生成人像,输入简单描述,为你生成真实的人像。

Stable Video Diffusion

Stable Video Diffusion是一种先进的生成式人工智能视频模型,将图像转换为视频,从而改变了视频生成领域。

Amazon Bedrock

Amazon Bedrock是一款由AWS推出的完全托管型AI服务平台,集成了多家顶级AI公司的基础模型,支持企业通过单一API访问高性能模型。它提供了从基础模型接入、微调到代理构建的一系列功能,包括检索增强生成(RAG)、自动推理检查及多Agent协作等特性。此外,其模型蒸馏技术能够有效提升效率并降低运行成本,广泛适用于文本生成、虚拟助手、图像生成等多种应用场景。

Stitch

Stitch是谷歌实验室推出的基于生成式AI的工具,能够将简单的英语描述或图像快速转化为用户界面(UI)设计及前端代码。它基于Gemini 2.5 Pro模型的多模态能力,支持文本、图像输入,并能识别图像生成UI组件。Stitch可生成简洁可用的前端代码,支持HTML、CSS和JavaScript,同时与Figma无缝集成,便于团队协作和优化设计。其功能包括文本生成设计、图像生成设计、代码生成与优

LatentLM

LatentLM是一款由微软与清华大学合作开发的多模态生成模型,能够统一处理文本、图像、音频等多种数据类型。它基于变分自编码器(VAE)和因果Transformer架构,支持自回归生成与跨模态信息共享,特别擅长图像生成、多模态语言模型及文本到语音合成等任务,其提出的σ-VAE进一步提升了模型的鲁棒性。

炉米Lumi

炉米Lumi是一款由字节跳动开发的AIGC图像创作平台,主要功能包括模型上传与展示、工作流搭建以及LoRA微调。它为AI爱好者、研究人员和开发者提供了一个协作环境,用于分享和优化AI模型。炉米Lumi支持多种应用场景,如科研、教育、艺术创作、商业应用开发等,具有开放性和高灵活性。 ---

Style AI

Style AI 是一款支持图像、视频生成与编辑的 AI 工具,能够将照片转换为各种艺术风格,如古典绘画或现代数字艺术,同时保留图像核心元素。用户可通过自然语言指令轻松编辑图像,支持无缝合并多张照片,生成集体照或新场景,并能根据文字描述直接生成图像和视频。该工具提供高效、精准的解决方案,适用于艺术创作、创意设计、视频制作、照片编辑及虚拟场景合成等多种场景。

PhotoEditor AI

PhotoEditor.ai 是一款可以快速从图片中移除不想要的对象、文字或人物的AI 图片编辑工具,高效易用。