图像

RuoYi AI

RuoYi AI 是一个集成了本地 RAG 方案和多模型支持的全栈式 AI 开发平台,提供高效的代码管理、数据隐私保护和丰富的多媒体功能。支持多种大语言模型接入,具备微信扩展、插件系统和支付接口,适用于企业及个人开发者构建智能应用。

TreeBrain AI

一个先进的Ai电商平台,旨在通过为 Shopify、亚马逊和 eBay 等各种市场生成和优化高质量内容来帮助电子商务卖家发展品牌。

幻图AI

幻图AI是一款基于AI技术的免费图像处理工具,支持文生图、图片和视频换脸、换装、头像定制等功能。用户通过简单的操作即可生成高质量的创意图像和视频,广泛应用于社交媒体、电商、广告设计和教育培训等领域,提供高效且个性化的视觉创作体验。

万兴天幕多媒体大模型

一个涵盖了视觉、音频、语言等多模态AI生成和优化能力的多媒体大模型,万兴天幕多媒体大模型核心功能包括一键成片、AI美术设计、文生音乐、音频增强、音效分析、多语言对话等。

3DFY

3DFY是一种人工智能驱动的 3D 生成工具,无需手动创建、输入文本、图像提示即可创建可扩展的高质量3D模型。

PromptDodo

一个通过整合Stable Diffusion、DALL-E 和 Midjourney 等 ai 绘图工具生成AI 图像的提示词网站。

Aya Vision

Aya Vision 是 Cohere 推出的多模态、多语言视觉模型,支持 23 种语言,具备图像描述生成、视觉问答、文本翻译和多语言摘要生成等能力。采用模块化架构与合成标注技术,确保在资源有限条件下仍具高效表现。适用于教育、内容创作、辅助工具开发及多语言交流等多个场景,具有广泛的实用价值。

Frames

Frames是一款由Runway开发的AI图像生成工具,其核心功能在于通过风格控制与高视觉保真度,支持用户生成一致且多样化的高质量图像。该工具可应用于电影、游戏、艺术创作等多个领域,帮助用户探索创意方向并实现精准的设计目标。其主要特点包括风格化图像生成、创意灵活性以及广泛的场景适配能力。

Step-1V

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

LongLLaVA

LongLLaVA是由香港中文大学(深圳)研究团队开发的多模态大型语言模型,结合Mamba和Transformer模块,利用2D池化技术压缩图像token,大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异,特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化,支持多种多模态输入处理,广泛应用于视频分析、医学影像诊断、环境监测等领域。