图像

Diffusion Self

Diffusion Self-Distillation (DSD) 是一种基于预训练文本到图像扩散模型的零样本定制图像生成技术,通过自动生成数据集并微调模型,支持文本条件下的图像到图像转换任务。其核心在于利用生成图像网格与视觉语言模型筛选高质量配对数据集,实现无需人工干预的身份保持定制化图像生成。该技术广泛应用于艺术创作、游戏开发、影视制作、广告营销及个性化商品等领域。

Aiuni

[Aiuni是一款利用先进AI技术将2D图像转化为高质量3D模型的在线平台。它支持纹理生成、模型优化、动画添加等功能,适用于数字媒体、游戏开发、影视制作等多个行业。其核心技术包括多视图扩散模型和网格重建算法,能快速生成高保真度的3D模型,并具备强大的细节捕捉能力。]

BuboGPT | 字节大模型

BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。

Caesium.app

一款免费的开源在线图像压缩工具,Caesium支持JPG、PNG等格式的批量处理和预览功能。能将照片压缩至原始大小的90%。

RAG

RAG-Diffusion是一种区域感知型文本到图像生成工具,采用区域硬绑定与区域软细化两阶段策略,实现对图像区域的精确控制与细节优化。该工具支持图像重绘,无需额外内绘模型,且具备免微调特性。其主要应用场景包括数字艺术创作、广告设计、游戏开发及影视制作等领域,能够显著提升工作效率并满足个性化需求。

Aitwo.co

一种人工智能驱动的室内设计辅助工具,可用于设计卧室、客厅、厨房、浴室和餐厅等房间的室内设计。

Pika 2.2

Pika 2.2 是一款基于深度学习的AI视频生成工具,支持文本和图片输入,可生成最高10秒、1080p分辨率的高质量视频。其核心功能包括关键帧过渡技术(Pikaframes)和电影画幅比例支持,提升视频连贯性与专业感。适用于内容创作、广告制作、影视及教育等多个领域,操作简便,适合各类用户快速生成创意视频。

RuoYi AI

RuoYi AI 是一个集成了本地 RAG 方案和多模型支持的全栈式 AI 开发平台,提供高效的代码管理、数据隐私保护和丰富的多媒体功能。支持多种大语言模型接入,具备微信扩展、插件系统和支付接口,适用于企业及个人开发者构建智能应用。

DeepEyes

DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。