图像

VanceAI

VanceAI是一款基于AI技术的图像处理工具,提供照片增强、修复、放大、去噪、锐化、上色及卡通化等功能,操作简便且支持批量处理,适用于电商、摄影和设计等领域,有效提升图像质量和视觉表现力。

Pixel Reasoner

Pixel Reasoner是由多所高校联合开发的视觉语言模型,通过像素空间推理增强对视觉信息的理解和分析能力。它支持直接对图像和视频进行操作,如放大区域或选择帧,以捕捉细节。采用两阶段训练方法,结合指令调优和好奇心驱动的强化学习,提升视觉推理性能。在多个基准测试中表现优异,适用于视觉问答、视频理解等任务,广泛应用于科研、教育、工业质检和内容创作等领域。

Stability AI

Stability AI提供了一套完整的生成式AI模型,覆盖图像、视频和音频等多个领域,旨在推动AI技术的普及和应用。

AnyPaint

AnyPaint是一款集成了文本到图像、图像编辑及3D模型生成等功能的AI图像生成工具,支持多种创作需求。其主要功能包括绘画生成、一键AI操作、模型库管理、IP-Adapter插件应用等,能够满足不同用户的创作需求,同时提供本地化工具提升创作效率。

Xinva

Xinva是一款利用人工智能技术快速生成专业设计作品的工具,主要面向需要高效制作T恤、贴纸、图案等设计的用户。它提供了智能模板库、自动布局优化、色彩协调、字体匹配、图像增强等强大功能,并支持多人实时协作和多种文件格式导出。Xinva凭借其简洁的界面和高效的AI辅助功能,成为设计师和创意工作者的得力助手。

3DTown

3DTown是由哥伦比亚大学联合Cybever AI等机构开发的AI工具,能够从单张俯视图生成高精度的3D城镇场景。它采用区域化生成和空间感知3D修复技术,将输入图像分解为重叠区域,分别生成3D内容并修复缺失结构,确保几何和纹理一致性。支持多种风格的场景生成,适用于虚拟世界构建、游戏开发、机器人模拟等领域,优于现有方法。

VideoTuna

VideoTuna是一款基于AI的开源视频生成工具,支持文本到视频、图像到视频以及文本到图像的转换。它提供预训练、微调和后训练对齐等功能,兼容U-Net和DiT架构,并计划引入3D视频生成能力。VideoTuna旨在简化视频内容创作流程,提升生成质量与可控性,适用于内容创作、电影制作、广告营销、教育培训等多个领域。

Remaker AI

一款AI图像生成器、AI换脸器​​和AI图像编辑器。能让用户能够无缝替换图像和视频中的脸部,除此之外,Remaker AI 还拥有对象移除器、图像放大器和各种其他AI工具。

Video Alchemist

Video Alchemist是一款由Snap公司研发的视频生成模型,支持多主体和开放集合的个性化视频生成。它基于Diffusion Transformer模块,通过文本提示和参考图像生成视频内容,无需测试优化。模型引入自动数据构建和图像增强技术,提升主体识别能力。同时,研究团队提出MSRVTT-Personalization基准,用于评估视频个性化效果。该工具适用于短视频创作、动画制作、教育、剧

profile picture Maker

PFPMaker 是一款基于 AI 技术的在线头像制作工具,支持自动去除照片背景,并提供丰富的编辑功能和模板选择。用户可上传照片或使用平台素材,通过裁剪、调色等操作生成个性化头像。支持高清输出,适用于社交媒体、职业平台及通讯工具,且完全免费使用。