ORM - 智狐AI导航

PixWizard

PixWizard是一款基于自然语言指令的多功能图像处理工具，支持图像生成、编辑、翻译、修复等任务。通过基于流的Diffusion Transformer（DiT）模型及结构感知与语义感知指导，PixWizard能够高效处理各种视觉任务，并展现出强大的生成能力和泛化性能。

AI项目与工具 2025年06月12日 78 点赞 0 评论 561 浏览

ResAdapter

ResAdapter是一种专为扩散模型设计的分辨率适配器，允许图像生成模型生成任意分辨率和宽高比的图像，同时保持原始风格。其主要功能包括分辨率插值、分辨率外推、域一致性、即插即用设计以及广泛的兼容性。通过在扩散模型中插入ResCLoRA和引入ResENorm，ResAdapter能够在不影响模型风格的情况下扩展其分辨率范围。

AI项目与工具 2024年01月01日 70 点赞 0 评论 559 浏览

Fluid

Fluid是一种基于连续标记和随机生成顺序的文本到图像生成模型，具有卓越的视觉表现力和全局结构捕捉能力。它通过自回归架构和Transformer模型，逐步预测序列中的下一个元素，构建与文本提示相匹配的高质量图像。Fluid在多个基准测试中取得了优异成绩，并广泛应用于艺术创作、媒体娱乐、广告营销等领域。

AI项目与工具 2025年06月12日 47 点赞 0 评论 555 浏览

Jamba

Jamba是由AI21 Labs开发的基于Mamba架构的生产级别大语言模型，结合了结构化状态空间模型（SSM）和传统Transformer架构，具备高吞吐量和低内存占用的特点。Jamba拥有256K的上下文窗口，适用于处理长文本序列，并且以开放权重的形式发布，遵循Apache 2.0开源许可。该模型主要用于研究领域，未来将推出更安全的版本。

AI项目与工具 2024年01月01日 29 点赞 0 评论 552 浏览

Cody Former

一个开源的人工智能图像处理工具，Cody Former专注于面部修复、图片清晰化以及视频去除马赛克和修复。

Ai图片处理 2025年06月05日 37 点赞 0 评论 549 浏览

FitDiT

FitDiT是一种基于Diffusion Transformers架构的高保真虚拟试穿技术，通过服装纹理提取器和先验演化技术精确捕捉服装细节，同时采用扩张-松弛掩码策略优化尺寸适配。它能在短时间内生成高质量的试穿图像，适用于电子商务、时尚设计、个性化定制以及增强现实等领域，为用户提供逼真的虚拟试穿体验。

AI项目与工具 2025年06月12日 97 点赞 0 评论 547 浏览

Allegro

Allegro 是一款由 Rhymes AI 开发的文本到视频生成工具，可将描述性文本快速转化为高质量的动态视频内容。支持 720p 分辨率、15 FPS 帧率和最长 6 秒的视频输出，具有高时间一致性，适用于内容创作、广告营销、教育培训等多个领域，凭借先进的技术架构和强大的功能，成为视频生成领域的领先解决方案之一。

AI项目与工具 2025年06月12日 41 点赞 0 评论 546 浏览