R

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型,基于代理标记化扩散 Transformer(PT-DiT)架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度,支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性,适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。

HART

HART是一种由麻省理工学院研究团队开发的自回归视觉生成模型,能够生成1024×1024像素的高分辨率图像,质量媲美扩散模型。通过混合Tokenizer技术和轻量级残差扩散模块,HART实现了高效的图像生成,并在多个指标上表现出色,包括重构FID、生成FID以及计算效率。

Midjourney 学习导航

坦率说来,线性的教程,并不是学习 Midjourney 最好的方法,可能未来有了 AI 技术后,我能制作一个更牛逼的教程。为了能让不同水平的朋友快速了解和学会 Midjourney ,我特意制作了本学习导航,希望它能帮助你更好地学习。如果你是想教小朋友如何使用孩子是人类的未来,所以如果你有小孩,不妨跟小朋友一起学习 不过很抱歉,因为身边没有可实验的样本,所以可能需要你根据小朋友的情况,对这份导航进

即刻创作

一个免费在线AI图文创作平台,提供强大丰富的图文AI创作能力 , Xdraw图文编辑器、图片格式转换、自由裁剪等多种免费功能 ,快速创作您的作品。

MagicTryOn

MagicTryOn是由浙江大学和vivo等机构开发的视频虚拟试穿框架,采用扩散Transformer(DiT)架构替代传统U-Net,结合全自注意力机制实现视频时空一致性建模。通过粗到细的服装保持策略,整合服装标记与多条件引导,有效保留服装细节。该工具在图像和视频试穿任务中表现优异,适用于在线购物、时尚设计、虚拟试衣间等多种场景。

Fontfabric

一款由国际字体设计公司Fontfabric开发的字体设计软件。它提供了一整套完整的字体设计工具,让用户可以轻松地创建、设计和定制自己的字体。

博思AIPPT

只需输入一句话,博思AIPPT为你自动生成PPT模板、目录、文案、配色、配图百款设计风格任选,零基础也可创作令人惊叹的专业PPT。

卡内基梅隆大学

卡内基梅隆大学(Carnegie Mellon University),简称CMU,是坐落于美国宾夕法尼亚州的匹兹堡的私立大学,“新常春藤”,全球大学校长论坛成员。拥有14,800名在校学生和1,483名教职...

斯坦福大学

斯坦福大学(Stanford University),全名小利兰·斯坦福大学(Leland Stanford Junior University),简称“斯坦福”,位于美国加州旧金山湾区南部帕罗奥多市境内,临近高科技园区硅...

ResAdapter

ResAdapter是一种专为扩散模型设计的分辨率适配器,允许图像生成模型生成任意分辨率和宽高比的图像,同时保持原始风格。其主要功能包括分辨率插值、分辨率外推、域一致性、即插即用设计以及广泛的兼容性。通过在扩散模型中插入ResCLoRA和引入ResENorm,ResAdapter能够在不影响模型风格的情况下扩展其分辨率范围。