图像

Ola

Ola是一款由多机构联合开发的全模态语言模型,支持文本、图像、视频和音频等多种输入形式。通过渐进式模态对齐策略,逐步扩展模型的多模态理解能力,同时采用流式解码技术提升交互体验。其架构融合多种编码器与解码器,结合局部-全局注意力机制,实现高效多模态处理,在多项任务中表现优异。

InstructMove

InstructMove是由东京大学与Adobe合作开发的图像编辑模型,基于视频帧对变化学习如何根据指令进行图像操作。它能够执行非刚性编辑、视角调整和元素重排等任务,同时支持精确的局部编辑。该模型采用真实视频数据训练,提升编辑自然性与真实性,适用于影视、广告、设计等多个领域。其技术基于多模态语言模型和扩散模型,结合掩码和ControlNet等控制机制,实现灵活高效的图像编辑。

LCVD

LCVD是一种由四川大学开发的高保真肖像动画生成框架,支持光照可控的动态视频生成。它通过分离肖像的内在与外在特征,并结合多条件分类器自由引导机制,实现对光照和姿态的精细控制。LCVD在图像质量、视频一致性和光照真实感方面表现突出,适用于虚拟现实、视频会议、影视制作及内容创作等多个领域。

Pixelied

Pixelied是一款基于浏览器的在线图形设计工具,提供丰富的模板库、版权免费的照片与图标资源以及一键背景移除等功能。用户可在线完成图片编辑、格式转换等任务,并利用其强大的AI图像生成技术实现高效创作。产品适用于社交媒体营销、内容创作、品牌推广等多个领域,支持团队协作,满足多样化视觉需求。

去去去

如何在工作中对抗水印?针对文档类图片中的水印,智能AI经过特殊训练与优化,能够更快速准确地识别并去除单个或满屏水印,同时智能修复 模糊图片,让您轻松获得如扫描般清晰的文件...

Kerqu Ai

跨境必备AI工具,一站式内容生成器,Kerqu Ai整合先进AI技术,致力于为跨境电商卖家提供卓越解决方案,助力您提升品牌影响力与销售转化率,告别繁忙的营销日常!

Unique3D

Unique3D是一款由清华大学团队开发的开源框架,专注于单张图像到3D模型的转换。它利用多视图扩散模型和法线扩散模型,结合多级上采样策略和ISOMER算法,能够在短时间内生成高保真度且纹理丰富的3D网格模型。Unique3D能够从单个2D图像生成3D网格模型、多个正交视图图像和法线贴图,并通过多级上采样过程提高图像分辨率,最终实现颜色和几何细节的高度整合。

Ai Drawing Generator

一个免费的在线AI图像生成器,它可以将用户提供的文本描述或者简单涂鸦转化为详细的图像。

Decohere

Decohere是一个AI生成器,专注于利用人工智能技术快速创建高质量的图像和艺术作品。

BlockDance

BlockDance是由复旦大学与字节跳动联合开发的扩散模型加速技术,通过识别结构相似的时空特征(STSS)减少冗余计算,提升推理效率达25%-50%。结合强化学习的BlockDance-Ada模块实现动态资源分配,平衡速度与质量。适用于图像、视频生成及实时应用,支持多种模型,兼顾高效与高质,适用于资源受限环境。