图像

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架,采用“下一个X预测”和“噪声上下文学习”技术,提升视觉生成的准确性和效率。其支持多种预测单元,具备高性能生成能力,在ImageNet数据集上表现优异,适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具,支持零样本多语言生成,提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器,实现文本与图像的高效交互。实验表明其性能优于现有方法,适用于艺术创作、广告设计、影视制作等多个领域,具备高效、灵活和高质量的生成能力。

AI Comic Factory

AI Comic Factory是一款基于人工智能技术的在线漫画生成平台,用户无需绘画技能即可创作漫画。它提供多样化的风格选择、布局调整、字幕添加等功能,并支持角色一致性维护和图像重绘,适合个人创作、教育、广告及IP开发等多种应用场景。

S2V

S2V-01是MiniMax研发的视频生成模型,基于单图主体参考架构,可快速生成高质量视频。它能精准还原图像中的面部特征,保持角色一致性,并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出,具备电影感镜头效果,适用于短视频、广告、游戏、教育等多种场景,具有高效、稳定和高自由度的特点。

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架,通过 InfuseNet 注入身份特征,确保生成图像与输入图像的高度相似。结合多阶段训练策略,提升文本与图像对齐、图像质量和美学效果。支持插件化设计,兼容多种工具,适用于社交媒体、影视制作、广告营销等多个领域。

Upscale.Media

Upscale.Media,将您的图像放大到2倍或4倍而不失真,轻松增强低质量图像。

Modeli.ai

一个旨在使用AI模型为时尚产品优化和替代传统的拍照流程的AI模特生成工具。

See3D

See3D是一款基于视觉条件技术的3D生成模型,能够通过大规模无标注的互联网视频学习3D先验知识,实现从文本、单视图或稀疏视图到3D内容的高效转化。其核心功能包括3D编辑、高斯渲染及基于稀疏图片的3D重建,支持在物体级与场景级复杂相机轨迹下生成长序列视图。此外,See3D还适用于游戏开发、建筑设计、电商展示、AR/VR等多个领域的创新应用。

AIEasyPic

利用了如Stable Diffusion、ControlNet和LoRAs等模型,根据您的文本输入生成视觉效果。

fal

Fal 是一款面向开发者的 AI 工具平台,专注于音频、视频和图像生成与处理。它具备高性能推理引擎、跨平台支持、自然语言处理功能及实时交互式应用支持。通过灵活的按需付费模式,Fal 可广泛应用于创意设计、广告营销、游戏开发、教育培训和电子商务等领域。