图像

S2V

S2V-01是MiniMax研发的视频生成模型,基于单图主体参考架构,可快速生成高质量视频。它能精准还原图像中的面部特征,保持角色一致性,并通过文本提示词灵活控制视频内容。支持720p、25fps高清输出,具备电影感镜头效果,适用于短视频、广告、游戏、教育等多种场景,具有高效、稳定和高自由度的特点。

InfiniteYou

InfiniteYou 是由字节跳动推出的基于扩散变换器的身份保持图像生成框架,通过 InfuseNet 注入身份特征,确保生成图像与输入图像的高度相似。结合多阶段训练策略,提升文本与图像对齐、图像质量和美学效果。支持插件化设计,兼容多种工具,适用于社交媒体、影视制作、广告营销等多个领域。

Upscale.Media

Upscale.Media,将您的图像放大到2倍或4倍而不失真,轻松增强低质量图像。

一设MJ咒语解析

免费的Midjourney以图生文工具,只需上传一张图片,一设MJ咒语解析就会生成自带中英文翻译提示词。

MakeAnything

MakeAnything是由新加坡国立大学Show Lab团队开发的多领域程序性序列生成框架,能够根据文本或图像生成高质量的分步教程。它采用扩散变换器和ReCraft模型,支持从文本到过程和从图像到过程的双向生成。覆盖21个领域,包含超24,000个标注序列,具备良好的逻辑连贯性和视觉一致性,适用于教育、艺术、工艺传承及内容创作等多种场景。

xAR

xAR是由字节跳动与约翰·霍普金斯大学联合研发的自回归视觉生成框架,采用“下一个X预测”和“噪声上下文学习”技术,提升视觉生成的准确性和效率。其支持多种预测单元,具备高性能生成能力,在ImageNet数据集上表现优异,适用于艺术创作、虚拟场景生成、老照片修复、视频内容生成及数据增强等多种应用场景。

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具,支持零样本多语言生成,提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器,实现文本与图像的高效交互。实验表明其性能优于现有方法,适用于艺术创作、广告设计、影视制作等多个领域,具备高效、灵活和高质量的生成能力。

AI Comic Factory

AI Comic Factory是一款基于人工智能技术的在线漫画生成平台,用户无需绘画技能即可创作漫画。它提供多样化的风格选择、布局调整、字幕添加等功能,并支持角色一致性维护和图像重绘,适合个人创作、教育、广告及IP开发等多种应用场景。

PixelForce

告别模特、摄影、后期制作、现场租赁,甚至是昂贵设备的限制。利用强大的AI赋能,只需简单几步操作即刻实现商拍自由,随心所欲展示产品价值,省时省力又省钱。

mnml.ai

mnml.ai 是一款面向建筑师和室内设计师的 AI 渲染工具,支持将手绘或数字草图快速转换为高质量渲染图,涵盖多种风格和应用场景。其具备 AI 草图转图像、视频制作、渲染增强、风格迁移等功能,操作简便,适合各类用户使用。同时支持文本提示生成设计,提升工作效率与表现力。