图像

SoulGen

SoulGen是一款基于AI的艺术生成平台,支持文本到图像的转换、图像编辑、边界扩展及相似肖像生成等功能。它适用于个人艺术创作、角色设计、概念艺术、广告设计以及社交媒体内容制作等多个领域,提供灵活高效的创意解决方案。

Step-1V

覆盖了从个人使用到企业级应用的多个方面的多模态大模型。

Dashtoon

Dashtoon是一款基于人工智能技术的漫画创作平台,提供角色生成、背景处理、图像优化等功能,支持从故事板到漫画的全流程自动化操作。它致力于降低创作门槛,提升效率,同时为创作者提供发布与变现渠道,适用于个人娱乐、教育培训、商业营销及专业出版等场景。

Airbrush AI

仅需1次点击即可生成由人工智能提供支持的图像。Airbrush的人工智能技术,让您可以在短短几秒钟内创建原创的库存照片、NFT、艺术作品等。

Story

Story-Adapter是一种无需额外训练的长篇故事可视化框架,通过迭代优化和全局参考交叉注意力模块,提升图像生成的质量与细节表现。该工具适用于多种场景,包括故事创作、教育学习、娱乐游戏、广告营销以及影视制作等,特别适合需要将文字转化为视觉化内容的场合。

UnblurImage

UnblurImage 是一款基于 AI 技术的图像处理工具,可有效去除图片模糊并提升画质。支持多种图片格式,提供去模糊、细节增强和分辨率提升等功能,适用于电商、社交媒体、照片打印及个人用途等多种场景,操作简便且完全免费。

PUMA

PUMA是一款先进的多模态大型语言模型,专注于通过整合多粒度视觉特征提升视觉生成与理解能力。它支持文本到图像生成、图像编辑、条件图像生成及多粒度视觉解码等功能,适用于艺术创作、媒体娱乐、广告营销等多个领域,凭借其强大的多模态预训练和微调技术,成为多模态AI领域的前沿探索。

VMix

VMix是一款提升文本到图像生成美学质量的工具,通过解耦文本内容与美学描述,并引入细粒度美学标签,增强图像在色彩、光线、构图等方面的视觉表现。其核心技术为交叉注意力混合控制模块,可在不改变原有模型结构的情况下注入美学条件,保持图文一致性。VMix兼容多种扩散模型及社区模块,支持多源输入、高质量视频处理、实时直播与远程协作,广泛应用于电视直播、网络直播、现场活动及虚拟演播室等场景。

意画AI

意画AI,是基于AI框架Stable Diffusion大模型能力的AI艺术和创意辅助平台。在这里您可以生成不同风格、独一无二的创意画作,为设计提供灵感、为创作带来更多创意!

PP

PP-DocBee是百度飞桨推出的多模态文档理解模型,基于ViT+MLP+LLM架构,支持文字、表格、图表等多类型文档内容的精准识别与解析。具备高效的推理性能和高质量输出,适用于文档问答、信息提取等场景,支持灵活部署,为文档处理提供智能化解决方案。