图像

InfiMM

InfiMM-WebMath-40B是由字节跳动与中国科学院联合推出的大规模多模态数据集,涵盖大量数学和科学内容,包括文本、公式、符号及图像。该数据集通过筛选、清洗和标注优化,可显著提升多模态模型的数学推理能力。它适用于数学题库生成、学习工具开发、论文理解及科学研究等多个应用场景。 ---

Stylar AI

一款强大的图像生成工具,提供用户对图像组合和风格的无与伦比的控制。

Le Chat APP

Le Chat APP是一款由Mistral AI推出的AI对话工具,支持自然语言交互、实时搜索、文档分析与图像生成。提供免费基础版和付费Pro版,支持多语言及移动端使用,适用于学习、旅行规划、创意激发等多种场景。

ELLA

ELLA(Efficient Large Language Model Adapter)是一种由腾讯研究人员开发的方法,旨在提升文本到图像生成模型的语义对齐能力。它通过引入时序感知语义连接器(TSC),动态提取预训练大型语言模型(LLM)中的时序依赖条件,从而提高模型对复杂文本提示的理解能力。ELLA无需重新训练,可以直接应用于预训练的LLM和U-Net模型,且能与现有模型和工具无缝集成,显著提升

RSIDiff

RSIDiff 是一种基于递归自训练的文本到图像生成优化框架,通过高质量提示构建、偏好采样和分布加权机制,提升图像质量和与人类偏好的对齐度,减少训练崩溃风险。它具备自演化能力,降低对大规模数据的依赖,广泛应用于艺术创作、广告设计、VR/AR、游戏开发等领域。

ImageToVideo AI

ImageToVideo AI 是一款基于人工智能的图像转视频工具,能够将静态图片转化为动态视频。通过智能分析图像内容并结合用户输入的文本指令,可添加动画、转场、音乐、字幕等元素,生成高质量、富有表现力的视频。支持多种格式输出,提供丰富的模板和自定义选项,适用于个人创作、内容制作、教育及广告等多种场景,提升视频制作效率与视觉效果。

FLUX Tools

FLUX Tools是一套由黑森林实验室开发的增强型文本到图像模型工具,包含FLUX.1 Fill、FLUX.1 Depth、FLUX.1 Canny和FLUX.1 Redux四个模块,能够通过文本描述和掩码对图像进行精确编辑和扩展,支持图像修复、扩展、结构化引导、混合与再创作等功能。工具基于深度学习和神经网络技术,结合结构引导和文本到图像转换功能,适用于多种应用场景,包括数字艺术创作、游戏开发、

Pixite.Ai

Pixite是一个创新平台,它使用 AI 技术让您从T恤开始设计个性化服装,我们用户友好的界面将指导您选择设计元素、图案、颜色等,从而制作出反映您风格的独特时尚单品。

VectorArt.ai

VectorArt.ai 是一款基于人工智能技术的在线平台,专注于通过文本或草图生成高质量的矢量图像。它支持 SVG 格式,具备无损缩放特性,适用于网页设计、平面印刷等多个场景。主要功能包括文本到图像生成、草图到图像转换、自定义 SVG 创建及多种插画风格选择,同时提供免费图像资源和布局优化工具。

Qihoo

Qihoo-T2X是由360 AI研究院与中山大学联合研发的高效多模态生成模型,基于代理标记化扩散 Transformer(PT-DiT)架构。该模型通过稀疏代理标记注意力机制显著降低计算复杂度,支持文本到图像、视频及多视图生成。具备高效生成能力和多任务适应性,适用于创意设计、视频制作、教育、游戏开发及广告等多个领域。