图像

Cal AI

Cal AI是一款基于AI技术的营养分析工具,通过图像识别技术分析食物的卡路里和营养成分。它支持多样的输入方式,包括拍照、条形码扫描和手动输入,并允许用户修正AI分析结果以提升准确性。Cal AI可生成个性化的饮食计划,适用于体重管理、健康饮食、健身规划及特殊人群如孕妇、哺乳期女性和糖尿病患者的营养需求。

FastVLM

FastVLM是一款高效的视觉语言模型,采用FastViTHD混合视觉编码器,显著提升高分辨率图像处理速度并减少token数量。其在保持高性能的同时,降低了计算成本和模型复杂度。适用于视觉问答、图文匹配、文档理解、图像描述生成等多模态任务,具备良好的实用性和扩展性。

Omni Reference

Omni Reference 是 Midjourney V7 提供的一项图像生成辅助功能,允许用户将特定人物、物体或场景嵌入生成图像中。通过 `--oref` 和 `--ow` 参数,用户可灵活控制参考图像的权重与风格融合程度,提升创作精度与多样性。支持 Web 和 Discord 两种平台操作,适用于角色嵌入、产品展示、场景构建等多种应用场景。

6pen pro

整合最新AI技术,为有深度需求的用户打造更专业的内容创作体验,提供内容库、AI生成器等专业化功能,助您轻松创造令人惊叹的多媒体内容。

DreamStudio

DreamStudio AI是由Stability.ai开发的先进生成式人工智能技术驱动的在线创意工具,允许用户生成图像。Stability.ai是全球领先的开源人工智能公司。

PHOTOG

PHOTOG 是一款专业的AI图像生成工具,能够将真实物品无缝嵌入任意场景,提供高精度的真实感和细节表现。其功能涵盖自由模式、精确模式、局部重绘、参数调整、描述语生成及商品库上传等,适用于家居装饰、电子商务、室内设计、房地产及产品营销等多个领域,助力用户高效完成创意设计和预决策。

ZenCtrl

ZenCtrl 是一款基于 AI 技术的图像生成工具,可从单张图像生成多视角、多样化场景,支持实时元素再生。具备高精度控制功能,适用于产品摄影、虚拟试穿、人物肖像控制、插画等场景。提供预处理与后处理能力,提升图像质量,架构模块化,适应多种创意需求。

IterComp

IterComp是一种基于迭代反馈学习机制的文本到图像生成框架,由多所顶尖高校的研究团队联合开发。它通过整合多个开源扩散模型的优势,利用奖励模型和迭代优化策略,显著提升了生成图像的质量和准确性,尤其在多类别对象组合与复杂语义对齐方面表现突出,同时保持较低的计算开销。IterComp适用于艺术创作、游戏开发、广告设计、教育和媒体等多个领域。

HunyuanPortrait

HunyuanPortrait是由腾讯Hunyuan团队联合多所高校推出的基于扩散模型的肖像动画生成工具。它能够根据一张肖像图片和视频片段,生成高度可控且逼真的动画,保持身份一致性并捕捉细微表情变化。该工具在时间一致性和泛化能力方面表现优异,适用于虚拟现实、游戏、人机交互等多个领域。

PhotoDoodle

PhotoDoodle是一种基于少量样本学习的艺术化图像编辑框架,能够精准复现艺术家风格并应用于照片涂鸦。它采用两阶段训练策略,结合位置编码重用和无噪声条件范式,确保生成效果与背景一致。支持装饰元素添加、背景保留、指令驱动编辑等功能,并通过低秩适应技术实现高效风格定制。项目提供高质量数据集和开源资源,适用于数字艺术创作、商业设计、社交媒体等多个场景。