图像 - 智狐AI导航

InternVL3

InternVL3是上海人工智能实验室推出的多模态大型语言模型，具备文本、图像、视频等多模态数据处理能力。采用原生多模态预训练方法，提升语言与视觉理解效率，并支持工具使用、3D视觉、工业图像分析等复杂任务。模型可通过API部署，适用于智能交互、图像识别、视频分析及客服系统等多种场景。

AI项目与工具 2025年06月11日 68 点赞 0 评论 571 浏览

InstantCharacter

InstantCharacter是由腾讯混元开发的图像生成插件，基于扩散 Transformer 架构，支持角色一致性保持、高保真图像生成及文本可控性。用户可通过输入角色图片和文字描述，生成符合要求的多样化图像。其适用于连环画、影视、游戏等多个领域，具有高效、灵活和高质量的特点。

AI项目与工具 2025年06月11日 94 点赞 0 评论 635 浏览

Image to Music

Image to Music 是一款基于AI的图像转音乐工具，通过分析图像的颜色、形状和纹理等元素，生成多种风格的音乐。用户可直接上传图片并选择模型，快速获得钢琴、吉他、管弦乐等音乐作品。无需注册，无使用限制，适用于音乐创作、广告营销、教育及个性化礼物制作等多种场景，为艺术创作提供新思路。

AI项目与工具 2025年06月11日 80 点赞 0 评论 601 浏览

GigaTok

GigaTok 是一款基于语义正则化的高参数视觉分词器，支持自回归图像生成，具备优异的图像重建与生成能力。通过一维架构和非对称扩展策略，实现高效计算与稳定训练。适用于图像生成、编辑、数据增强及多模态应用，具有广泛的技术拓展性。

AI项目与工具 2025年06月11日 74 点赞 0 评论 949 浏览

ImagePulse

ImagePulse是由魔搭社区推出的开源项目，专注于图像理解和生成模型的数据集支持。它通过将复杂任务拆解为“修改、添加、移除”“风格迁移”“人脸保持”等原子能力，构建专门的数据集，提升模型在特定任务上的性能。项目提供开源脚本，支持数据集的生成与扩展，并结合多种技术资源实现多模型协同，适用于艺术创作、视频制作、产品展示等多个领域。

AI项目与工具 2025年06月11日 71 点赞 0 评论 535 浏览

SimpleAR

SimpleAR是一款由复旦大学与字节跳动联合研发的纯自回归图像生成模型，采用简洁架构实现高质量图像生成。其通过“预训练-有监督微调-强化学习”三阶段训练方法，提升文本跟随能力与生成效果。支持文本到图像及多模态融合生成，兼容加速技术，推理速度快。适用于创意设计、虚拟场景构建、多模态翻译、AR/VR等多个领域。

AI项目与工具 2025年06月11日 76 点赞 0 评论 771 浏览

Markable AI

Markable AI 是一款基于AI技术的电商营销工具，支持图像与视频商品识别，并提供深度链接生成、拼贴图制作、亚马逊集成等功能。适用于创作者进行内容推广、电商营销和数据分析，提升内容转化率与收入。平台兼容多个电商平台，优化推广策略，提高运营效率。

AI项目与工具 2025年06月11日 92 点赞 0 评论 863 浏览

AvatarFX

AvatarFX是由Character.AI开发的AI视频生成工具，通过上传图片和选择语音，可生成角色说话、唱歌和表达情感的动态视频。支持多角色、多轮对话及长视频生成，具备高时间一致性。采用扩散模型与音频条件化技术，确保动作与语音同步。适用于互动故事、虚拟直播、娱乐表演及教育内容创作，提供高效、高质量的视频生成体验。

AI项目与工具 2025年06月11日 12 点赞 0 评论 883 浏览

Hautech.AI

Hautech.AI 是一款基于AI技术的图像生成工具，可将平面产品图自动转换为逼真模特展示图。用户可自定义模特特征、背景和细节，适用于社交媒体、产品目录和广告制作等多种场景，提升内容多样性与市场竞争力，节省拍摄时间和成本。

AI项目与工具 2025年06月11日 72 点赞 0 评论 833 浏览

Eagle 2.5

Eagle 2.5 是一款由英伟达开发的视觉语言模型，专注于长上下文多模态学习，具备处理高分辨率图像和长视频序列的能力。其参数规模为 8B，但性能接近更大模型。采用信息优先采样和渐进式后训练策略，提升模型稳定性与适应性。支持多样任务，适用于视频分析、图像处理、内容创作及教育等多个领域。

AI项目与工具 2025年06月11日 59 点赞 0 评论 503 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期