图像 - 智狐AI导航

Megrez

Megrez-3B-Omni是一款具备全模态理解能力的开源模型，支持图像、音频和文本的综合处理，具备强大的推理效率和多模态交互功能。它能够在多个权威测试集中展现卓越性能，尤其擅长场景理解、OCR识别及语言生成等任务，同时通过智能WebSearch调用增强问题解答能力，适用于个人助理、智能家居、车载系统等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 967 浏览

Piece it Together

Piece it Together 是一款基于AI的图像生成工具，能够将零散的视觉元素整合成完整概念图像，并智能补全缺失部分。依托IP+空间和IP-Prior模型，支持语义编辑与文本控制，提升图像生成的准确性和多样性。适用于角色设计、产品开发、艺术创作等多个领域，助力创意探索与设计验证。

AI项目与工具 2025年06月12日 41 点赞 0 评论 960 浏览

Follow

Follow-Your-Click是一款由腾讯、清华大学和香港科技大学合作开发的图像到视频生成模型。它允许用户通过简单的点击和动作提示将静态图像转化为包含局部动画效果的动态视频。主要功能包括直观的用户界面、局部动画生成、多对象处理、简短动作提示、高质量视频生成及运动速度控制。其工作原理涉及用户交互、图像分割、第一帧遮罩策略、运动增强模块和基于光流的运动幅度控制。

AI项目与工具 2024年01月01日 17 点赞 0 评论 959 浏览

Star

Star-3 Alpha是一款基于F.1架构的图像生成大模型，擅长处理复杂提示词，生成高质量、真实感强的图像。具备出色的美学捕捉能力和丰富的参数调节选项，适用于艺术创作、广告设计、电商展示等多种场景，极大提升了相关行业的设计效率与成果质量。

AI项目与工具 2025年06月12日 19 点赞 0 评论 958 浏览

123Colorize

一款在线黑白照片上色软件，123Colorize可以通过添加真实的颜色将旧的黑白照片变得生动而丰富。

调色配色 2025年06月05日 89 点赞 0 评论 954 浏览

Moondream

Moondream是一款小型的开源人工智能视觉语言模型，具有强大的图像处理能力和灵活性，能够在不同设备上运行。它基于Apache 2.0许可证，支持商业使用，并广泛应用于安全监控、无人机和机器人技术以及零售与购物领域。

AI项目与工具 2024年01月01日 84 点赞 0 评论 954 浏览

GigaTok

GigaTok 是一款基于语义正则化的高参数视觉分词器，支持自回归图像生成，具备优异的图像重建与生成能力。通过一维架构和非对称扩展策略，实现高效计算与稳定训练。适用于图像生成、编辑、数据增强及多模态应用，具有广泛的技术拓展性。

AI项目与工具 2025年06月11日 74 点赞 0 评论 946 浏览

CogVideoX v1.5

CogVideoX v1.5是一款由智谱研发的开源AI视频生成工具，具备文本到视频生成、图像到视频转换等功能，支持高清视频输出及音效匹配。它通过三维变分自编码器（3D VAE）、Transformer架构等技术手段，提升了视频生成的质量与效率，适用于内容创作、广告营销、教育培训等多个领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 935 浏览

AuraFlow

AuraFlow v0.1是一款由Fal团队开发的开源AI文生图模型，拥有6.8B参数量。该模型通过优化的MMDiT架构提升了计算效率和可扩展性。AuraFlow在生成精确图像方面表现出色，特别是在物体空间构成和色彩表现上具有优势。此外，它采用了最大更新参数化技术，增强了学习率迁移的稳定性。AuraFlow支持文本到图像的生成，适用于艺术创作、媒体内容生成、游戏开发及广告和营销等多种应用场景。

AI项目与工具 2025年06月12日 35 点赞 0 评论 934 浏览

ARC实验室

ARC实验室，即腾讯ARC Lab，是腾讯PCG下属的一个研究中心，专注于探索和挑战智能媒体相关的前沿技术。该实验室被称为腾讯PCG的“侦察兵”和“特种兵”，代表着其在探索智能媒体技术领...

创作工具 2026年06月23日 0 点赞 0 评论 928 浏览

图像

首页

图像

列表

默认

浏览次数

发布日期