图像 - 智狐AI导航

Whisk

Whisk是一款基于AI的图像生成工具，由谷歌推出，支持用户通过上传图像并指定主题、场景和风格生成新图像。它具备多图像输入、自动图像提示及额外文字细节添加等功能，基于谷歌最新的Imagen 3模型，适用于艺术创作、广告营销、社交媒体内容生产等多个领域，助力用户高效完成创意设计。

AI项目与工具 2025年06月12日 31 点赞 0 评论 794 浏览

Megrez

Megrez-3B-Omni是一款具备全模态理解能力的开源模型，支持图像、音频和文本的综合处理，具备强大的推理效率和多模态交互功能。它能够在多个权威测试集中展现卓越性能，尤其擅长场景理解、OCR识别及语言生成等任务，同时通过智能WebSearch调用增强问题解答能力，适用于个人助理、智能家居、车载系统等多种应用场景。

AI项目与工具 2025年06月12日 25 点赞 0 评论 969 浏览

SnapGen

SnapGen是一款由Snap Inc、香港科技大学和墨尔本大学联合开发的文本到图像扩散模型，专为移动设备设计，支持在1.4秒内生成1024×1024像素的高分辨率图像。它通过优化网络架构、跨架构知识蒸馏和对抗性训练等技术，在保持小模型规模的同时，提供了高质量的图像生成能力，适用于社交媒体、移动应用、教育、新闻等多个领域。

AI项目与工具 2025年06月12日 75 点赞 0 评论 647 浏览

k1 视觉思考模型

K1视觉思考模型是一款基于强化学习的AI工具，支持端到端图像理解和思维链技术，适用于数学、物理、化学等基础科学领域。该模型可直接处理图像信息并生成推理思维链，具有优秀的字符识别能力和跨学科问题解决能力，广泛应用于教育、科研、艺术等领域。

AI项目与工具 2025年06月12日 65 点赞 0 评论 807 浏览

BYLO AI

BYLO AI是一款基于AI技术的图像生成工具，支持文本转图像的快速转换，提供高级自定义选项和灵活的图像设置。用户可以通过简单的文本描述生成高质量的图像，适用于社交媒体内容创作、广告设计、平面设计、艺术创作及游戏概念设计等多个领域。该工具以其高效的生成速度、多样的风格选择和高分辨率输出受到广泛好评。

AI项目与工具 2025年06月12日 55 点赞 0 评论 585 浏览

Pika 2.0

Pika 2.0是一款由Pika Labs开发的AI视频生成工具，具备强大的文本对齐、动作渲染及场景元素整合功能。它能将详细提示转化为连贯且富有想象力的视频剪辑，同时提供自然的动作效果和可信的奇幻物理表现。此外，Pika 2.0支持用户上传和定制化场景元素，通过先进的图像识别技术实现无缝集成，为创作者提供更精细的控制权。这款工具适用于媒体娱乐、电商、教育、工业、医疗和个人创作等多个领域。

AI项目与工具 2025年06月12日 18 点赞 0 评论 570 浏览