图像
One Shot, One Talk
One Shot, One Talk是一项由中国科学技术大学和香港理工大学研究者开发的图像生成技术,它可以从单张图片生成具有个性化细节的全身动态说话头像。该工具支持逼真的动画效果,包括自然的表情变化和生动的身体动作,同时具备对新姿势和表情的泛化能力。One Shot, One Talk结合了姿势引导的图像到视频扩散模型和3DGS-mesh混合头像表示技术,提供了精确的控制能力和高质量的重建效果。
PaliGemma 2
PaliGemma 2是一款由Google DeepMind研发的视觉语言模型(VLM),结合了SigLIP-So400m视觉编码器与Gemma 2语言模型,支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现,在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务,包括图像字幕生成、视觉推理等,并支持量化和CPU推理以提高计算效率。
photoeditor
PhotoEditor是一款基于人工智能技术的在线图片编辑工具,支持多种格式的照片编辑,具备智能对象移除、自动图像增强、人像修饰、图像放大和多样化编辑工具等功能。凭借其对像素和上下文的精准分析,能够生成自然且高质量的结果,适用于社交媒体内容创作、电子商务产品图片处理、旅游照片优化和个人相册整理等多种应用场景。
---
Luma Photon
Luma Photon是一款由Luma AI开发的先进图像生成工具,具备高分辨率图像生成、自然语言理解及多图像参考等功能,支持个性化和多轮迭代操作。它能显著提升设计师、电影制作人等专业人士的创作效率,广泛应用于影视制作、游戏开发、广告设计等多个领域,同时保持较低的成本投入。