图像处理 - 智狐AI导航

Tesseract

Tesseract是一款开源的光学字符识别（OCR）引擎，支持多语言识别和多种图像格式。其具备高精度的文字识别能力，适用于文档数字化、表格数据提取、发票识别及移动OCR应用等多个场景。支持跨平台运行，并提供丰富的编程接口和自定义训练功能，便于开发者集成和优化识别效果。

AI项目与工具 2025年06月12日 12 点赞 0 评论 725 浏览

Comic Translate

Comic Translate 是一款基于开源框架的漫画翻译工具，支持多语言翻译，涵盖英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语等主流语言。它利用深度学习技术和图像处理库，实现从文本检测、OCR 到翻译渲染的全流程自动化，旨在帮助用户突破语言限制，享受跨文化阅读体验。同时，该工具支持自定义翻译服务，适合个人娱乐、教育学习、翻译本地化及学术研究等多个领域。

AI项目与工具 2025年06月12日 92 点赞 0 评论 726 浏览

Pixel3DMM

Pixel3DMM是由慕尼黑工业大学、伦敦大学学院和Synthesia联合开发的单图像3D人脸重建框架，基于DINOv2模型，能从单张RGB图像中准确重建出3D人脸的几何结构。该工具擅长处理复杂表情和姿态，支持身份和表情的解耦，并通过FLAME模型优化实现高精度重建。其应用场景涵盖影视游戏、VR/AR、社交视频、医疗美容和学术研究。

AI项目与工具 2025年06月11日 88 点赞 0 评论 731 浏览

PaliGemma 2

PaliGemma 2是一款由Google DeepMind研发的视觉语言模型（VLM），结合了SigLIP-So400m视觉编码器与Gemma 2语言模型，支持多种分辨率的图像处理。该模型具备强大的知识迁移能力和出色的学术任务表现，在OCR、音乐乐谱识别以及医学图像报告生成等方面实现了技术突破。它能够处理多模态任务，包括图像字幕生成、视觉推理等，并支持量化和CPU推理以提高计算效率。

AI项目与工具 2025年06月12日 10 点赞 0 评论 737 浏览

Alpaca

Alpaca 是一个强大的 AI 工具，它为艺术家和创意人士提供了一个创新的数字画布。通过其快速迭代、风格生成和非破坏性工作流的特点，Alpaca 能够帮助用户提升创作效率，实现个性化...

创作工具 2026年06月23日 0 点赞 0 评论 738 浏览

FillDream

一款基于人工智能的图像修改工具，允许用户通过输入提示来填充和修改图像。

Ai图片处理 2025年06月05日 77 点赞 0 评论 739 浏览

designtools.ai

DesignTools.ai 是一个集成了多种 AI 技术的专业设计平台，专为 UI 和 UX 设计师量身打造。它提供了包括 UI/UX 工具、配色方案生成、图像处理、排版设计、市场营销工具以及生产力提升工具在内的全面服务。通过这些功能，设计师可以更高效地完成各种设计任务，包括生成高质量的产品图像、创建 3D 模型、制定营销内容以及优化日常工作流程。

AI项目与工具 2025年06月12日 85 点赞 0 评论 742 浏览

SynthLight

SynthLight是由耶鲁大学与Adobe Research联合开发的基于扩散模型的人像重照明工具，通过物理渲染引擎生成合成数据并结合多任务训练策略，实现高质量的光照效果生成。它能够根据环境光照图重新渲染人像，生成自然的高光、阴影和漫反射效果，并适用于摄影后期、虚拟场景、游戏开发及广告设计等多个领域，具备良好的泛化能力和实用性。

AI项目与工具 2025年06月12日 73 点赞 0 评论 747 浏览

MiniCPM

MiniCPM-o 2.6 是一款高性能的多模态大模型，具备 8B 参数量，支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异，采用高效的 token 技术提升推理速度，可在端侧设备上运行。支持多种语言和音色配置，适用于智能助手、内容创作、教育、客服和医疗等多个领域。

AI项目与工具 2025年06月12日 58 点赞 0 评论 748 浏览

TensorPix

TensorPix是一个利用AI技术进行视频和图像处理的在线平台，支持视频放大至4K分辨率、图像增强、在线视频压缩及图像生成等功能。它适用于多种应用场景，如视频聊天录像增强、视频内容创作、旧视频修复以及低帧率视频优化等。TensorPix提供免费及不同级别的付费订阅方案，以满足个人和企业需求。

AI项目与工具 2025年06月12日 62 点赞 0 评论 749 浏览

图像处理

首页

图像处理

列表

默认

浏览次数

发布日期