深度学习 - 智狐AI导航

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库，提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台，通过低代码开发模式简化了模型的部署和定制，广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

AI项目与工具 2025年06月12日 56 点赞 0 评论 782 浏览

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架，通过生成高质量事故视频并结合自然语言描述与推理，提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强，支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT，AVD2在多项评估中表现优异，为自动驾驶安全提供了重要技术支撑。

AI项目与工具 2025年06月12日 62 点赞 0 评论 783 浏览

SketchGPT

SketchGPT 是一种基于AI技术可以从草图生成逼真产品图像的工具。这是一项免费且易于使用的服务，允许任何人使用 AI 创建他们梦想中的产品。

Ai图片处理 2025年06月05日 39 点赞 0 评论 784 浏览

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具，采用Reference U-Net和Denoising U-Net架构，结合补丁重排模块与点驱动控制方案，实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题，广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 785 浏览

UnZipLoRA

UnZipLoRA是一种由伊利诺伊大学厄巴纳-香槟分校研发的图像处理技术，能够将图像内容与风格分离，并分别以两个LoRA模型表示。该技术通过提示分离、列分离和块分离策略，有效解决内容与风格纠缠的问题，支持高效训练和兼容性组合。可用于艺术创作、图像编辑、风格迁移及个性化图像生成等场景，提升图像处理的灵活性和可控性。

AI项目与工具 2025年06月12日 81 点赞 0 评论 789 浏览

DAMODEL

DAMODEL是一个基于GPU算力的AI开发云平台，支持多种主流AI框架和高性能GPU配置，提供开箱即用的开发环境和便捷的数据管理功能。平台具备可视化操作界面、JupyterLab在线访问及多种预置模型，适用于大模型训练、深度学习、数据科学和图像处理等多种应用场景。

AI项目与工具 2025年06月11日 19 点赞 0 评论 791 浏览

3FS

3FS是DeepSeek推出的高性能分布式文件系统，专为AI训练和推理优化。采用SSD与RDMA技术，提供高达6.6 TiB/s的读取吞吐量，支持强一致性及通用文件接口。具备数据准备、加载、检查点和KVCache缓存功能，适用于大规模AI应用。在GraySort测试中表现优异，吞吐量达3.66 TiB/min，KVCache读取峰值达40 GiB/s，适用于多节点计算环境。

AI项目与工具 2025年06月12日 74 点赞 0 评论 791 浏览

Surya

Surya是一款开源OCR工具包，专注于文档识别，支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素，并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法，Surya在处理复杂文档时表现出色，广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---

AI项目与工具 2025年06月12日 16 点赞 0 评论 791 浏览

SHMT

SHMT是一种基于自监督学习的高级化妆转移技术，由阿里巴巴达摩院与武汉理工大学联合研发。该技术无需成对训练数据，可将多种化妆风格自然迁移到目标面部图像上，通过“解耦-重建”策略和迭代双重对齐模块，实现高精度的纹理控制与对齐校正。适用于图像处理、虚拟试妆、影视设计等多个领域，具有高效、灵活、高质量的特点。

AI项目与工具 2025年06月12日 32 点赞 0 评论 792 浏览

VeoGo AI

VeoGo AI 是一款基于深度学习的短视频流量预测工具，可提前分析视频表现并提供优化建议，帮助创作者提升曝光与点击率。支持多平台算法适配，涵盖内容结构、画面构图、剪辑节奏、BGM选择等全方位优化指导，预测准确率超92%，适用于短视频创作与效率提升场景。

AI项目与工具 2025年06月11日 33 点赞 0 评论 796 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期