深度学习 - 智狐AI导航

3FS

3FS是DeepSeek推出的高性能分布式文件系统，专为AI训练和推理优化。采用SSD与RDMA技术，提供高达6.6 TiB/s的读取吞吐量，支持强一致性及通用文件接口。具备数据准备、加载、检查点和KVCache缓存功能，适用于大规模AI应用。在GraySort测试中表现优异，吞吐量达3.66 TiB/min，KVCache读取峰值达40 GiB/s，适用于多节点计算环境。

AI项目与工具 2025年06月12日 74 点赞 0 评论 791 浏览

Surya

Surya是一款开源OCR工具包，专注于文档识别，支持90多种语言的文本提取与分析。它能够识别文档中的文本、表格、图片及标题等布局元素，并确保文本阅读顺序的准确性。凭借其高效的表格识别能力和优化的算法，Surya在处理复杂文档时表现出色，广泛应用于文档数字化、数据提取、多语言处理以及学术研究等领域。 ---

AI项目与工具 2025年06月12日 16 点赞 0 评论 791 浏览

UnZipLoRA

UnZipLoRA是一种由伊利诺伊大学厄巴纳-香槟分校研发的图像处理技术，能够将图像内容与风格分离，并分别以两个LoRA模型表示。该技术通过提示分离、列分离和块分离策略，有效解决内容与风格纠缠的问题，支持高效训练和兼容性组合。可用于艺术创作、图像编辑、风格迁移及个性化图像生成等场景，提升图像处理的灵活性和可控性。

AI项目与工具 2025年06月12日 81 点赞 0 评论 789 浏览

MangaNinja

MangaNinja是一款基于参考图像的线稿上色工具，采用Reference U-Net和Denoising U-Net架构，结合补丁重排模块与点驱动控制方案，实现高精度、细粒度的上色效果。其可处理复杂场景、多参考图像协调及极端姿势等问题，广泛应用于漫画创作、插画设计、平面设计和数字艺术等领域。

AI项目与工具 2025年06月12日 66 点赞 0 评论 785 浏览

SketchGPT

SketchGPT 是一种基于AI技术可以从草图生成逼真产品图像的工具。这是一项免费且易于使用的服务，允许任何人使用 AI 创建他们梦想中的产品。

Ai图片处理 2025年06月05日 39 点赞 0 评论 784 浏览

AVD2

AVD2是由多所高校联合开发的自动驾驶事故视频理解框架，通过生成高质量事故视频并结合自然语言描述与推理，提升对复杂事故场景的理解能力。其功能涵盖事故视频生成、原因分析、预防建议及数据集增强，支持自动驾驶系统的安全优化与研究。基于先进模型如Open-Sora 1.2和ADAPT，AVD2在多项评估中表现优异，为自动驾驶安全提供了重要技术支撑。

AI项目与工具 2025年06月12日 62 点赞 0 评论 783 浏览

PaddleOCR 2.9

PaddleOCR 2.9 是一个基于深度学习的开源 OCR 工具库，提供了强大的文本识别、版面分析和信息抽取功能。支持多语言识别和多种硬件平台，通过低代码开发模式简化了模型的部署和定制，广泛应用于文档数字化、智能办公、身份验证、物流管理和金融服务等领域。

AI项目与工具 2025年06月12日 56 点赞 0 评论 782 浏览

Luvvoice

Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台，提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件，将文本快速转换为自然语音，适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能，生成的音频文件支持 MP3 格式下载。

AI项目与工具 2025年06月12日 33 点赞 0 评论 781 浏览

ViTPose

ViTPose 是一种基于 Transformer 架构的人体姿态估计模型，通过图像块处理和特征提取实现关键点定位。提供多种版本，适用于不同任务需求。模型结构简洁，支持灵活扩展和参数调整，具备知识迁移能力。ViTPose+ 拓展至动物姿态估计，提升适用范围。在多个数据集上达到 SOTA 性能，广泛应用于运动分析、虚拟现实等领域。

AI项目与工具 2025年06月12日 28 点赞 0 评论 781 浏览

AuraFusion360

AuraFusion360是一款面向360°无边界场景修复的AI工具，采用高斯散射表示和深度感知技术，实现高质量的物体移除与孔洞填充。其核心包括自适应引导深度扩散（AGDD）和基于SDEdit的细节增强，确保多视角一致性。适用于虚拟现实、建筑可视化、影视特效及文物修复等多个领域，提供高效、精确的场景修复解决方案。

AI项目与工具 2025年06月12日 57 点赞 0 评论 780 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期

3FS