深度学习 - 智狐AI导航

CogVideoX

CogVideoX是由智谱AI开发的开源AI视频生成模型，支持英文提示词生成6秒长、每秒8帧、分辨率为720x480的视频。它具备低显存需求、视频参数定制、3D Causal VAE技术和推理与微调功能。该模型采用基于Transformer的架构和3D Causal Variational Autoencoder技术，支持多阶段训练和自动及人工评估，适用于创意视频制作、教育材料、广告、游戏、电影编

AI项目与工具 2025年06月12日 55 点赞 0 评论 520 浏览

ShowMeAI

ShowMeAI知识社区是一个资源丰富、易于访问的平台，适合所有希望深入了解和掌握人工智能技术的人士。

Ai编程建站 2026年06月23日 0 点赞 0 评论 518 浏览

字体家

字体家是一款集字体下载、转换与AI生成于一体的综合性平台，主要功能包括基于深度学习技术的个性化字体生成、多种字体生成方式及字型修改服务。其核心优势在于通过AI技术将少量样本字扩展为完整的中文字体库，同时提供便捷的字体管理和版权保障，广泛适用于平面设计、品牌标识、出版物排版等多个领域。

AI项目与工具 2025年06月12日 79 点赞 0 评论 516 浏览

EasyAI

EasyAI，产品经理的人工智能学习库，用通俗易懂的方式帮助产品经理快速学习人工智能相关知识，让非技术人群也能快速理解人工智能。

Ai学习资源 2025年06月05日 34 点赞 0 评论 515 浏览

WebWalker

WebWalker是阿里巴巴研发的AI工具，用于评估和优化大型语言模型在网页浏览任务中的表现。它通过多智能体框架、垂直探索策略及WebWalkerQA数据集，提升模型处理长上下文和多源信息的能力。支持多语言、多领域和多难度任务，适用于信息检索、数据分析和内容监控等场景，具备良好的适应性和可扩展性。

AI项目与工具 2025年06月12日 22 点赞 0 评论 515 浏览

PhotoPrism

PhotoPrism是一款开源的AI照片管理工具，采用Go语言开发，支持用户在本地服务器上运行，确保数据隐私与安全性。它通过AI技术实现照片的智能分类与搜索，涵盖人物、物体和场景识别，还支持RAW、JPG等多种文件格式，提供面部识别、地理标签及WebDAV同步等功能，适用于个人、家庭、企业和教育机构等多样化需求。

AI项目与工具 2025年06月12日 59 点赞 0 评论 513 浏览

OpenDeepSearch

OpenDeepSearch 是一款开源深度搜索工具，结合语义重排与多源信息整合技术，提升搜索精度与覆盖范围。支持与 Hugging Face SmolAgents 无缝集成，具备语义搜索、多模式处理及可扩展性强等特点，适用于复杂问题解答、实时信息检索及学术研究等场景。

AI项目与工具 2025年06月12日 50 点赞 0 评论 513 浏览

LongLLaVA

LongLLaVA是由香港中文大学（深圳）研究团队开发的多模态大型语言模型，结合Mamba和Transformer模块，利用2D池化技术压缩图像token，大幅提升处理大规模图像数据的效率。该模型在视频理解、高分辨率图像分析及多模态代理任务中表现优异，特别擅长检索、计数和排序任务。其技术亮点包括渐进式训练策略和混合架构优化，支持多种多模态输入处理，广泛应用于视频分析、医学影像诊断、环境监测等领域。

AI项目与工具 2025年06月12日 67 点赞 0 评论 513 浏览

Caricaturer.io

一个在线漫画生成器，使用 AI 和深度学习将你的肖像照片转换为漫画图片。生成有趣的、夸张的自画像，并给肖像照片添加艺术和夸张效果。

Ai图片处理 2025年06月05日 45 点赞 0 评论 510 浏览

VisionFM

VisionFM是一款专为眼科设计的多模态多任务视觉基础模型，通过大规模预训练支持多种眼科成像模态处理，涵盖疾病筛查、诊断、预后预测、表型细分及全身性生物标志物分析等功能。其在疾病诊断上的表现超越了大部分眼科医生，并具备强大的泛化能力和少样本学习能力。

AI项目与工具 2025年06月12日 83 点赞 0 评论 510 浏览

深度学习

首页

深度学习

列表

默认

浏览次数

发布日期