模型 - 智狐AI导航

Magma

Magma是微软研究院开发的多模态AI基础模型，具备理解与执行多模态任务的能力，覆盖数字与物理环境。它融合语言、空间与时间智能，支持从UI导航到机器人操作的复杂任务。基于大规模视觉-语言和动作数据预训练，Magma在零样本和微调设置下表现优异，适用于网页操作、机器人控制、视频理解及智能助手等多个领域。

AI项目与工具 2025年06月12日 100 点赞 0 评论 575 浏览

FluxSR

FluxSR是一种基于单步扩散模型的图像超分辨率工具，由多所高校与研究机构联合开发。它通过流轨迹蒸馏技术，将多步模型压缩为单步模型，实现高效且高质量的图像增强。采用TV-LPIPS感知损失和注意力多样化损失，有效提升图像细节并减少伪影。适用于老照片修复、影视制作、医学影像增强等多个领域，具备高性能与低计算成本优势。

AI项目与工具 2025年06月12日 24 点赞 0 评论 575 浏览

Jina Reader

Jina Reader是一款由Jina AI开发的开源工具，专注于将互联网上的HTML网页内容转换为适合大型语言模型处理的纯文本格式。它支持多种内容格式，具备流模式、JSON模式和Alt生成模式等功能，能够高效提取网页核心内容，去除冗余信息，并通过自然语言处理和动态内容处理技术提升文本质量和理解能力。Jina Reader适用于内容聚合、SEO优化、学术研究及个性化推荐等多个领域。

AI项目与工具 2025年06月12日 52 点赞 0 评论 575 浏览

AutoTrain

AutoTrain是一款由Hugging Face开发的无代码平台，支持用户通过上传数据快速创建和部署定制化的AI模型。它涵盖多种机器学习任务，如文本分类、图像识别及表格数据分析，并提供自动化的数据预处理、分布式训练、超参数优化等功能，适用于自然语言处理、计算机视觉等多个领域。其核心优势在于简化了模型训练流程，使非技术人员也能高效构建高质量模型。 ---

AI项目与工具 2025年06月12日 30 点赞 0 评论 575 浏览

Kimi

Kimi-VL是月之暗面推出的轻量级多模态视觉语言模型，支持图像、视频、文档等多种输入形式。其基于轻量级MoE架构和原生分辨率视觉编码器，具备强大的图像感知、数学推理和OCR能力。在长上下文（128K）和复杂任务中表现优异，尤其在多模态推理和长视频理解方面超越同类模型。适用于智能客服、教育、医疗、内容创作等多个领域。

AI项目与工具 2025年06月11日 30 点赞 0 评论 576 浏览

GPTBiz

GPTBiz代表着在人工智能领域的一次重要创新，它不仅仅是一个产品，而是一个为中国市场量身定制的大语言模型应用平台。随着人工智能技术的迅猛发展，对于能够快速、

AI写作对话 2025年06月05日 92 点赞 0 评论 576 浏览

LangGraph WhatsApp Agent

LangGraph WhatsApp Agent 是一个开源 AI 工具，用于在 WhatsApp 上构建智能代理。支持多代理架构、多模态交互及持久化对话状态，集成多种语言模型，提供安全可靠的通信环境。适用于客户服务、信息推送、教育辅导等多个场景，便于开发者快速构建和部署高效的 WhatsApp 机器人。

AI项目与工具 2025年06月11日 59 点赞 0 评论 576 浏览

JoyCaption

JoyCaption是一款开源图像提示词生成工具，支持多种图像风格和内容类型，具备丰富的生成模式和灵活的提示控制功能。它适用于社交媒体、图像标注、内容创作、视觉辅助及教育等多个场景，能够生成高质量的描述性字幕和提示词，提升图像处理和创作效率。该工具性能优越，且完全免费开放。

AI项目与工具 2025年01月16日 91 点赞 0 评论 576 浏览

RD

RD-Agent 是一款开源的自动化研究与开发工具，基于大语言模型和自主代理框架，专注于提升研发效率与质量。它支持从想法提出到实现的全流程自动化，具备智能决策支持、跨领域知识迁移和数据驱动创新等功能，广泛应用于金融量化、医疗数据分析、科研助理等领域，助力用户快速构建和优化模型。

AI项目与工具 2025年06月12日 93 点赞 0 评论 576 浏览

TheB.AI

一个一体化人工智能平台，通过易于使用的界面或统一的API接口，提供从语言到图像处理的各种尖端模型，可通过用户友好的界面或统一的 API 进行访问。

Ai平台模型 2025年06月05日 32 点赞 0 评论 576 浏览

模型

首页

模型

列表

默认

浏览次数

发布日期