语言模型 - 智狐AI导航

GTA

GTA是一项由上海交通大学与上海AI实验室合作研发的基准测试，专注于评估大型语言模型在真实世界环境中的工具调用能力。它包含229个精心设计的问题，涉及多个领域，并通过多模态输入输出和细粒度评估指标，全面衡量模型的工具使用效率与准确性。GTA可应用于智能助理开发、多模态交互、自动化客户服务、教育及科研等多个领域，助力提升人工智能系统的综合性能。

AI项目与工具 2025年06月12日 20 点赞 0 评论 833 浏览

CAMPHOR

CAMPHOR是一款由苹果团队研发的端侧小型语言模型多智能体框架，通过在设备本地处理用户输入并进行个人上下文推理，实现了高效的隐私保护与快速响应。其分层架构包含高阶推理智能体和多个专家智能体，能够分解复杂任务、与设备工具交互并生成动态执行计划。此外，通过参数共享和提示压缩技术，大幅降低了模型资源需求。

AI项目与工具 2025年06月12日 34 点赞 0 评论 832 浏览

ReasonGraph

ReasonGraph 是一个开源平台，用于可视化和分析大语言模型（LLM）的推理过程。它支持多种主流模型和推理方法，提供直观的图表展示和交互式功能，帮助用户理解 AI 思考逻辑、优化模型表现。模块化设计使其易于扩展，适用于学术研究、教育、开发等多个领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 829 浏览

提示精灵小富贵

一个旨在简化并增强为AI模型创建和优化提示词（Prompts）过程的开源项目，会帮你写Prompt提示词的GPTs应用。

GPTs应用 2025年06月05日 27 点赞 0 评论 827 浏览

LLaVA

LLaVA-OneVision是字节跳动开发的开源多模态AI模型，主要功能包括多模态理解、任务迁移、跨场景能力、开源贡献及高性能。该模型采用多模态架构，集成了视觉和语言信息，通过Siglip视觉编码器和Qwen-2语言模型，实现高效特征映射和任务迁移学习。广泛应用于图像和视频分析、内容创作辅助、聊天机器人、教育和培训以及安全监控等领域。

AI项目与工具 2025年06月12日 34 点赞 0 评论 826 浏览

SimpleQA

SimpleQA是OpenAI开发的一个基准测试工具，用于评估大型语言模型在回答简短、事实性问题时的表现。它包含4326个问题，每个问题都有唯一的正确答案，并通过严格的验证流程确保质量。SimpleQA不仅能够测试模型的事实性回答能力，还能衡量其自我认知水平和校准能力，广泛应用于模型开发、学术研究及教育工具等领域。

AI项目与工具 2025年06月12日 93 点赞 0 评论 824 浏览

Consensus

Consensus 是一款基于人工智能技术的学术搜索引擎，整合了大型语言模型和向量搜索技术，能够高效检索和理解超过两亿篇同行评审的科学文献。它具备快速搜索、AI 生成摘要、Consensus Meter 和证据支持答案等功能，有效减少误导信息传播，增强信息可信度。适用于学术研究、文献综述、医学研究、教育等领域，助力用户高效获取科学知识并做出数据驱动型决策。

AI项目与工具 2025年06月12日 60 点赞 0 评论 823 浏览

LocAgent

LocAgent是一款由多所高校联合开发的代码定位工具，通过构建代码库的图结构并结合大语言模型进行多跳推理，帮助开发者快速找到需修改的代码片段。支持多种开发任务，如错误修复、功能添加和性能优化，具备高效的搜索与定位能力，适用于大规模代码维护场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 820 浏览

Voiceflow

Voiceflow 是一款面向非技术用户的无代码对话式 AI 平台，具备直观的拖放界面和强大的自然语言处理能力。它支持复杂对话流程的设计、多渠道部署及团队协作，适用于客户服务自动化、虚拟助手开发、语音交互系统构建等多个领域，为企业和个人提供灵活且高效的解决方案。

AI项目与工具 2025年06月12日 21 点赞 0 评论 820 浏览

Satori

Satori是一款由MIT和哈佛大学等机构联合开发的7B参数大语言模型，专注于提升推理能力。其采用COAT机制和两阶段训练框架，结合强化学习优化模型性能，具备自回归搜索、数学推理、跨领域任务处理以及自我纠错等核心能力。Satori在数学和逻辑推理任务中表现突出，广泛应用于科研、教育、智能客服等多个领域，代码、数据和模型均已开源。

AI项目与工具 2025年06月12日 79 点赞 0 评论 819 浏览

语言模型

首页

语言模型

列表

默认

浏览次数

发布日期

GTA