语言模型 - 智狐AI导航

AgentRefine

AgentRefine 是由北京邮电大学与美团联合开发的智能体合成框架，采用“精炼调整”方法提升基于大语言模型的智能体在多样化任务中的泛化能力。它通过轨迹中的观察实现错误纠正与自我优化，增强智能体在复杂环境中的适应性和鲁棒性。该框架支持多样化推理路径，广泛应用于自动化决策、游戏 AI、代码生成及自然语言处理等领域。

AI项目与工具 2025年06月12日 19 点赞 0 评论 742 浏览

ChatGPT的同类软件：11个国内外类似ChatGPT的工具

本文介绍了11款与ChatGPT相似或可作为其替代品的AI聊天工具，包括New Bing、ChatSonic、Jasper Chat、YouChat、Replika、Character AI、对话写作猫、Claude、Poe、百度文心一言和Google Bard。这些工具涵盖了多种功能和特点，如强大的语言理解能力、连续对话、多轮对话、视觉识别、情感陪伴、多样化角色选择等，以满足不同用户的需求。

AI项目与工具 2023年01月01日 37 点赞 0 评论 745 浏览

StreamBridge

StreamBridge是一款由苹果与复旦大学联合开发的端侧视频大语言模型框架，支持实时视频流的理解与交互。通过内存缓冲区和轮次衰减压缩策略，实现长上下文处理与主动响应。项目配套发布Stream-IT数据集，包含60万样本，适用于多种视频理解任务，展现出在视频交互、自动驾驶、智能监控等领域的应用前景。

AI项目与工具 2025年06月11日 41 点赞 0 评论 746 浏览

FastVLM

FastVLM是一款高效的视觉语言模型，采用FastViTHD混合视觉编码器，显著提升高分辨率图像处理速度并减少token数量。其在保持高性能的同时，降低了计算成本和模型复杂度。适用于视觉问答、图文匹配、文档理解、图像描述生成等多模态任务，具备良好的实用性和扩展性。

AI项目与工具 2025年06月11日 85 点赞 0 评论 746 浏览

WhisperKeyboard

WhisperKeyboard 是一款基于 OpenAI Whisper 技术的 AI 语音输入工具，支持多语言实时语音转文字，适用于写作、编程、会议记录等场景。具备离线识别、文本润色、多语言翻译和隐私保护等功能，兼容多平台，提升输入效率与文本质量。

AI项目与工具 2025年06月12日 76 点赞 0 评论 747 浏览

盘古大模型

盘古大模型是华为云推出的全面AI解决方案，覆盖了自然语言处理、计算机视觉、多模态学习、预测分析和科学计算等多个领域。

Ai平台模型 2026年06月23日 0 点赞 0 评论 747 浏览

MATRIX

MATRIX-Gen是一个基于多智能体模拟技术的系统，通过构建虚拟社会生成高质量训练指令数据，用于提升大型语言模型的表现。该工具支持多种应用场景，如软件开发、商业活动、医疗诊断、教育和客户服务，能够显著提高模型在不同领域的性能，并促进其自我进化。

AI项目与工具 2025年06月12日 73 点赞 0 评论 750 浏览

LEOPARD

LEOPARD是一款由腾讯AI Lab开发的视觉语言模型，专为处理包含大量文本的多图像任务而设计。它通过自适应高分辨率多图像编码模块和大规模多模态指令调优数据集，实现对复杂视觉语言任务的高效处理，包括跨图像推理、高分辨率图像处理及动态视觉序列长度优化。LEOPARD在自动化文档理解、教育、商业智能等领域具有广泛应用潜力。

AI项目与工具 2025年06月12日 35 点赞 0 评论 752 浏览

North

North 是 Cohere 推出的企业级 AI 工作平台，提供安全、高效的 AI 解决方案，支持私有云或本地部署。内置 Compass 搜索系统，可处理多种数据类型并支持多语言，提升任务效率。平台集成了高性能语言模型和自动化工具，适用于金融、医疗等行业，可用于风险评估、客户支持、疾病诊断、药物研发等多个场景，增强企业智能化水平。

AI项目与工具 2025年06月12日 60 点赞 0 评论 754 浏览

VLM

VLM-R1 是由 Om AI Lab 开发的视觉语言模型，基于 Qwen2.5-VL 架构，结合强化学习优化技术，具备精准的指代表达理解和多模态处理能力。该模型适用于复杂场景下的视觉分析，支持自然语言指令定位图像目标，并在跨域数据中表现出良好的泛化能力。其应用场景涵盖智能交互、无障碍辅助、自动驾驶、医疗影像分析等多个领域。

AI项目与工具 2025年06月12日 42 点赞 0 评论 754 浏览

语言模型

首页

语言模型

列表

默认

浏览次数

发布日期