语言模型 - 智狐AI导航

SlideChat

SlideChat是一款先进的视觉语言助手，专注于处理和分析千兆像素级别的全切片病理图像。它具备强大的多模态对话能力和复杂指令响应能力，在显微镜检查、诊断等领域展现出卓越性能。通过两阶段训练机制，SlideChat实现了视觉与语言特征的有效对齐，并被广泛应用于病理诊断、医学教育、研究开发以及临床决策支持。 ---

AI项目与工具 2025年06月12日 10 点赞 0 评论 818 浏览

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型，结合Whisper编码器与Qwen2 LLM，支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略，提升模型泛化能力和稳定性。基于约5万小时语音数据训练，性能优异，适用于智能客服、教育、心理健康监测等多个领域。

AI项目与工具 2025年06月12日 46 点赞 0 评论 817 浏览

文心大模型X1

文心大模型X1是百度开发的深度思考型AI模型，具备中文知识问答、逻辑推理、文学创作等能力，支持多模态内容生成与工具调用。采用递进式强化学习与端到端训练技术，结合飞桨平台实现高效推理。适用于文学创作、文案生成、学术研究、代码开发等多个领域，提供高性价比的AI服务。

AI项目与工具 2025年06月12日 64 点赞 0 评论 816 浏览

DeepCoder

DeepCoder-14B-Preview 是一款基于 Deepseek-R1-Distilled-Qwen-14B 微调的开源代码生成模型，采用分布式强化学习技术，在 LiveCodeBench 基准上达到 60.6% 准确率。支持多语言代码生成、问题解决、补全优化、测试生成等功能，适用于开发、教育、竞赛等多个场景。项目提供完整训练数据与优化方案，推动 RL 在 LLM 中的应用。

AI项目与工具 2025年06月12日 39 点赞 0 评论 816 浏览

NVILA

NVILA是一款由NVIDIA开发的视觉语言模型，通过“扩展-压缩”策略优化处理高分辨率图像和长视频，兼具效率与准确性。它在图像和视频基准测试中表现优异，支持时间定位、机器人导航和医疗成像等应用场景，并通过参数高效微调和量化技术提升模型性能。未来将在GitHub和HuggingFace平台上开源。

AI项目与工具 2025年06月12日 68 点赞 0 评论 816 浏览

MiniMax 大语言模型

它基于海量中文数据训练而成，拥有超过1000亿个参数，能够处理上百TB的文本数据。

创作工具 2026年06月23日 0 点赞 0 评论 815 浏览

Spirit LM

Spirit LM 是一种由 Meta AI 开发的多模态语言模型，能够处理文本和语音数据，支持跨模态学习。其基础版（BASE）和表达版（EXPRESSIVE）分别侧重于语义理解和情感表达。Spirit LM 可用于自动语音识别（ASR）、文本到语音（TTS）、语音分类及情感分析等任务，在语音助手、语音转写、有声读物等领域具有广泛应用前景。

AI项目与工具 2025年06月12日 40 点赞 0 评论 815 浏览

小虫快读

小虫快读（BugQR）是一款集成OCR技术和AI大语言模型的高效阅读工具，支持拍照识别、文字提取、核心内容总结及语音播放等功能。其三大总结模式（Summary、Explain、Note）满足多样化阅读需求，适用于学生、教师、研究人员、商业分析人士及法律专业人士等多个领域。免费版提供基础功能，高级版本支持内容导出。

AI项目与工具 2025年06月12日 24 点赞 0 评论 812 浏览

HelloBench

HelloBench 是一款开源基准测试工具，专注于评估大型语言模型在长文本生成任务中的表现。它基于布鲁姆分类法设计了五个子任务，并采用 HelloEval 方法实现高效自动化评估。该工具支持多领域应用，包括模型开发、学术研究、产品测试等，同时揭示了现有模型在长文本生成中的局限性。

AI项目与工具 2025年06月12日 93 点赞 0 评论 812 浏览

元象大模型XChat

元象大模型XChat是元象XVERSE推出的高性能AI产品，它通过自研技术，能够满足不同复杂度任务的需求，并在中文领域表现突出。

Ai平台模型 2026年06月23日 0 点赞 0 评论 812 浏览

语言模型

首页

语言模型

列表

默认

浏览次数

发布日期