语言模型 - 智狐AI导航

百聆

百聆是一款开源语音对话系统，融合语音识别、语音活动检测、大语言模型和语音合成技术，实现自然流畅的语音交互。支持低延迟运行，无需GPU，适用于边缘设备。具备记忆、工具调用和任务管理等功能，适用于智能家居、个人助理、车载系统等多种场景，提供高效的语音交互解决方案。

AI项目与工具 2025年06月12日 90 点赞 0 评论 596 浏览

AutoVFX

AutoVFX是一款由伊利诺伊大学香槟分校研发的先进物理特效框架，通过神经场景建模、大型语言模型（LLM）代码生成及物理模拟技术，实现自然语言指令驱动的视频特效编辑与创作。其主要功能涵盖3D场景建模、程序生成、VFX模块、物理模拟、渲染与合成等，适用于电影制作、广告营销、游戏开发、虚拟现实及教育等多个领域。

AI项目与工具 2025年06月12日 85 点赞 0 评论 596 浏览

Whispo

Whispo是一款AI驱动的语音转录工具，支持用户通过快捷键快速录制语音并将其转写为文本，同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景，旨在提升工作效率和用户体验。

AI项目与工具 2025年06月12日 47 点赞 0 评论 595 浏览

SPAR

SPAR是一种自我博弈框架，专为增强大型语言模型的指令遵循能力设计。它通过生成者和完善者的角色互动，利用树搜索技术和迭代优化，提升模型的自我完善能力。实验显示，SPAR在多个基准测试中表现出色，适用于智能助手、客户服务、教育技术及医疗咨询等多个应用场景。

AI项目与工具 2025年06月12日 64 点赞 0 评论 595 浏览

Qwen2

Qwen2是由阿里云通义千问团队开发的大型语言模型系列，涵盖从0.5B到72B的不同规模版本。该系列模型在自然语言理解、代码编写、数学解题及多语言处理方面表现出色，尤其在Qwen2-72B模型上，其性能已超过Meta的Llama-3-70B。Qwen2支持最长128K tokens的上下文长度，并已在Hugging Face和ModelScope平台上开源。 ---

AI项目与工具 2024年01月01日 48 点赞 0 评论 591 浏览

JanusFlow

JanusFlow是一款集成了自回归语言模型与校正流技术的多模态AI模型，能够在单一框架内高效完成图像理解和生成任务。它通过解耦视觉编码器和表示对齐策略，显著提升了模型在视觉理解与图像生成上的表现，广泛应用于图像生成、多模态内容创作、视觉问答、图像理解和辅助设计等多个领域。

AI项目与工具 2025年06月12日 20 点赞 0 评论 591 浏览

HealthBench

HealthBench是OpenAI推出的开源医疗评估工具，用于衡量大型语言模型在医疗保健领域的表现和安全性。它包含5000个由医生设计的多轮对话，涵盖多种健康场景，并通过多维度评分标准评估模型的准确性、沟通质量等。支持按主题和行为维度进行细分分析，帮助开发者识别模型优势与不足，指导优化方向。适用于模型性能评估、安全测试及医疗AI工具选择。

AI项目与工具 2025年06月11日 79 点赞 0 评论 591 浏览

ChatMCP

ChatMCP是一款基于模型上下文协议（MCP）的AI聊天客户端，支持与多种大型语言模型（LLM）交互。它提供自动化安装MCP服务器、SSE传输支持、自动选择服务器及聊天记录管理等功能，并通过MCP服务器市场实现与不同数据源的聊天。用户可配置LLM API密钥和端点，界面友好且功能强大，适用于客户服务、个人助理、教育学习、企业内部沟通及信息检索等多种场景。

AI项目与工具 2025年06月12日 48 点赞 0 评论 589 浏览

PaliGemma 2 mix

PaliGemma 2 Mix 是谷歌 DeepMind 推出的多任务视觉语言模型，支持图像描述、目标检测、OCR、文档理解等功能。模型提供多种参数规模和分辨率选项，适用于不同场景。其基于开源框架开发，易于扩展，可通过简单提示切换任务。适用于科学问题解答、文档分析、电商内容生成等多个领域。

AI项目与工具 2025年06月12日 23 点赞 0 评论 588 浏览

好伴AI

好伴AI是一款基于全科医学大语言模型的智能健康助手，支持24小时在线健康咨询与报告解读，可分析化验单、体检报告并提供个性化建议。具备数字专家分身、健康档案管理、健康预警等功能，支持中英文双语，适用于多种健康场景，帮助用户更好地管理自身健康。

AI项目与工具 2025年06月12日 50 点赞 0 评论 588 浏览

语言模型

首页

语言模型

列表

默认

浏览次数

发布日期

百聆