Granite 3.1是由IBM开发的最新一代语言模型,以其卓越的性能和强大的上下文处理能力著称。该模型家族包含四种尺寸及两种架构:密集型2B和8B参数模型,经过总计12万亿tokens的训练;以及专家混合MoE模型,包括1B和3B激活参数的稀疏模型,共使用10万亿tokens进行训练。Granite 3.1支持高达128K tokens的上下文长度,能够高效处理复杂文本与任务。此外,该版本引入了全新的嵌入模型,支持12种语言,显著增强了多语言支持能力。同时,Granite Guardian 3.1还具备功能调用幻觉检测功能,提升了对工具调用的可控性和透明度。
发表评论 取消回复