Self-Taught Evaluators是一种创新的模型评估方法,通过自我训练机制提升大型语言模型(LLM)的评估能力,而无需依赖人工标注的数据。该方法从无标注的指令出发,利用迭代式自我改进策略生成对比模型输出,并借助LLM生成推理路径及最终判断。在每轮迭代中,改进后的预测被用于重新训练模型,从而实现性能优化。实验结果显示,采用此方法可显著提高基于Llama3-70B-Instruct模型的评估准确性,从75.4%提升至88.3%,并在多数投票情况下达到88.7%,表现接近甚至超越了使用人工标注数据训练的顶级奖励模型。

评论列表 共有 0 条评论

暂无评论

微信公众账号

微信扫一扫加关注

发表
评论
返回
顶部