
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Tabular Learning 系列02
SERSAL架构是这样的,其实分为了四个板块。先把数据喂给LLM(Zero-Shot),LLM反馈一个概率值或者置信区间,这些概率值称之为noisy soft labels,让小模型从这些noisy soft labels进行学习、品质把控后再次把小模型反馈的标签回馈给大模型迭代微调;循环迭代,最终把测试数据放入学生模型,收获预测标签。1、小模型怎么从大模型给出的noisy soft labels

Tabular Learning 系列02
SERSAL架构是这样的,其实分为了四个板块。先把数据喂给LLM(Zero-Shot),LLM反馈一个概率值或者置信区间,这些概率值称之为noisy soft labels,让小模型从这些noisy soft labels进行学习、品质把控后再次把小模型反馈的标签回馈给大模型迭代微调;循环迭代,最终把测试数据放入学生模型,收获预测标签。1、小模型怎么从大模型给出的noisy soft labels

到底了