logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Tabular Learning 系列02

SERSAL架构是这样的,其实分为了四个板块。先把数据喂给LLM(Zero-Shot),LLM反馈一个概率值或者置信区间,这些概率值称之为noisy soft labels,让小模型从这些noisy soft labels进行学习、品质把控后再次把小模型反馈的标签回馈给大模型迭代微调;循环迭代,最终把测试数据放入学生模型,收获预测标签。1、小模型怎么从大模型给出的noisy soft labels

文章图片
#python#深度学习#机器学习 +2
Tabular Learning 系列02

SERSAL架构是这样的,其实分为了四个板块。先把数据喂给LLM(Zero-Shot),LLM反馈一个概率值或者置信区间,这些概率值称之为noisy soft labels,让小模型从这些noisy soft labels进行学习、品质把控后再次把小模型反馈的标签回馈给大模型迭代微调;循环迭代,最终把测试数据放入学生模型,收获预测标签。1、小模型怎么从大模型给出的noisy soft labels

文章图片
#python#深度学习#机器学习 +2
到底了