logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习1

更大的权重赋予了模型更强的 拟合训练数据 的潜力,但通常这会损害其 泛化到新数据 的能力。正则化的作用正是为了进行这种权衡:· 它承认大权重有更强的拟合能力。· 但它通过惩罚大权重,主动约束模型的这种能力,防止其滥用。· 它强迫模型用更“保守”的方式去拟合数据,优先学习那些稳健的、显著的模式,而不是去记忆噪声。最终,我们得到的模型可能训练误差不是绝对最低的,但它的测试误差(泛化误差)会远低于那个过

#机器学习#人工智能
minimind

将复制的内容粘贴到终端,将复制内容中的README.md替换为预训练数据集的名字(可直接复制粘贴,圈出的两个都可以,强烈建议用pretrain_t2t_mini.jsonl,否则后面还要改东西或者重新下,这里用了第一个pretrain_t2t.jsonl,数据量大些,会比较慢),然后修改保存路径,将./dir修改为../dataset/,也就是放在了与script同级的dataset目录下。改一下

到底了