
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
SigmoidSigmoidSigmoid# 初始化权重和偏置# 梯度下降。

如果模型能够在测试集上有不错的预测效果,我们就“简单粗暴”的认为模型可以在真实的未来获取的未知数据集上有不错的表现。据此,我们称模型在训练集上误差称为训练误差,在测试集上的误差称为泛化误差,不过毕竟在测试集上进行测试还只是模拟演习,我们采用模型的泛化能力来描述模型在未知数据上的判别能力,当然泛化能力无法准确衡量(未知的数据还未到来,到来的数据都变成了已知数据),我们只能通过模型在训练集和测试集上的

未完待续。

从单层到多层是神经网络发展史上的重大变化,层的增加彻底将神经网络的性能提升到了另一个高度,正确理解层的意义对于我们自主构建神经网络有很重要的作用,学会利用层是避免浪费计算资源以及提升神经网络效果的关键。

集成学习不是一个单独的机器学习算法,而是通过在数据上构建多个模型,集成所有模型的建模结果,基本上现在的所有机器学习都能看到集成学习的身影。

未完待续。

在构建完模型后,通过一下几种步骤进行模型优化训练过程。

使用encoder-only的模型主要的思路是通过编码器,将大量文本、时序数据等资料进行编码、压缩,达到进一步抽象理解输入数据的能力。encoder-only更加侧重于对信息的压缩与分类,在对输入内容进行扩展的情况下效果不佳。相比较而言,decoder-only需要的计算资源更少,能够更快学习和训练得到最终的模型。使用decoder-only的模型主要是通过解码器,对已输入的信息进行解码衍生。基于

决策树是一个预测模型,它代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表某个可能的属性值,而每个叶节点则对应从根节点到该叶节点所经历的路径所表示的对象的值。

在许多分类算法应用中,特征和标签之间的关系并非是决定性的。比如说,我们想预测一个人究竟是否会在泰坦尼克号海难中生存下来,那我们可以建一棵决策树来学习我们的训练集。在训练中,其中一个人的特征为:30岁,男,普通舱,他最后在泰坦尼克号海难中去世了。当我们测试的时候,我们发现有另一个人的特征也为:30岁,男,普通舱。基于在训练集中的学习,我们的决策树必然会给这个人打上标签:去世。然而这个人的真实情况一定








