logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

常用数据分析数据集网站

常用数据分析数据集网站

文章图片
#python#大数据
常用数据分析数据集网站

常用数据分析数据集网站

文章图片
#python#大数据
常用数据分析数据集网站

常用数据分析数据集网站

文章图片
#python#大数据
机器学习常用编码方式:标签编码、序列编码、独热编码、频数编码、目标编码

若分类编码与目标遍历间具有一定关联性,则适合使用目标编码,如一个城市的房价与其所处的区域有很大关系,使用目标编码计算同一个区域的平均房价来代替区域属性上的离散值:上海黄埔区的目标编码>上海嘉定区的目标编码。目标编码(Target Encoding):目标编码将离散属性的每个类别编码为其在目标变量上的平均值或其他统计信息。2. 计算不同样本之间的距离有一定的意义,若想要得到更加精确的距离值,需要给定

文章图片
#机器学习#人工智能#python +1
免费算力,助力大数据学习。

资源‌:免费提供 ‌T4/P100/V100 GPU‌(需切换运行时类型),支持 Jupyter Notebook 环境,可挂载 Google Drive 存储数据。资源‌:新用户注册赠送 ‌100 元代金券‌,可免费使用 ‌RTX 3090(66 小时)或 RTX 4090(43 小时)‌ 显卡服务器。优先使用 ‌Google Drive‌(Colab)或 ‌SFTP 工具‌(趋动云、蓝耘)传输

文章图片
#大数据#云计算
机器学习常用编码方式:标签编码、序列编码、独热编码、频数编码、目标编码

若分类编码与目标遍历间具有一定关联性,则适合使用目标编码,如一个城市的房价与其所处的区域有很大关系,使用目标编码计算同一个区域的平均房价来代替区域属性上的离散值:上海黄埔区的目标编码>上海嘉定区的目标编码。目标编码(Target Encoding):目标编码将离散属性的每个类别编码为其在目标变量上的平均值或其他统计信息。2. 计算不同样本之间的距离有一定的意义,若想要得到更加精确的距离值,需要给定

文章图片
#机器学习#人工智能#python +1
机器学习常用编码方式:标签编码、序列编码、独热编码、频数编码、目标编码

若分类编码与目标遍历间具有一定关联性,则适合使用目标编码,如一个城市的房价与其所处的区域有很大关系,使用目标编码计算同一个区域的平均房价来代替区域属性上的离散值:上海黄埔区的目标编码>上海嘉定区的目标编码。目标编码(Target Encoding):目标编码将离散属性的每个类别编码为其在目标变量上的平均值或其他统计信息。2. 计算不同样本之间的距离有一定的意义,若想要得到更加精确的距离值,需要给定

文章图片
#机器学习#人工智能#python +1
《数据分析方法论和业务实战》读后总结

当用户被吸引来后,并不是所有的用户都会转化成活跃用户,如果用户获得AHa时刻,即从产品发现了价值,就会顺利转化成活跃用户,而且较容易转化成黏性较高的忠诚用户。主要测试方面有上报的时机、上报的事件,以及变量的取值是否完整、准确。不同用户的钱数不同,每一个用户砍掉的钱数值都是崭新的,这更是创造的奥义。已砍XX元是用户在任务进程中已知的要素,但最终任务结束最终能够砍掉多少元,是未知的,对于未知的好奇心驱

文章图片
#数据分析#数据挖掘
到底了