logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pyspark使用XGboost训练模型实例

pyspark训练Xgboost模型

扩散模型 (Diffusion Model) 简介

Diffusion Models 的灵感来自non-equilibrium thermodynamics (非平衡热力学)。理论首先定义扩散步骤的马尔可夫链,以缓慢地将随机噪声添加到数据中,然后学习逆向扩散过程以从噪声中构造所需的数据样本。与 VAE 或流模型不同,扩散模型是通过固定过程学习,并且隐空间具有比较高的维度。总的来看,Diffusion Models 领域正处于一个百花齐放的状态,这个

文章图片
NLP-使用Word2vec实现文本分类

将文本转化为向量try:continuereturn vec# 这段代码定义了一个函数 average_vec(text),它接受一个包含多个词的列表 text 作为输入,并返回这些词对应词向量的平均值。该函数# 首先初始化一个形状为 (1, 100) 的全零 numpy 数组来表示平均向量# 然后遍历 text 中的每个词,并尝试从 Word2Vec 模型 w2v 中使用 wv 属性获取其对应的

文章图片
#自然语言处理#word2vec#文本分类模型
人工神经网络ANN建模基础须知

链接文章:机器学习基础须知、神经网络建模实践,其他博文人工神经网络ANN0、感知机:包括输入节点、输出节点两部分,输入节点和输出节点用一个表示权重的值连接。感知机的输出值是计算输入节点的加权和,减去一个偏置项,然后使用一个激活函数将计算结果转化为一个信号值输出。(值的计算表达式上等同于线性SVM和多元线性回归,直观上很好理解。)用数学的形式表达为y=sign(wj*xj +…+w2*...

#神经网络#机器学习
低代码SFT有监督微调Qwen3大模型的实践分享

使用LlaMaFactory零代码SFT微调Qwen3大模型的实践过程

【转】可视化理解决策树

目前无论是机器学习竞赛还是工业界,最流行、应用最广泛的xgboost其实是优化后的GBDT(LightGBM里面的boosting比较经典稳定的也是GBDT哦!),而GBDT的基分类器最常用的就是CART决策树!掌握决策树,对理解之后的GBDT、LightGBM都有大有裨益。可视化的方式理解决策树,对深刻理解这个模型很有帮助。大家最熟知的决策树可视化实现方式是下面这种:dot_data=expor

文章图片
#决策树#机器学习#python
《博弈论与生活》思维导图

前几天看了个综艺《决胜21天》,主要是体现21种博弈论模型的游戏,非常有启发意义。而且博弈论在商业领域、机器学习领域都会有应用,是职场中必须要了解和掌握的一门知识。正好找到了一个有意思的入门点。先入个门,之后再深入系统的学习这个领域。...

pyspark使用xgboost做模型训练

pyspark 使用xgboost模型做训练

spark 分组聚合groupBy()方法实践应用

1、groupBy()分组方法,后面跟agg()聚合方法,按照需要的聚合函数对数据进行分组聚合统计#in pythonfrom pyspark.sql.functions import count,min,max,avg,var_pop,stddev_popdf.select("code", "sku", "gmv").distinct()\.groupBy("code")\.agg(count(

    共 53 条
  • 1
  • 2
  • 3
  • 6
  • 请选择