logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘实战—电商产品评论数据情感分析

文章目录引言一、评论预处理1.评论去重2.数据清洗二、评论分词1.分词、词性标注、去除停用词2.提取含名词的评论3.绘制词云查看分词效果三、构建模型1.评论数据情感倾向分析1.1 匹配情感词1.2 修正情感倾向1.3 查看情感分析效果引言  本文主要针对用户在电商平台上留下的评论数据,对其进行分词、词性标注和去除停用词等文本预处理。基于预处理后的数据进行情感分析,并使用LDA主题模型提取评论关键信

#数据挖掘
python—range() 函数—步长为正,左闭右开;步长为负,左开右闭

  Python3 range() 函数返回的是一个可迭代对象,常与for循环搭配使用。常见如下两种形式:range(stop)range(start, stop[, step])参数:start: 计数从 start 开始。默认是从 0 开始stop: 计数到 stop 结束,但不包括 stopstep:步长,默认为1下面直接叙述步长为正与为负的情况1.步长为正for i in range(1,

#python
数据挖掘实战—航空公司客户价值分析

文章目录引言一、数据探索分析(EDA)1.数据质量分析1.1 缺失值分析1.2 异常值分析1.3 重复数据分析2.数据特征分析2.1 描述性统计分析2.2 分布分析2.2.1 客户基本信息分布分析引言  企业在面向客户制定运营策略与营销策略时,希望针对不同的客户推行不同的策略,实现精准化运营。通过客户分类,对客户群体进行细分,区分出低价值客户与高价值客户,对不同的客户群体开展不同的个性化服务,将有

#数据挖掘#聚类
机器学习—LightGBM的原理、优化以及优缺点

文章目录一、LightGBM简介1. LightGBM提出的动机2.XGBoost的缺点及LightGBM的优化2.1 XGBoost的缺点2.2 LightGBM的优化二、LightGBM的基本原理1、基于Histogram的决策树算法1.1 直方图算法1.2 直方图做差加速2.带深度限制的 Leaf-wise 算法3.单边梯度采样算法4.互斥特征捆绑算法4.1 解决哪些特征应该绑在一起4.2

fig, ax = plt.subplots(figsize = (a, b))解析 与 plt.subplot()函数解析

转载:https://blog.csdn.net/TeFuirnever/article/details/93724227转载:https://blog.csdn.net/TeFuirnever/article/details/89842795文章目录fig, ax = plt.subplots(figsize = (a, b))解析plt.subplot()函数解析fig, ax = plt.s

#matplotlib
TSNE—聚类结果可视化

文章目录一、TSNE参数解析  TSNE的定位是高维数据可视化。对于聚类来说,输入的特征维数是高维的(大于三维),一般难以直接以原特征对聚类结果进行展示。而TSNE提供了一种有效的数据降维模式,是一种非线性降维算法,让我们可以在2维或者3维的空间里展示聚类结果。一、TSNE参数解析  t-SNE是一个可视化高维数据的工具。它将数据点之间的相似性转换为联合概率,并试图最小化低维嵌入数据和高维数据联合

matplotlib—plt.pie绘制饼状图及参数详解

文章目录官网链接import matplotlib.pyplot as pltplt.pie(x, explode=None, labels=None, colors=None, autopct=None, pctdistance=0.6, shadow=False, labeldistance=1.1,startangle=0, radius=1, counterclock=True, wedg

Navicat for MySQL的基本使用

文章目录提要提要  以前学过《Mysql必知必会》,sql语句大致都了解,但还未在Navicat中使用过,本文将介绍Navicat for MySQL中的如下操作:连接mysql连接数据库、新建数据库在数据库中创建表表的增删改查以及sql语句的保存打开Navicat Premium软件,点击连接mysql右击localhost,选择打开链接这里显示的就是我们本地服务器的信息,现在显示的是都有哪些库

#mysql#windows
seaborn—sns.heatmap绘制热力图

  heatmap(热力图)是识别预测变量与目标变量相关性的方法,同时,也是发现变量间是否存在多重共线性的好方法。中文文档seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt='.2g', annot_kws=None,linewidths=0, linec

机器学习—关联规则分析之Apriori算法及其python实现

文章目录引言一、一些概念1.关联规则的一般形式2.最小支持度和最小置信度3.项集4.支持度计数二、Apriori算法:使用候选产生频繁项集1.Apriori的性质2.Apriori算法实现过程3.Apriori算法实现过程实例三.Apriori算法—python实现引言  关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找到各项之间的关联关系,而这种关系并没有在数据中直接体现出来

暂无文章信息