
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
自然语言处理实践(新闻文本分类)-Task2 数据分析
1.准备工作import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom collections import Counterdf = pd.read_csv(r'./data/train_set.csv', sep = '\t')print(df.head())labeltext02 .
零基础入门数据挖掘-Task2 数据分析
1. 学习内容1. 载入各种数据科学及可视化库2. 载入数据3. 数据总览4. 判断和处理缺失值与异常值5. 了解预测值分布6. 了解特征值分布7. 特征分析(包括类别特征和数字特征)8. 生成数据报告2. 载入数据库...
集成学习-Task3 投票法与Bagging
1.基于投票法的集成学习1.1投票与机器学习投票简单来说就是“少数服从多数”,那么这个道理跟机器学习有什么关系呢?我们知道集成学习简单来说就是用多个不同的模型来处理同一个问题,那么对于多个不同的处理结果我们应该如何选取呢?对于一个分类问题来说,如果我们用多个不同的模型来预测,可能会得到多个不同的结果。显然,这里我们就可以用少数服从多数的投票法来决定。我们可以直接将投票结果中出现次数最多的类别当作预
到底了