logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

实战 |利用机器学习实现一个多分类任务

对于机器学习而言,如果你已经大致了解了相关算法的原理、理论推导,你也不是大家口中刚入门的小白了。接下来你需要将自己所学的知识利用起来,最好的方式应该就是独立完成几个项目实战,项目难度入门级即可,因为重点是帮助你了解一个项目的流程,比如缺失值和异常值的处理、特征降维、变量转换等等。Kaggle毋庸置疑是一个很好的平台,里面的泰坦尼克号、房屋价格预测、手写数字都是非常非常经典的入门实战项目,如果你独立

#机器学习#python#分类 +1
Python数据分析实战——口红的分析与推荐——情人节篇

前言明天就是二·一四情人节了,真的是为正在恋爱中的情侣而难过,2020年的情人节注定是要陪伴自己的家人,莫担心,视频情人节、电话情人节、微信情人节都是不错的选择,好处呢?肯定是省钱、难忘且提醒自己竟然有一个女朋友(男朋友);不得不说,这个情人节对单身狗可能会友好一些,至少朋友圈的平静可以让自己少吃些单身solo20年的苦。每次一到情人节,广大男性同胞却十分担忧,想要讨女朋友欢心的同时又不想将自..

#python#数据分析#数据可视化
实战 |利用机器学习实现一个多分类任务

对于机器学习而言,如果你已经大致了解了相关算法的原理、理论推导,你也不是大家口中刚入门的小白了。接下来你需要将自己所学的知识利用起来,最好的方式应该就是独立完成几个项目实战,项目难度入门级即可,因为重点是帮助你了解一个项目的流程,比如缺失值和异常值的处理、特征降维、变量转换等等。Kaggle毋庸置疑是一个很好的平台,里面的泰坦尼克号、房屋价格预测、手写数字都是非常非常经典的入门实战项目,如果你独立

#机器学习#python#分类 +1
机器学习笔记(一)——KNN针对泰坦尼克号生存记录建模的两种方法

KNN算法原理本篇博客基于《机器学习实战》实现算法原理简要概括,重在代码实现k-近邻算法(kNN)的工作原理是:存在一个样本数据集合,称训练样本集,并且样本集中每个数据都存在标签,即样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似的数据(距离最近)的分类标签。如图,图中绿点的标签是未知的,但...

#机器学习#数据分析#python
机器学习笔记(七)——初识逻辑回归、不同方法推导梯度公式

算法概述逻辑回归(Logistic)虽带有回归二字,但它却是一个经典的二分类算法,它适合处理一些二分类任务,例如疾病检测、垃圾邮件检测、用户点击率以及上文所涉及的正负情感分析等等;首先了解一下何为回归?假设现在有一些数据点,我们利用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合的过程就称作回归。利用逻辑回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。线..

#python#机器学习#逻辑回归
Python实现淘宝爬取——奶粉销售信息爬取及其数据可视化

简介双十一刚过,TB的销售额又创下了新高,我也为2000+亿做出了贡献恰巧买了一袋德运奶粉,味道还不错。我就在想,接触爬虫也有两个多月了,还没有爬过TB这种经典的网站,借着劲头就爬取了一下TB上奶粉的销售信息爬虫在淘宝框搜索奶粉,就会弹出各式各样的奶粉可以爬取的有用信息:价格、销售量、商品名称、店铺、地址淘宝是一个典型用json格式存储信息的网址,通俗讲,json格式就是一层套一层的...

#python#爬虫
Python实现淘宝爬取——奶粉销售信息爬取及其数据可视化

简介双十一刚过,TB的销售额又创下了新高,我也为2000+亿做出了贡献恰巧买了一袋德运奶粉,味道还不错。我就在想,接触爬虫也有两个多月了,还没有爬过TB这种经典的网站,借着劲头就爬取了一下TB上奶粉的销售信息爬虫在淘宝框搜索奶粉,就会弹出各式各样的奶粉可以爬取的有用信息:价格、销售量、商品名称、店铺、地址淘宝是一个典型用json格式存储信息的网址,通俗讲,json格式就是一层套一层的...

#python#爬虫
Python数据分析——世界自杀概况分析

诞生背景2019下半年的韩国娱乐圈是十分灰暗的,50天内崔雪莉、具荷拉、车仁河三位韩国艺人离世,在某种高压下,很多韩国艺人不敢休息,不敢说累,不敢喊痛,渐渐可能会患上抑郁症;据报道,这三位艺人生前都患有抑郁症,而自杀的原因可能也是抑郁症在作祟。除了韩国,邻国日本的自杀概况也是比较堪忧,但近10年内,日本的自杀人数逐年降低,2019年日本的自杀人数为19959人,创下1978年开始统计以来的最低..

#数据分析#python
机器学习入门级实例——针对葡萄酒质量进行建模

数据背景本文数据取至于UCI——欧文大学机器学习数据库,是一个免费且十分好用的数据库,在学习机器学习时会接触一个基础的数据集——鸢尾花,就是欧文大学提供的,本文就是在一个名叫葡萄酒品质的数据集的基础上进行建模附上数据链接:数据集该数据集一个优点就是可以适用于分类和回归两种算法进行不同的建模,但是目的都为了预测葡萄酒的品质本文利用KNN、决策树、随机森林对数据进行建模数据处理库与工具i...

#python#机器学习#决策树 +1
到底了