logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习实战(四):逻辑回归

一、概述1、Logistic回归假设现在有一些数据点,我们利用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就称作为回归Logistic回归是分类方法,利用的是Sigmoid函数阈值在[0,1]这个特性。Logistic回归进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。2、sigmoid函数如果我们有合适的参数列向量θ([θ0,θ1,…θ...

使用python解密pdf

1.安装pikepdf包: pip install pikepdf前提:能打开pdf查看可以解除不能复制等功能2. 代码# pdf解密# 1.安装pikepdf包: pip install pikepdfimport pikepdf# opens a PDF with restrictive editing enabled, but that still# allows printing.def

#python#pycharm#django
前端面试基础学习笔记

文章目录1 HTML01 如何理解 HTML 语义化?02 默认情况下,哪些 HTML 标签是块级元素、哪些是内联元素?2 CSS01 盒子模型的宽度如何计算?02 margin 纵向重叠问题03 margin 负值问题04 BFC 理解与应用05 如何实现圣杯布局和双飞翼布局06 手写 clearfix07 flex 实现一个三点的色子08 absolute 和 relative 分别依据什么定

#前端#面试#学习
精通特征工程 —— 2.简单得数字奇特技巧

文章目录1.二值化2.区间量化(分箱)3.对数变换4.特征缩放归一化5.交互特征6.特征选择1.二值化# Echo Nest 品味画像数据集的统计# 使 Million Song 数据集中听歌计数二进制化import pandas as pdf = open(r'data/train_triplets.txt')listen_count = pd.read_csv(f, header=...

机器学习高级算法梳理一 ——集成学习

集成学习文章目录集成学习一、集成学习简介二、BoostingAdaBoost算法梳理三、Bagging四、随机森林五、结合策略六、sklearn实现Adaboost七、应用场景一、集成学习简介1、概念通过构建并结合多个学习器来完成学习任务,即合并多个模型来提升机器学习性能个体学习器:由一个现有的学习算法从训练数据产生,亦称基学习器。2、集成学习方法串行集成方法:串行集成的基本动机是...

机器学习高级算法梳理四 —— LightGBM

文章目录一、lightGBM简介二、LightGBNM起源三、GOSS(基于梯度的单边采样)四、EFB(互斥特征捆绑)五、histogram VSpre-sorted六、leaf-wise VS level-wise七、特征并行和数据并行八、顺序梯度访问九、支持类别特征十、sklearn参数一、lightGBM简介lightGBM包含两个关键点:light即轻量级,GBM 梯度提升机Li...

微信公众平台-测试号网页授权-获取openid方法

1、创建自己的测试号通过 申请链接 微信扫码登录2、测试号管理信息填写(注意仔细一步步对照)1.测试号信息创建登录自己的测试号之后,会自动给你 appID和appsecret,用于后面微信开发的使用2.接口配置信息URL配置信息参考:可以使用本地的也可以使用外网穿透方法https://blog.csdn.net/mys_mys/article/details/123691740https://bl

#java#面试#开发语言
数据挖掘 —— 金融数据(五)

task 5 模型调优使用网格搜索法对5个模型进行调优(调参时采用五折交叉验证的方式),并进行模型评估,记得展示代码的运行结果。GridSearchCV自动调参,输入参数 ==> 输出最优化结果和参数(适用于小数量级)参数说明:(1) estimator:选择使用的分类器,并且传入除需要确定最佳的参数之外的其他参数。每一个分类器都需要一个scoring参数,或者score方法:如e...

数据挖掘 —— 金融数据(二)

特征工程任务二特征衍生特征挑选:分别用IV值和随机森林等进行特征选择……以及你能想到特征工程处理# 导入需要的包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom sklearn.model_selection import train_tes...

数据挖掘 —— 金融数据(四)

task4记录5个模型(逻辑回归、SVM、决策树、随机森林、XGBoost)关于accuracy、precision,recall和F1-score、auc值的评分表格,并画出ROC曲线# 导入库from sklearn.linear_model import LogisticRegressionfrom sklearn.svm import LinearSVCfrom sklearn....

    共 16 条
  • 1
  • 2
  • 请选择