logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python爬虫实战之爬取链家广州房价_04链家的模拟登录(记录)

问题引入开始链家爬虫的时候,了解到需要实现模拟登录,不登录不能爬取三个月之内的数据,目前暂未验证这个说法是否正确,这一小节记录一下利用浏览器(IE11)的开发者工具去分析模拟登录网站(链家)的内部逻辑过程,花了一个周末的时间,部分问题暂未解决。思路介绍利用浏览器(IE11)的开发者工具,启用网络流量捕获,在调试之前,先做一些配置上的准备工作:清除旧的cookie和缓存,禁用跳转后清除日志(Fire

#python#爬虫
快速下载大模型的方法

快速下载大模型的方法

文章图片
#nlp#人工智能
统计学习方法笔记01_泛化误差上界

文章目录Hoeffding 不等式期望损失与经验损失泛化误差上界证明[^1]Hoeffding 不等式第 2 版,设 X1,X2,,⋯ ,XNX_1,X_2,,\cdots,X_NX1​,X2​,,⋯,XN​ 是独立随机变量,且 Xi∈[ai,bi],i=1,2,⋯ ,NX_{i} \in [a_i,b_i],i=1,2,\cdots,NXi​∈[ai​,bi​],i=1,2,⋯,N;Xˉ\bar

#python#机器学习#人工智能
快速下载大模型的方法

快速下载大模型的方法

文章图片
#nlp#人工智能
快速下载大模型的方法

快速下载大模型的方法

文章图片
#nlp#人工智能
快速下载大模型的方法

快速下载大模型的方法

文章图片
#nlp#人工智能
Python数据挖掘与机器学习_通信信用风险评估实战(1)——读数据

案例及数据说明本案例以Data Tech 2017浙江大数据建模与创新应用大赛的模型挑战赛选题三: 通信信用风险评估为例说明。此次比赛还在进行中,开放了浙江移动及相关企业脱敏后的数据,大家都可以拿来练练手。本选题用到的数据包括公共数据集、用户通话数据、违约行为数据。训练集数据:用户通话数据(201703-201706),违约行为数据(201707),公共数据-基本信息(201703-201706

#python
Python数据挖掘与机器学习_通信信用风险评估实战(4)——模型训练与调优

系列目录:Python数据挖掘与机器学习_通信信用风险评估实战(1)——读数据Python数据挖掘与机器学习_通信信用风险评估实战(2)——数据预处理Python数据挖掘与机器学习_通信信用风险评估实战(3)——特征工程训练数据拆分把训练数据拆分为训练集和交叉验证集,比例为7:3。x_train和y_train用来训练模型,x_test和y_test用来交叉验证。data_train = data

#python#数据挖掘#机器学习
Python数据挖掘与机器学习_通信信用风险评估实战(3)——特征工程

系列目录:Python数据挖掘与机器学习_通信信用风险评估实战(1)——读数据Python数据挖掘与机器学习_通信信用风险评估实战(2)——数据预处理有这么一句话在业界广为流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。数据说明数据使用经数据预处理,合并后的宽表train_user_comm_basic。宽表(train_user_comm_basic)的单特征分析与处理遍

#python
Python数据挖掘与机器学习_通信信用风险评估实战(2)——数据预处理

系列目录:Python数据挖掘与机器学习_通信信用风险评估实战(1)——读数据数据说明通过对读取数据的实践,下面是数据集文件对应读取后的DataFrame说明。数据文件DataFrameDataTech_Credit_Train_Communication1.txttrain_commDataTech_Credit_Train_User1train_userD

#python
    共 16 条
  • 1
  • 2
  • 请选择