logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

爬虫入门_5:requests模块高级使用及案例实战

模拟登录模拟登录:爬取基于某些用户的用户信息。cookiecookie:用来让服务器端记录客户端的相关状态。手动处理:通过抓包工具获取cookie值,将该值封装到headers中(不建议)自动处理:cookie值的来源在哪里?模拟登录post请求后,由服务器端创建session会话对象:作用:可以进行请求的发送如果请求过程中产生了cookie,则该cookie会被自动存储/携带在该session对

文章图片
#爬虫#python
在windows x64上安装CRFPP并进行地址识别【亲测有效】--python自然语言处理实战

安装CRFPP在百度网盘上下载CRF+±0.58链接:点这里提取码:peub在windows x64上安装,需要在\CRF+±0.58\python\中,运行下面两个语句pythonsetup.py buildpython setup.py install说明:python setup.py install 有可能会遇到权限不足的问题, 需要换成管理员模式安装验证是否安装成功,如果导入后没有报错,

文章图片
#python#自然语言处理
中文分词算法之--最大匹配法

中文分词算法之–最大匹配法​前段时间研究了如何用分词工具进行分词,但是分词中涉及的一些算法,不太了解,所以,准备这段时间专攻分词算法原理,大家有补充,或者建议,欢迎留言。1. 最大匹配法(Maximum Matching)​最大匹配法是指以词典为依据,取词典中最长词长度作为第一次取字数量的长度,在词典中进行扫描。例如:词典中最长词为“中华人民共和国”共7个汉字,则最大匹配起始字数为7...

#自然语言处理#算法
朴素贝叶斯原理【详细介绍,一文看懂】

贝叶斯分类算法是统计学是一种概率分类方法,朴素贝叶斯分类时贝叶斯分类中最简单的一种。利用贝叶斯公式根据某特征的先验概率计算出其后延概率,然后选择具有最大后延概率的类作为该特征所属的类。朴素贝叶斯,称之为“朴素”,是因为整个形式化过程只做了最原始、最简单的假设,具体假设如下:特征之间相互独立每个特征同等重要1. 概率相关先验概率: 比如向女生表白成功的概率是20%,记为P(A)=20%条件概率:在事

#机器学习#python
Pycharm 设置默认文件头

在Pycharm中创建py文件时,希望每次能自动添加默认文件头。打开Pycharm后,按照如下进行设置:File -> settings -> Editor -> File and Code Templates -> Python Script找到Python Script选项,然后将以下内容添加进文本框,点击 ok 即可:# !/usr/bin/env python# -

到底了