logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

python爬虫实例之——多线程爬取小说

之前写过一篇爬取小说的博客,但是单线程爬取速度太慢了,之前爬取一部小说花了700多秒,1秒两章的速度有点让人难以接受。所以弄了个多线程的爬虫。这次的思路和之前的不一样,之前是一章一章的爬,每爬一章就写入一章的内容。这次我新增加了一个字典用于存放每章爬取完的内容,最后当每个线程都爬取完之后,再将所有信息写入到文件中。之所以用字典是因为爬完之后需要排序,字典的排序比较方便为了便于比较,这次选择...

#python#爬虫
python爬虫实例之小说爬取器

今天和大家分享一个爬取盗版小说的实例。如今的网络小说可谓是百家齐放各领风骚,玄幻科幻穿越修仙都市…各种套路看得大家是心潮澎湃,笔者曾经也蛮喜欢看小说的,以前经常是拿着一台诺基亚看到深夜,第二天带着黑眼圈去上学。以前看小说都是txt格式的文件,每次都需要拿着在电脑上搜索‘***txt小说免费下载’,往事不堪回首学以致用,为了以后下载小说能够超微显得高端一点,今天就给大家分享一个爬取盗版小说...

#python#爬虫
R语言环境下载及RStudio安装教程

R语言官网:https://www.r-project.org/RStudio官网链接:https://rstudio.com/products/rstudio/download/#downloadR语言环境配置:进入官网后:选择中国科技大学镜像安装适合自己系统的R环境如果是初学的话基础版也可以的:至此,等待下载就OK了????下载完之后,就可以试试自己的第一句R语言了R...

#r语言
python集合的一个小错误AttributeError: 'dict' object has no attribute 'add'

写python的时候,稍不注意就出现了这样一个错误先给大家看看我的错误代码:all_users = {}name = '加入吧'all_users.add(name)然后。。为什么一个集合我就能写错??为什么??我真的一点都不难受????最终发现了两个修改方法方法一:all_users = {''}name = '加入吧'all_users.add(name)在集合中加...

#python
Opencv-python实现的手写数字识别程序

这次实现的数字识别是基于KNN分类算法的一款识别。利用KNN算法我们训练了5000个数字,0~9各500个,将其中前250个作为训练集,后250个作为测试集进行测试得到最终的准确率整个程序的训练数据都来自OpenCV的自带的一张图片digits.png(在文件夹opencv/samples/data/中),这张图片里面就有5000个手写数字,每个数字都是20x20的图像,没有OpenCV的可以..

#python#opencv#计算机视觉
到底了