logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

人工智能 -- Python3 爬虫:超链接 url中含有中文出错及解决办法

Python3 爬虫之超链接 url中含有中文出错及解决办法python3.5 爬虫错误:UnicodeEncodeError: ‘ascii’ codec can’t encode characters这个错误是由于超链接中含有中文引起的,超链接默认是用ascii编码的,所以不能直接出现中文,若要出现中文,解决方法如下:import urllibfrom urllib.reques...

#python#爬虫#人工智能 +1
达梦数据库安装和使用

达梦数据库安装和使用教程

文章图片
#数据库
csdn博客markdown 如何输入上下标(如平方指数等)

csdn博客markdown 如何输入上下标(如平方指数等)输入上标,如:x2,则输入 x^2^输入下标,如:x0,则输入 x~0~

docker常用命令、实操(包含实用配置)

容器云docker,大数据,Linux,python docker常用命令 1. 查找镜像2. 拉取(下载)镜像镜像3. 查看本地所有镜像信息4. 为镜像打标签(起别名)4. 保存(打包)镜像5. 删除镜像1)删除centos7的镜像:2)删除最新版的centos的镜像:方式(1):一个个删方式(2):强制一次性删6. 载入(还原)镜像docker,大数据,Linux,pythondocker常用

文章图片
#docker#容器#linux
大数据Clickhouse(CK)

Clickhouse (CK)Ubuntu下安装python连接clickhouse (CK)需要下载clickhouse-driver驱动。(1)在线安装pip install clickhouse-driver即可。(2)离线安装先到https://pypi.org/project/tzlocal/#files 下载 tzlocal-2.1-py2.py3-none-any.whl (16.2

#大数据
人工智能 -- NLP:文本去掉停用词stopwords

人工智能:文本去掉停用词stopwords为了彻底搞懂本质,写的非常细!(1)准备停用词import pandas as pdimport jieba# 准备停用词stopwords = pd.read_csv("data/stopwords.txt", index_col=False, quoting=3, sep='\t', names=['word'], encoding='u...

#机器学习#人工智能
Ubuntu系统镜像盘ISO:各版本大全、国内网速下载地址(阿里云)

UbuntuUbuntu下载:各版本大全国内网速下载地址(阿里云)阿里云Ubuntu下载:各版本大全国内网速下载地址(阿里云)阿里云ubuntu 各版本国内网速下载地址(阿里云)[https://mirrors.aliyun.com/ubuntu-releases/](ubuntu 各版本国内网速下载地址(阿里云))......

#ubuntu
人工智能 -- python3 爬虫:如何爬取js动态加载的网页数据? ---- 下载PhantomJS软件、安装slenium包

安装slenium报错:WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None)) after connection broken by 'ReadTimeoutError("HTTPSConnectionPool(host='pypi.org', port=443): Read .

#机器学习
人工智能 -- python3 爬虫:如何应对“反爬虫”? ---- 爬虫时Request网站时报错:http.client.RemoteDisconnected

请求网站时报错:http.client.RemoteDisconnected: Remote end closed connection without response原因:服务器限制了部分User-Agent的访问解决方案: 添加User-Agent例:源代码:data = urllib.request.urlopen(url).read().decode("utf-8", "ign...

#机器学习#爬虫#python +1
    共 49 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择