简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
解决:七月 04, 2020 7:49:12 下午 org.apache.catalina.startup.VersionLoggerListener log信息: Server.服务器版本:Apache Tomcat/7.0.100七月 04, 2020 7:49:12 下午 org.apache.catalina.startup.VersionLoggerListener log信息: 服务器
1. 什么是json?JSON(JavaScript Object Notation, JS 对象标记) 是一种轻量级的数据交换格式。它基于 ECMAScript (w3c制定的js规范)的一个子集,采用完全独立于编程语言的文本格式来存储和表示数据。简洁和清晰的层次结构使得 JSON 成为理想的数据交换语言。 易于人阅读和编写,同时也易于机器解析和生成,并有效地提升网络传输效率。2. json支持
(1) requests:数据爬取,import requests(2) lxml中的xpath:数据解析,from lxml import etree(3) json:数据存储,import json下面直接上代码:# json + lxml + xpath + requests 爬取 “糗事百科”from lxml import etreeimport requestsimport jsonc
查看源代码:就是别人服务器发送到浏览器的原封不动的代码,也就是最原始的代码。(F12)检查元素:看到的就是最终的html代码。即:源代码 + 网页js渲染 。【注】在源代码中找不到的代码,是在浏览器执行js动态生成的。当我们在爬虫时需要对js在加载的数据进行爬取时,就不能像普通爬虫一样进行获取了,这时通常有两种方法:1. 通过selenum自动化技术2. 通过在页面上进行抓包,获取js链接以及表单