
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
利用selenium访问某网站实现模拟人机交互爬虫
高考刚结束,堂侄面临志愿投递的问题,之前用jsoup模拟抓取过不少网站,但是抓取高考信息网(gkcx.eol.cn)的时候遇到了问题,部分接口返回的内容为密文,查看网站js,应该是采用了PBKDF2加密方式,而且加密方式也挺复杂,走进了死胡同。google查询类似问题,发现了selenium可以用来实现浏览器自动化功能:模拟用户点击,操作浏览器的组件实现翻页等。https...
一步一步跟我学hadoop(1)----hadoop概述和安装配置
这几年云计算大数据很火,借这个东风,今天开始学习apache的分布式计算框架hadoop,希望不要太落后。Apache Hadoop是一个在大型集群的商品硬件上运行的应用程序的框架。Hadoop框架透明的提供了应用程序的可靠性和数据访问的方法。Hadoop实现了Map/Reduce计算模型,每个应用程序被切分成许多碎片化的工作段,每个段可在任何急群众的节点(重复)执行。此外,它还提供了用以在计算节
一步一步跟我学hadoop(1)----hadoop概述和安装配置
这几年云计算大数据很火,借这个东风,今天开始学习apache的分布式计算框架hadoop,希望不要太落后。Apache Hadoop是一个在大型集群的商品硬件上运行的应用程序的框架。Hadoop框架透明的提供了应用程序的可靠性和数据访问的方法。Hadoop实现了Map/Reduce计算模型,每个应用程序被切分成许多碎片化的工作段,每个段可在任何急群众的节点(重复)执行。此外,它还提供了用以在计算节
到底了







