logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

从数据爬取到决策树建模——预测北京二手房房价

一、项目背景北京房价一直是大家非常关注的话题。本项目以研究北京二手房房价为目的,通过Scrapy框架爬取链家网站的二手房房源信息,对其进行基本的数据分析及可视化,并利用决策树算法对未来房价进行预测,最后,可视化模型的学习曲线,观察是否出现过拟合问题。(仅供参考)二、爬取数据链家网站的二手房房源信息展示如下:共有77049条房源信息,但是只显示了100页,每页30条。这些数据未设置反爬,可直接爬取。

#数据挖掘#爬虫#数据分析
暂无文章信息