logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python通过pyecharts对爬虫房地产数据进行数据可视化分析(一)

我们爬取到的房产数据,主要是武汉二手房的房源信息,主要包括了待售房源的户型、面积、朝向、楼层、建筑年份、小区名称、小区所在的城区-镇-街道、房子被打的标签、总价、单价等信息。库:numpy、pandas、pyecharts、jieba图形:Bar(柱状图)、Pie(饼图)、Histogram(直方图) 、Scatter(散点图)、Map(地图)和WordCloud(词云图):三、可视化展示效果执行

文章图片
#python#爬虫#pandas +1
机器学习:线性回归模型的原理、应用及优缺点

线性回归是一种统计学和机器学习中常用的方法,用于建立变量之间线性关系的模型。其原理基于假设因变量(或响应变量)与自变量之间存在线性关系。通过最小二乘法,得到最优的系数,从而建立了线性回归模型。模型的预测值 ( \hat{Y} ) 可以通过将自变量的值带入模型中计算得到。可以使用各种指标来评估模型的性能,如均方误差(Mean Squared Error,MSE)或决定系数(R-squared)。这些

文章图片
#机器学习#线性回归#人工智能 +3
置信区间的介绍和使用:置信水平、显著性水平、临界值

计算置信区间的具体方法通常取决于所选择的统计分布以及所使用的估计方法。在正态分布下,以样本均值为中心的置信区间的计算是比较常见的,尤其是当样本大小足够大时,根据中心极限定理,样本均值的分布接近正态分布。使用标准正态分布的临界值,可以在正态分布的 z 表或使用统计软件进行查找。对于双侧置信区间,我们通常查找两侧面积各为 α/2的临界值。这表示我们有95%的信心认为总体均值落在34到36之间。需要注意

#数据分析#学习
selenium报错AttributeError: ‘WebDriver‘ object has no attribute ‘find_element_by_id‘

AttributeError: ‘WebDriver’ object has no attribute ‘find_element_by_id’” 错误通常出现在使用 Selenium WebDriver 时,代码中使用了 ‘find_element_by_id’ 方法,但 WebDriver 对象并没有这个方法。如果您仍然遇到问题,可以提供更多的代码上下文以获取更详细的帮助。,那么 ‘find_

文章图片
#selenium#python#测试工具 +1
Python爬取电影信息:Ajax介绍、爬取案例实战 + MongoDB存储

Ajax(Asynchronous JavaScript and XML)是一种用于在Web应用程序中实现异步通信的技术。它允许在不刷新整个网页的情况下,通过在后台与服务器进行数据交换,实时更新网页的一部分。Ajax是异步的,这意味着它可以在不阻塞用户界面的情况下进行通信。用户可以继续与网页交互,而不必等待服务器响应。Ajax允许在客户端和服务器之间交换数据,通常使用XML、JSON或其他数据格式

文章图片
#ajax#mongodb#nosql +1
到底了