logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【爬虫】微博数据采集

所用工具八爪鱼采集器数据需求爬取指定关键词下的微博(用户信息、发布时间、发布内容等流程构建指定关键词微博采集数据示例数据示例基于移动端微博网址微博 (weibo.cn)https://m.weibo.cn/参考来源采集模板八爪鱼采集模板结果示例结果示例指定关键词 各话题下微博采集数据示例数据示例注意:①循环:可通过手动输入待爬取的网址;注意:②自动识别:自动识别网页→选择需要的信息抓取采集模板八爪

#大数据
遗传算法(GA)

注:转自https://www.cnblogs.com/LoganChen/p/7509702.html,感谢原博主最近在读《智能式GIS与空间优化》+数据挖掘实验 都提到该算法,借此机会多多了解下啦!但并未实操代码,现在还只是浅尝辄止地大致了解,有待结合论文进一步学习^ ^1、遗传算法介绍遗传算法,模拟达尔文进化论的自然选择和遗传学机理的生物进化构成的计算模型,一种不断选择优良个体的算法。谈到遗

【数据挖掘笔记】分类

理论Hunt算法是许多决策树算法的基础,包括ID3、C4.5和CART增益率(gain ratio):如决策树算法C4.5,采用增益率的划分标准来评估划分树剪枝tree-pruning:决策树过大容易过拟合overfitting,通过树剪枝(修剪初始决策树的分支),减小决策树的规模,提高决策树的泛化能力分类模型的误差:训练误差(training error)、泛化误差(generalization

#数据挖掘#分类
【课程作业】数据挖掘之主成分分析

参考:https://blog.csdn.net/lswbjtu/article/details/72764141http://www.360doc.com/content/14/1103/09/17553313_422099670.shtmlhttp://muchong.com/t-9070350-1一、理论(一)主成分分析的作用(二)准备工作:数据标准化(...

【课程作业】数据挖掘之具有定性变量的回归模型

具有定性变量的回归模型作业要求

【课程笔记】空间数据挖掘方法(机器学习)

一、绪论机器学习VS数据挖掘分类的过程二、模型评估评估方法评估模型之留出法:简单粗暴,直接按2:1~4:1将数据集分为训练集:测试集。评估模型之交叉验证法:将数据集分为k个互斥子集,一部分作为训练集,另一部分作为测试集,循环这个过程。常令k=10,进行十折交叉验证。使用全部样本,即为留一法。评估模型之自助法:自助,有放回地采样。效果一般...

#机器学习#数据挖掘#人工智能
到底了