logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Hive+Hadoop数据分析模拟案例练习

对电影评分数据进行统计分析,最后以可视化的形式展示出来。

文章图片
#hadoop#hive#数据分析
爬虫常用模板

这里记录的是我学习爬虫自己用到的一些东西,方便以后打开直接使用。我会不定期的往里面添加内容。

文章图片
#爬虫
python爬虫代理ip池搭建

最近大量爬取数据的时候总会遇到被封ip的情况,所有打算自己搭建一个代理ip池来使用。本次使用的是开源的ip代理池项目ProxyPool。

文章图片
#tcp/ip#网络协议#网络
kafka伪分布式搭建与命令测试

下载自己需要的版本即可,以下以3.6.1版本为例。

文章图片
#分布式
HIVE报错:FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.Map RedTask

动态分区的最大数量由hive.exec.max.dynamic.partitions和hive.exec.max.dynamic.partitions.pernode控制。本人在使用hive进行大量数据insert表的的时候运行失败并报错:Error while processing statement: FAILED: Execution Error, return code 2 from or

文章图片
#hive#apache#hadoop
Hive+Hadoop数据分析模拟案例练习

对电影评分数据进行统计分析,最后以可视化的形式展示出来。

文章图片
#hadoop#hive#数据分析
朴素贝叶斯分类算法 + python简单样例

贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。。其中}的含义为:对于第i个样本的第j个特征,它的特征值属于特征集j,通过训练集训练出分类模型,然后对输入的实例x进行预测分类。例:其中为第2个样本的第1个特征=1特征集={1,2,3}先验概率(prior probability)是指根据以往经验和分析得到的概率,如 全概率公式 ,它往往作为"由因求果"问题中的"因

文章图片
#分类#人工智能#数据挖掘
卷积与图像卷积操作

教材上的卷积公式如下图:f(t)代表进水量,表示t时刻进入的水量g(x-t)代表排水量,表示t时刻进入的水量,在x时候还剩多少(%)上面说的只是特殊情况,即使只有三个时间点有进水,而在实际情况下我们的水池是每个时刻都会有进水,所以我们需要累加x时刻之前的每一个时刻的剩余量,得到以下公式:结合两个函数我们有以下分析:以t时刻为例,表示这个时刻刚刚进水还没有开始排,所以对应着g(t)中的A点。而t-1

文章图片
#cnn#深度学习#神经网络
DrissionPage设置启动浏览器为edge

在浏览器地址栏输入下面地址,拿到可执行文件的路径。

文章图片
#edge#前端
    共 13 条
  • 1
  • 2
  • 请选择