
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大数据开发流程:从数据采集-》数据清洗-》数据处理(分析,计算···)我们采集过来的数据是有问题的,其中可能有脏数据或者无效数据,所以我们想要进行数据处理之前,就要对采集...
ETL过程中难免遇到性能问题,运行很慢是一件较常见的事情,遇到这些问题时,我们该如何分析,解决呢?首先我们要找到问题出在哪里,也就是系统的瓶颈在哪.确定环境是否有瓶颈:检查资源是否有效配...
开发语言1.Java,大数据框架的编写支持很多开发语言,但是Java在大数据方面有很大的优势,目前流行的大数据Hadoop框架,MapReduce框架,很多部分都是用开源...
很多同学对于pycharm配置本地的解释器还存在问题,配置本地的解释器最关键一点是要在pycharm里面选择Python解释器的位置。查看自己电脑中Py...
Hey!你是谁:*无python环境*有python环境未使用过anaconda管理python环境你要到哪里去:python大神学会anaconda的使用anaconda...
Hive中常见的SQL函数显示HOST地址select parse_url('地址','HOST')实例: select parse_url('h...
今天我们通过一些大数据典型的应用场景分析,一起来看看大数据到底能做些什么,我们学大数据究竟有什么用。医疗健康。比如,我们可以结合机器学习做到医学影像智能识别。图像识别是机...
基本概念MapReduce是由Google提出的一种面向大规模数据处理的并行计算模型和方法。Google提出;MapReduce的初衷是为了解决其搜索引擎中大规模的网页数...
有日志如下,请写出代码求得所有用户和活跃用户的总数及平均年龄。(活跃用户指连续两天都有访问记录的用户)日期用户年龄2019-02-11,test_1,232019-02-...
开发语言1.Java,大数据框架的编写支持很多开发语言,但是Java在大数据方面有很大的优势,目前流行的大数据Hadoop框架,MapReduce框架,很多部分都是用开源...







