logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

你知道大数据的面试都问了什么吗?90%机率会碰到的面试题及答案整理

2019已经到来,你是否在满意的公司?拿着理想的薪水?目前全国正处于招聘的高峰期,如果有面试题能提示一下,可以提前做个准备,也可以看出自己的不足之处,面试能拿到offer的机会就大的多,下面就是一些常见的大数据面试题,希望能够帮到大家:1.kafka集群的规模,消费速度是多少。答:一般中小型公司是10个节点,每秒20M左右。2.hdfs上传文件的流程。答:这里描述的 是一个25...

#大数据#程序人生#hadoop +2
分布式计算开源框架Hadoop的简介以及在实际中的运用

在SIP项目设计的过程中,对于它庞大的日志在开始时就考虑使用任务分解的多线程处理模式来分析统计,在我从前写的文章《Tiger Concurrent Practice —日志分析并行分解设计与实现》中有所提到。但是由于统计的内容暂时还是十分简单,所以就采用Memcache作为计数器,结合MySQL就完成了访问控制以及统计的工作。然而未来,对于海量日志分析的工作,还是需要有所准备。现在最火的技术词汇莫

#hadoop#hive#spark +2
​扫盲!全方位解析数据挖掘

数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,这些模型和关系可以用来做出预测。什么是数据挖掘当今数据库的容量已经达到上万亿的水平(T)---1,000,000,000,000个字节。在这些大量数据的背后隐藏了很多具有决策意义的信息,那么怎么得到这些“知识”呢?也就是怎样通过一颗颗的树木了解到整个森林的情况?计算机科学对这个问题给出的最新回答就是:数据挖掘,...

#大数据#数据分析#数据挖掘 +2
该如何选择最适合你的开源框架?

很多神经网络框架已开源多年,支持机器学习和人工智能的专有解决方案也有很多。多年以来,开发人员在Github上发布了一系列的可以支持图像、手写字、视频、语音识别、自然语言处理、物体检测的机器学习框架,但并没有一种框架可以完美地解决你所有的需求。那么该如何选择最适合你的开源框架呢?希望下面带有描述的图表以及分析可以带给你以启发,以此来选择最适合你的业务需求的框架。下图总结了绝大多数Github上的开源

#机器学习#人工智能#python +1
现阶段需重点关注的人工智能六大领域

现阶段,有许多关于人工智能公认定义的争论。有些人认为人工智能就是“认知计算”或是“机器智能”,而另一些人则把它与“机器学习”的概念混淆了。然而,人工智能并不是特指某种技术,它实际上是一个由多门学科组成的广阔领域,包括机器人学和机器学习等。人工智能的终极目标是让机器替代人类去完成需要认知能力的任务。为了实现这一目标,机器必须自动学习掌握能力,而不仅仅是执行程序员编写的命令。人工智能在过去的十...

#人工智能#机器学习#程序人生
数据中心资源向AWS迁移的四大挑战

很多企业将他们的数据中心资源向AWS中迁移,而更多的企业正在考虑向AWS中迁移数据中心资源。数据中心资源向AWS迁移能够带来极大的好处,AWS提供了一整套云计算服务,可以比企业自行构建数据中心更快、更经济地提供大型、可扩展的计算能力。AWS涵盖了近100项服务,包括了分析、计算、数据库、网络、存储、移动等等。企业选择AWS的原因多种多样,可能涵盖了以下一个或多个原因:企业希望消除本地数据中心或..

#大数据#数据库#云计算
到底了