logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据中为什么使用scala?

原因:开发大数据应用程序 (Spark程序、Flink程序)Hadoop已经是我们大数据领域的事实标准了。Spark生态并不是要取代Hadoop生态,而是为了更好的拓展大数据生态,两者结合。而Spark由我们Scala开发的,我们学习Scala为了更好的去学习Spark。表达能力强,一行代码抵得上Java多行,开发速度快。 优雅,代码简介逻辑更加清晰。兼容Java,...

机器学习实战教程(13篇)

机器学习实战教程(一):K-近邻算法(史诗级干货长文)https://cuijiahua.com/blog/2017/11/ml_1_knn.html机器学习实战教程(二):决策树基础篇之让我们从相亲说起https://cuijiahua.com/blog/2017/11/ml_2_decision_tree_1.html机器学习实战教程(三):决策树实战篇之为自己配个隐形眼镜http...

精选的中文NLP(自然语言处理)资源列表

中文NLP工具包中文NLP工具工具包综合NLP工具包流行的英语/多语言NLP工具包常用的英语或支持多语言的NLP工具包中文分词信息提取信息提取QA和Chatbot问答和聊天机器人2.语料库3.组织相关中文NLP组织和会议4.学习资料中文NLP工具包中文NLP工具工具包综合NLP工具包清华的THULAC中文词法分析工具包(C ++ /...

SQL中的外键

外键概念:外键与主键相对,作用就是通过主外键的之间关系使对张表中的数据更好的关联。外键特点:从表外键的值是对主表主键的引用。从表外键类型,必须与主表主键类型一致。作用:外键可以保证数据的完整性和一致性格式:(2种)[constraint 外键约束关系的名称] foreign key 从表(外键字段名称) references 主表(主...

十大经典排序算法(过程+图解)

目录关于时间复杂度1、冒泡排序2、选择排序3、插入排序4、希尔排序5、归并排序6、快速排序7、堆排序8、计数排序9、桶排序10、基数排序排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。常见的内部排序算法有:插入排序、希尔排序、选择排序、冒泡排序...

SQL中的外键

外键概念:外键与主键相对,作用就是通过主外键的之间关系使对张表中的数据更好的关联。外键特点:从表外键的值是对主表主键的引用。从表外键类型,必须与主表主键类型一致。作用:外键可以保证数据的完整性和一致性格式:(2种)[constraint 外键约束关系的名称] foreign key 从表(外键字段名称) references 主表(主...

机器学习实战教程(13篇)

机器学习实战教程(一):K-近邻算法(史诗级干货长文)https://cuijiahua.com/blog/2017/11/ml_1_knn.html机器学习实战教程(二):决策树基础篇之让我们从相亲说起https://cuijiahua.com/blog/2017/11/ml_2_decision_tree_1.html机器学习实战教程(三):决策树实战篇之为自己配个隐形眼镜http...

中国自然语言处理开源组织

github地址:https://github.com/NLPchina网址:http://www.nlpcn.org

大数据安全认证

它同样是做细粒度的权限控制。但相比较于Sentry而言,它能支持更丰富的组件,包括于 HDFS, Hive, HBase, Yarn, Storm, Knox, Kafka, Solr and NiFi。Sentry首先是由Cloudera公司内部开发而来的,初衷是为了让用户能够细粒度的控制Hadoop系统中的数据(这里主要指HDFS,Hive的数据)。平台用户的用户认证一般会采用kerberos

#大数据
为什么要数据仓库分层?好处是?

按照数据流入流出的过程,数据仓库架构可分为三层——源数据、数据仓库、数据应用。源数据层(ODS):此层数据无任何更改,直接沿用外围系统数据结构和数据,不对外开放;为临时存储层,是接口数据的临时存储区域,为后一步的数据处理做准备。数据仓库层(DW):也称为细节层,DW层的数据应该是一致的、准确的、干净的数据,即对源系统数据进行了清洗(去除了杂质)后的数据。数据应用层(DA或A...

    共 21 条
  • 1
  • 2
  • 3
  • 请选择