chenyanlong_v 个人主页

@longyanchen

chenyanlong_v

2022-06-24 21:23:50 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

大数据中为什么使用scala？

原因：开发大数据应用程序（Spark程序、Flink程序）Hadoop已经是我们大数据领域的事实标准了。Spark生态并不是要取代Hadoop生态，而是为了更好的拓展大数据生态，两者结合。而Spark由我们Scala开发的，我们学习Scala为了更好的去学习Spark。表达能力强，一行代码抵得上Java多行，开发速度快。优雅，代码简介逻辑更加清晰。兼容Java，...

机器学习实战教程(13篇)

机器学习实战教程（一）：K-近邻算法（史诗级干货长文）https://cuijiahua.com/blog/2017/11/ml_1_knn.html机器学习实战教程（二）：决策树基础篇之让我们从相亲说起https://cuijiahua.com/blog/2017/11/ml_2_decision_tree_1.html机器学习实战教程（三）：决策树实战篇之为自己配个隐形眼镜http...

精选的中文NLP（自然语言处理）资源列表

中文NLP工具包中文NLP工具工具包综合NLP工具包流行的英语/多语言NLP工具包常用的英语或支持多语言的NLP工具包中文分词信息提取信息提取QA和Chatbot问答和聊天机器人2.语料库3.组织相关中文NLP组织和会议4.学习资料中文NLP工具包中文NLP工具工具包综合NLP工具包清华的THULAC中文词法分析工具包（C ++ /...

SQL中的外键

外键概念：外键与主键相对，作用就是通过主外键的之间关系使对张表中的数据更好的关联。外键特点：从表外键的值是对主表主键的引用。从表外键类型，必须与主表主键类型一致。作用：外键可以保证数据的完整性和一致性格式：（2种）[constraint 外键约束关系的名称] foreign key 从表(外键字段名称) references 主表(主...

十大经典排序算法（过程+图解）

目录关于时间复杂度1、冒泡排序2、选择排序3、插入排序4、希尔排序5、归并排序6、快速排序7、堆排序8、计数排序9、桶排序10、基数排序排序算法可以分为内部排序和外部排序，内部排序是数据记录在内存中进行排序，而外部排序是因排序的数据很大，一次不能容纳全部的排序记录，在排序过程中需要访问外存。常见的内部排序算法有：插入排序、希尔排序、选择排序、冒泡排序...

SQL中的外键

机器学习实战教程(13篇)

中国自然语言处理开源组织

github地址：https://github.com/NLPchina网址：http://www.nlpcn.org

大数据安全认证

它同样是做细粒度的权限控制。但相比较于Sentry而言，它能支持更丰富的组件，包括于 HDFS, Hive, HBase, Yarn, Storm, Knox, Kafka, Solr and NiFi。Sentry首先是由Cloudera公司内部开发而来的，初衷是为了让用户能够细粒度的控制Hadoop系统中的数据（这里主要指HDFS，Hive的数据）。平台用户的用户认证一般会采用kerberos

#大数据

为什么要数据仓库分层？好处是？

按照数据流入流出的过程，数据仓库架构可分为三层——源数据、数据仓库、数据应用。源数据层（ODS）：此层数据无任何更改，直接沿用外围系统数据结构和数据，不对外开放；为临时存储层，是接口数据的临时存储区域，为后一步的数据处理做准备。数据仓库层（DW）：也称为细节层，DW层的数据应该是一致的、准确的、干净的数据，即对源系统数据进行了清洗（去除了杂质）后的数据。数据应用层（DA或A...

共 21 条

请选择