logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据篇:flume+kafka+spark stream+hbase做日志收集

flume+kafka+spark stream+hbase做日志收集前言flume+kafka+spark stream 是目前比较常用的一套大数据消息日志收集管理框架,至于最后是入到Hive或者者Hbase需看不同业务场景,下面以HBase为场景简述下整个配置与搭建流程以及这些框架如此搭配的优点。flume+kafka+spark stream+hbase做日志收集...

#大数据#flume#kafka
谱聚类(spectral clustering)及其实现详解

Preface开了很多题,手稿都是写好一直思考如何放到CSDN上来,一方面由于公司技术隐私,一方面由于面向对象不同,要大改,所以一直没贴出完整,希望日后可以把开的题都补充全。谱聚类从构造规则化的拉普拉斯矩阵,到对特征矩阵的聚类,个中原理虽然简洁明了,但却蕴含了强大的逻辑结构。

#scala
到底了