logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

mapreduce实现推荐系统

主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。从2011年开始,中国进入大数据风

storm kafka集成

前言在前面Storm系列之——基本概念一文中,提到过Storm的Spout应该是源源不断的取数据,不能间断。那么,很显然,消息队列系统、分布式内存系统或内存数据库是作为其数据源的很好的选择。本文就如何集成Kafka进行介绍。Kafka的基本介绍: http://blog.csdn.net/xeseo/article/details/18311955准

Kafka+Spark Streaming+Redis实时计算整合实践

原文地址 http://shiyanjun.cn/archives/1097.html基于Spark通用计算平台,可以很好地扩展各种计算类型的应用,尤其是Spark提供了内建的计算库支持,像Spark Streaming、Spark SQL、MLlib、GraphX,这些内建库都提供了高级抽象,可以用非常简洁的代码实现复杂的计算逻辑、这也得益于Scala编程语言的简洁性。这里,我们基于

Flik SQL 自定义SQL SELECT并行度

FlinkHintStrategies 增加 hint task(完整代码)/** Licensed to the Apache Software Foundation (ASF) under one* or more contributor license agreements.See the NOTICE file* distributed with this work for additio

#flink
深圳入户体检报告查询

登录官网https://sz12333.gov.cn/rcyj/ 体检合并标准http://www.szhrss.gov.cn/xxgk/qtxx/tzgg/201007/t20100721_1554228.htm查询见下图红色地方 

到底了