简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, Bigtop, Crunch, Hue等。从2011年开始,中国进入大数据风
前言在前面Storm系列之——基本概念一文中,提到过Storm的Spout应该是源源不断的取数据,不能间断。那么,很显然,消息队列系统、分布式内存系统或内存数据库是作为其数据源的很好的选择。本文就如何集成Kafka进行介绍。Kafka的基本介绍: http://blog.csdn.net/xeseo/article/details/18311955准
原文地址 http://shiyanjun.cn/archives/1097.html基于Spark通用计算平台,可以很好地扩展各种计算类型的应用,尤其是Spark提供了内建的计算库支持,像Spark Streaming、Spark SQL、MLlib、GraphX,这些内建库都提供了高级抽象,可以用非常简洁的代码实现复杂的计算逻辑、这也得益于Scala编程语言的简洁性。这里,我们基于
FlinkHintStrategies 增加 hint task(完整代码)/** Licensed to the Apache Software Foundation (ASF) under one* or more contributor license agreements.See the NOTICE file* distributed with this work for additio
登录官网https://sz12333.gov.cn/rcyj/ 体检合并标准http://www.szhrss.gov.cn/xxgk/qtxx/tzgg/201007/t20100721_1554228.htm查询见下图红色地方