logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Impala:新一代开源大数据分析引擎

摘要:大数据处理是云计算中非常重要的领域,自Google公司提出MapReduce分布式处理框架以来,以Hadoop为代表的开源软件受到越来越多公司的重视和青睐。本文将讲述Hadoop系统中的一个新成员:Impala。Impala架构分析Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已

Eclipse m2e pom报错:org.apache.maven.archiver.MavenArchiver.getManifest(org.apache.maven.project.Mav

Eclipse Maven pom报错:org.apache.maven.archiver.MavenArchiver.getManifest(org.apache.maven.project.MavenProject, org.apache.maven.archiver.MavenArchiveConfiguration) pom.xml / line 1 Maven Configura

Kafka主要参数详解

1234567891011121314151617181920212223242526272829303132333435

#kafka
MXtrans + InfluxDB + Grafana实现Kafka性能指标监控

MXtrans + InfluxDB + Grafana实现Kafka性能指标监控架构一般系统监控通常分为3部分:数据采集分析与转换展现(可视化)数据采集对于前端应用,一般需要埋点,对用户的行为进行记录。 如果不埋点,则需要通过Pagespeed、PhantomJS这样的工具去模拟用户行为进行测试。后端的系统通常有

kafka windows环境的搭建之路

简介:kafka是一个分布式的、可分区的、可复制的消息系统,它常常用于处理日志信息,是Apache下的一个开源项目(觉得Apache简直太牛逼了。。) (一)基本的消息术语:    Kafka将消息以topic为单位进行归纳。  将向Kafka topic发布消息的程序成为producers.  将预订topics并消费消息的程序成为consumer.

spring boot与kafka集成

引入相关依赖dependency>groupId>org.springframework.bootgroupId>artifactId>spring-boot-starterartifactId>dependency>dependency>groupId>org.springframework.kafkagroupId>artifactId>spr

探讨kafka的分区数与多线程消费

kafka算是很麻烦的一件事儿,起因是最近需要采集大量的数据,原先是只用了典型的high-level Consumer的API,最经典的不过如下: Properties props = new Properties();props.put("zookeeper.connect", "xxxx:2181");props.put("zo

ELK+Filebeat 集中式日志解决方案详解

Google+用电子邮件发送本页面ELK Stack 简介ELK 不是一款软件,而是 Elasticsearch、Logstash 和 Kibana 三种软件产品的首字母缩写。这三者都是开源软件,通常配合使用,而且又先后归于 Elastic.co 公司名下,所以被简称为 ELK Stack。根据 Google Trend 的信息显示,ELK Stac

#elk
开源数据可视化工具(For Apache Kylin)使用说明

Apache Kylin,很好的解决了海量数据OLAP的底层存储与分析引擎,但还缺一个数据可视化工具,可以使用户非常方便的通过图形化分析探索海量数据,而不用写SQL。于是我们发现了Caravel。原生的Caravel并不支持Kylin,也不支持多表关联,经过好友Rocky和我的修改和调试,使得Caravel支持Kylin,同时也实现了Kylin中多表关联分析。GitHub地址(基于cara

MySQL 查询 select * from table where id in 如何提高效率?

例句:select* from a where id in (select id from b );对于这条sql语句它的执行计划其实并不是先查询出b表的所有id,然后再与a表的id进行比较。mysql会把in子查询转换成exists相关子查询,所以它实际等同于这条sql语句:select * from a where exists(select * from b where b

#mysql
    共 13 条
  • 1
  • 2
  • 请选择