简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
记得点击"小林玩大数据,设为星标⭐前言大家好,我是林哥!2021年以来,云原生、云计算时代的趋势已经在渐渐的铺开了,这些都与 Dokcer + K8S 两个技术的盛行分不开。今天。林哥...
clickhouse目前用在实时BI后台,只要数据稳定落库了,出报表很快,临时查询也很快,在使用过程中,对它的一些优点和不足也是深有体会,这里总结一下,不能做到面面俱到,但尽可能详细的介绍实际应用需要注意的问题和应用技巧。我们是通过编写Flink程序,消费kafka数据,将数据清洗,扩充维度,然后落在clickhouse里面,半年以来,Flink程序很少出问题,数据落库也很稳定。对于clickho
1#!/usr/bin/python2#-*-coding:utf-8-*-3importjson4importurllib.request...
马尔可夫模型(Markov Model)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中...
一:业务背景与需求梳理公司现在的数据需求主要分为两类:临时需求(业务突然想看看这波活动的效果怎样,数据指标的定义可能随时改,随时加),固化需求(每周要看,每月要看的数据,数据的定义已经非...
原文链接:https://wklchris.github.io/R-plotting-basic.htmlR 的绘图功能一直为业内所津津乐道。用了 Python 的 ma...
1、原索引2、创建新索引3、同步数据4、删除原索引5、设置别名欢迎访问我的个人博客,听听我的故事。
有些时候需要我们去统计某一个hbase表的行数,由于hbase本身不支持SQL语言,只能通过其他方式实现。可以通过一下几种方式实现hbase表的行数统计工作:这里有一张hbase表test...
hbase构建二级索引1 为什么需要二级索引HBase的一级索引就是rowkey,我们仅仅能通过rowkey进行检索。假设我们相对Hbase里面列族的列列进行一些组合查询,就只能全表扫描了...