logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

最好的Docker入门教程, 一万字总结(建议收藏)

记得点击"小林玩大数据,设为星标⭐前言大家好,我是林哥!2021年以来,云原生、云计算时代的趋势已经在渐渐的铺开了,这些都与 Dokcer + K8S 两个技术的盛行分不开。今天。林哥...

#运维#docker#大数据 +2
clickhouse使用心得

clickhouse目前用在实时BI后台,只要数据稳定落库了,出报表很快,临时查询也很快,在使用过程中,对它的一些优点和不足也是深有体会,这里总结一下,不能做到面面俱到,但尽可能详细的介绍实际应用需要注意的问题和应用技巧。我们是通过编写Flink程序,消费kafka数据,将数据清洗,扩充维度,然后落在clickhouse里面,半年以来,Flink程序很少出问题,数据落库也很稳定。对于clickho

#clickhouse#adb
手机号归属地打标签的API分享

1#!/usr/bin/python2#-*-coding:utf-8-*-3importjson4importurllib.request...

女朋友的心思你能猜得到吗?——马尔可夫链告诉你

马尔可夫模型(Markov Model)是一种统计模型,广泛应用在语音识别,词性自动标注,音字转换,概率文法等各个自然语言处理等应用领域。经过长期发展,尤其是在语音识别中...

开源自助BI工具,傻瓜式BI分析,支持多种数据源

一:业务背景与需求梳理公司现在的数据需求主要分为两类:临时需求(业务突然想看看这波活动的效果怎样,数据指标的定义可能随时改,随时加),固化需求(每周要看,每月要看的数据,数据的定义已经非...

#大数据#数据分析#java +1
R语言(绘图入门)

原文链接:https://wklchris.github.io/R-plotting-basic.htmlR 的绘图功能一直为业内所津津乐道。用了 Python 的 ma...

#r语言#开发语言
elasticsearch修改字段类型

1、原索引2、创建新索引3、同步数据4、删除原索引5、设置别名欢迎访问我的个人博客,听听我的故事。

#elasticsearch#大数据#搜索引擎
Hbase统计表的行数的3种方法

有些时候需要我们去统计某一个hbase表的行数,由于hbase本身不支持SQL语言,只能通过其他方式实现。可以通过一下几种方式实现hbase表的行数统计工作:这里有一张hbase表test...

#数据仓库#hadoop#mapreduce +2
Hbase构建二级索引的一些解决方案

hbase构建二级索引1 为什么需要二级索引HBase的一级索引就是rowkey,我们仅仅能通过rowkey进行检索。假设我们相对Hbase里面列族的列列进行一些组合查询,就只能全表扫描了...

#数据库#mysql#java +2
到底了