⛄引言

本文参考黑马 点评项目

在各个项目中,我们都可能需要用到UV数据统计功能,这样可以使我们更加方便、快捷的查看网站的活跃度!

一、HyperLoglog基础用法

⛅HyperLoglog 基本语法、命令

HyperLogLog

  • PFADD :将指定元素添加到HyperLogLog
  • PFCOUNT:返回存储在HyperLogLog结构体的该变量的近似基数,如果该变量不存在,则返回0
  • PFMARGE:将多个 HyperLogLog 合并(merge)为一个 HyperLogLog , 合并后的 HyperLogLog 的基数接近于所有输入 HyperLogLog 的可见集合(observed set)的并集.

详见官网: Redis 中文翻译 官方网站 HyperLogLog

在这里插入图片描述

⚡HyperLoglog 命令完成功能实现

PFADD命令

在这里插入图片描述

使用PFADD 添加数据

在这里插入图片描述

PFCOUNT 统计

  • 得到基数值,白话就叫做去重值(1,1,2,2,3, 3)的插入pfcount得到的是3
  • 可一次统计多个key
  • 时间复杂度为O(N),N为key的个数
  • 返回值是一个带有 0.81% 标准错误(standard error)的近似值.

在这里插入图片描述

使用PFCOUNT查询

在这里插入图片描述

PFMERGE 合并

在这里插入图片描述

合并key

在这里插入图片描述

HyperLogLog 的应用场景

  • 基数不大的、数据量不大就用不上。
  • 有局限性,就是只能统计基数数量,没办法统计具体的内容
  • 和BitMap相比,属于两种特定统计情况,HyperLogLog比 BitMap去重方便很多
  • HyperLogLog 可以 与 BitMap 配合使用,BitMap标识那些用户活跃,HyperLogLog计数

二、UV统计 测试百万数据的统计

☁️什么是UV统计

  • UV:全称Unique Visitor,也叫独立访客量,是指通过互联网访问、浏览这个网页的自然人。1天内同一个用户多次访问该网站,只记录1次。
  • PV:全称Page View,也叫页面访问量或点击量,用户每访问网站的一个页面,记录1次PV,用户多次打开页面,则记录多次PV。往往用来衡量网站的流量。

通常来说 UV 会比 PV 大很多,一个网站的独立访客量 和 页面访问或点击量,肯定是独立访客大的。

UV统计在服务端做会比较麻烦,因为要判断该用户是否已经统计过了,需要将统计过的用户信息保存。但是如果每个访问的用户都保存到Redis中,数据量会非常恐怖,那怎么处理呢?

Hyperloglog(HLL)是从Loglog算法派生的概率算法,用于确定非常大的集合的基数,而不需要存储其所有值。

Redis 中的HLL 是基于string数据结构实现的,单个HLL的内存永远小于16kb, 内存极低!作为代价,其测量结果是概率性的,有小于0.81%的误差。不过对于UV统计来说,这完全可以忽略。

⚡使用SpringBoot单元测试进行测试百万数据统计

首先进入Redis 查看 内存占用

info memory

在这里插入图片描述

核心源码

@Test
void testHyperLoglog() {
    String[] values = new String[1000];
    int j = 0;
    for (int i = 0; i < 1000000; i++) {
        j = i % 1000;
        values[j] = "user" + i;
        if (j == 999) {
            //发送至redis
            stringRedisTemplate.opsForHyperLogLog().add("hl2", values);
        }
    }
    //统计数量
    Long count = stringRedisTemplate.opsForHyperLogLog().size("hl2");
    System.out.println("count = " + count);
}

执行后,如下图

在这里插入图片描述

再次查看内存占比

在这里插入图片描述

可以看出占用大约为14KB,存储上百万数据只占用了14KB数据,可见HyperLogLog的强大!

⛵小结

以上就是【Bug 终结者】对 微服务Spring Boot 整合 Redis 实现 UV 数据统计 的简单介绍,UV数据统计功能是很常用的,在项目中,是一个不错的亮点,统计功能也是各大系统中比较重要的功能,签到完成后,去统计本月的连续 签到记录,来给予奖励,可大大增加用户对系统的活跃度,HyperLogLog可以与BitMap相结合,从而能够能高效的对网站进行深层次的分析! 技术改变世界!!!

如果这篇【文章】有帮助到你,希望可以给【Bug 终结者】点个赞👍,创作不易,如果有对【后端技术】、【前端领域】感兴趣的小可爱,也欢迎关注❤️❤️❤️ 【Bug 终结者】❤️❤️❤️,我将会给你带来巨大的【收获与惊喜】💝💝💝!

Logo

权威|前沿|技术|干货|国内首个API全生命周期开发者社区

更多推荐