logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据分析系列 之FP-growth算法介绍

1 基本概念:FP-growth,即 Frequent Pattern Growth,它通过构建 FP 树(即 Frequent Pattern Tree)这样的数据结构,巧妙得将数据存储在 FP 树中,只需要在构建 FP 树时扫描数据库两次,后续处理就不需要再访问数据库了。这种特性使得 FP-growth 算法比 Apriori 算法速度快。FP 树是一种前缀树,由频繁项的前缀构成。2 两个名词

#算法#数据库#python +1
数据分析系列 之python中随机森林算法的应用

1 原理1.1 随机森林算法:随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,每棵决策树都是一个分类器(假设现在针对的是分类问题),那么对于一个输入样本,N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出,这就是一种最简单的 Bagging 思想。1.2 Matplotlib和SeabornMatplotlib:高度定制化绘

#决策树#python#机器学习 +1
人工智能系列 之机器学习DBSCAN聚类算法

1 介绍DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个出现得比较早(1996年),比较有代表性的基于密度的聚类算法。DBSCAN能够将足够高密度的区域划分成簇,并能在具有噪声的空间数据库中发现任意形状的簇。聚类的时候不需要预先指定簇的个数,最终簇的个数不确定。DBScan需要二个参数: 扫描半径 (Eps

#聚类#机器学习#算法
办公软件系列 之excel应用1

小前言:一般对于办公软件的使用博客少之又少,而且关键词描述不太清楚,导致搜索的内容质量极低,又限于是软件版本的问题,有些教程根本行不通。于是将自己在工作和学习之中用到的软件技巧和公式功能记录下来,用来之后的总结提高。PS:对于之前办公软件使用频率不高的童鞋,我真真切切的感受到办公软件技能的提升真的可以提升自己的算力。本篇小博客为excel应用1:公式1:对于时间戳的转换以及计算时间戳早晚的公式在e

#经验分享#编辑器
人工智能系列 之机器学习DBSCAN聚类算法

1 介绍DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个出现得比较早(1996年),比较有代表性的基于密度的聚类算法。DBSCAN能够将足够高密度的区域划分成簇,并能在具有噪声的空间数据库中发现任意形状的簇。聚类的时候不需要预先指定簇的个数,最终簇的个数不确定。DBScan需要二个参数: 扫描半径 (Eps

#聚类#机器学习#算法
数据分析系列 之pandas用例分析1

1 pandas介绍:pandas是基于NumPy的一种工具,它是python的一个数据分析包,最初由AQR Capital Management于2008年4月开发,并于2009年底开源出来,目前由专注于Python数据包开发的PyData开发team继续开发和维护,属于PyData项目的一部分。常用数据结构有:Series:一维数组,与Numpy中的一维array类似。二者与Python基本的

#数据结构#python#大数据 +1
系统运维系列 之java控制api接口请求次数

1 前言:本篇博客运用的背景是:控制并发数量;防止恶意恶意侵占资源,导致正常的请求无法响应;用于接口限制的其它用途。2 使用到的技术:2.1 Java过滤器:过滤器是处于客户端与服务器资源文件之间的一道过滤网,在访问资源文件之前,通过一系列的过滤器对请求进行修改、判断等,把不符合规则的请求在中途拦截或修改。也可以对响应进行过滤,拦截或修改响应。简单理解就是过滤器是客户端请求服务器的一种规则设定,符

#运维#java#servlet
系统运维系列 之java获取本月开始时间和结束时间等的方法

java获取本月开始时间和结束时间、上个月第一天和最后一天的时间以及当前日期往前推一周、一个月

#java#python#开发语言
系统运维系列 之网络编程/数据采集/交互方式汇总

本篇博客意在总结一下数据采集/交互的方式,直白点说就是接口/通信的问题,即怎样建立和对端的通信连接,数据怎样传送,采用什么方式入库等。我们的世界就是一个万物互联的世界,本质上讲日常生活中我们都在做信息交互,像古代战争时候的烽火台,到近现代战争的电报/电话,再到现在的互联网/信息化,信息的交互非常重要。网络编程的三要素:IP地址:每个设备在网络中的唯一标识,本地回路地址127.0.0.1,广播地址2

#linux#http#java +1
系统运维系列 之greenplum vacuum清理删除数据命令

1 PostgreSQL清理表膨胀之vacuumPostgreSQL的表膨胀清理就需要依赖vacuum,vacuum的主要任务就是清理表和索引中不需要的数据(dead tuples),为新加入的数据清理出来空间。vacuum完成清理工作后,那些空间并没有真正被释放给操作系统,只能被vacuum清理过的表和索引所利用。2 PostgreSQL清理表膨胀之vacuum fullVacuum Full和

#postgresql#数据库#database
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择