logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据库原理(一)数据库索引和文件系统使用B+树场景分析

1.B树和B+树比较(1)算法效率B树是一种多路搜索树,每个节点最多有两个孩子节点。而B+树路数更多,相比之下数的高度减少很多。所以,B+树查找复杂度大概为log(n)(2)多路查找:由于B+树数据都存在叶子节点中,并且叶子节点用链表相连。现在思考使用场景如何在1000万条的数据库中找到前1000条id数据:如果用B树,查找到某个节点之后,下一个节点就需要局部的中序遍历才行,而用了B+树,只需要从

#java#数据结构#mysql
ensp与虚拟机搭建测试环境

搭建ensp和主机网络互联测试环境,保证可以互相ping通

文章图片
#网络#网络安全
(6)二分查找及其应用场景

数据结构&算法模块总结(1)复杂度分析原理与方法(2)数组与链表原理和使用场景讲解(3)栈原理与应用场景讲解(4)队列原理与应用场景讲解(5)递归原理与虚拟机栈场景应用1.传统二分查找模板问题public int bsearch(int[] a, int n, int value) {int low = 0;int high = n - 1;while (low <= high) {

文章图片
#算法#leetcode
(3)Kafka消费者工作机制详解

1.消费方式(pull vs push)传统Push模式虽然实时性高,但是容易造成consumer来不及处理消息,导致拒绝服务及网络拥塞。consumer采用pull(拉)模式从broker读取数据,这样可以控制消费速度。pull缺点:如果kafka没有数据,消费者可能会限于获取空数据的循环中。因此可以设置timeout参数,如果没有数据可供消费,consumer会等待一段时间再返回拿。2.消费时

文章图片
#kafka#分布式#中间件
(5)Kafka原理和高可用介绍

1.Kafka介绍(1)基本概念Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者的所有动作流数据。 这种动作如:活动数据:网站用户行为数据,例如PV(页面浏览量),UV(用户访问量)运营数据: 监控系统性能指标(cpu利用率、负载,内存使用率,磁盘利用率,IO性能)这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决,特性如下:海量数据不可变实时处理对于像Hadoop的一

文章图片
#kafka#big data#hadoop
Multi-Sentence Compression: Finding Shortest Paths in Word Graphs(2010)

摘要我们考虑了用一个短句来概括一组相关句子的任务,我们称之为多句压缩,并提出了一种基于最短路径的简单方法。该方法的优点和新颖之处在于,它是一种语法化的方法,只需要一个标记器和一个标记器。尽管它很简单,但正如我们对英语和西班牙语数据的实验所证明的那样,它能够生成语法和信息摘要。1.引言句子压缩(SC)是一项任务,其目标是生成一个句子的摘要,以保留内容的重要部分并符合语法。从[]的早期工作开始,在过去

#nlp#机器学习
JavaWeb(一)Tomacat环境搭建和Servlet介绍

1.Tomcat结构Web 应⽤服务器:Tomcat、Jboos、Weblogic、Jetty(1)首先在官⽹下载压缩⽂件https://tomcat.apache.org/download-90.cgi(2)然后压缩后可以看到目录结构2.IDE会集成Tomcat(如IDEA)(1)首先创建Java Web工程3.Servlet(1)什么是ServletServlet 是 Java Web 开发的

#java#tomcat#servlet +1
JavaWeb(七)JDBC简介

1.JDBCJava DataBase Connectivity 是⼀个独⽴于特定数据库的管理系统,通⽤的 SQL 数据库存取和操作的公共接⼝。它定义了⼀组标准,为访问不同数据库提供了统⼀的途径。2.JDBC体系(1)JDBC接口包括两个层面⾯向应⽤的 API,供程序员调⽤⾯向数据库的 API,供⼚商开发数据库的驱动程序①JDBC API提供者:Java 官⽅内容:供开发者调⽤的接⼝②Driver

#数据库#java#mysql +1
Git生产环境上commit提交多次解决办法

1.模拟测试环境:创建Test分支做测试,模拟commit提交多次(1)现在远程仓库上有两个分支,我们将使用Test(2)现在需要在本地也创建一个Test分支方便对应上(因为公司项目一般有上十分支,有些只是临时的开发完就删除)checkout不能直接创建(Test是本地分支名,fork_origin/Test是远程仓库别名+远程分支名)应该直接创建分支:git branch -m Test(3)现

文章图片
#git#gitlab#github +1
Calcite原理和代码讲解(一)

1.Calcite介绍(1)简介Apache Calcite 是面向 Hadoop 新的查询引擎,它提供了标准的 SQL 语言、多种查询优化和连接各种数据源的能力。Calcite 的目标是“ one size fits all (一种方案适应所有需求场景)”,希望能为不同计算平台和数据源提供统一的查询引擎,并以类似传统数据库的访问方式(SQL 和高级查询优化)来访问Hadoop 上的数据。Calc

文章图片
#hadoop#sql#spark +1
到底了