文晓武个人主页

@yangbindxj

文晓武

2022-09-16 16:57:34 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

HBase：海量数据分布式存储系统详细介绍

1 HBase 浅析1.1 HBase 是啥HBase是一款面向列存储，用于存储处理海量数据的NoSQL数据库。它的理论原型是Google的BigTable论文。你可以认为HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase的存储是基于HDFS的，HDFS有着高容错性的特点，被设计用来部署在低廉的硬件上，基于Hadoop意味着HBase与生俱来的超强的扩展性和吞吐量。HBa

#hbase #分布式 #数据库

kafka是如何通过offset定位一条消息的？

1. Kafka文件结构Kafka 中消息是以 topic 进行分类的，生产者生产消息，消费者消费消息，都是面向 topic的。topic 是逻辑上的概念，而 partition 是物理上的概念，每个 partition 对应于一个 log 文件，该 log 文件中存储的就是 producer 生产的数据。Producer 生产的数据会被不断追加到该log 文件末端，且每条数据都有自己的 offs

#kafka #分布式 #java

算法时间复杂度：O(logn)的底数是多少？

大家好，我是老三，最近裸辞了，在面试。前两天一个面试，只面了十分钟就结束了——事情是这样的：面试官：你能说说HashMap的数据结构吗？老三：数组+链表+红黑树，阿巴阿巴……面试官：那你说说红黑树的查找复杂度是多少？老三：O(logn)。面试官：那这个复杂度的底数是多少？老三：时间复杂度O(logn)有底数？面试官：没有吗？尬住……面试官：那你再说一下快速排序的时间复杂度？底数是多少？老三露出智（

#java #面试 #数据结构

搜索引擎背后的经典数据结构和算法

前言我们每天都在用 Google, 百度这些搜索引擎，那大家有没想过搜索引擎是如何实现的呢，看似简单的搜索其实技术细节非常复杂，说搜索引擎是 IT 皇冠上的明珠也不为过，今天我们来就来简单过一下搜索引擎的原理，看看它是如何工作的，当然搜索引擎博大精深，一篇文章不可能完全介绍完，我们只会介绍它最重要的几个步骤，不过万变不离其宗，搜索引擎都离不开这些重要步骤，剩下的无非是在其上添砖加瓦，所以掌握这些「

#搜索引擎 #数据结构

springboot如何把HttpServletRequest传入到controller

是由如tomcat这种Servlet容器创建的。Tomcat 创建的 Request 和 Response 的类结构图。至于这个是怎么传到你对应的controller方法内的，实际上就是SpringMVC里面的起的作用。这里先不展开，下面再讨论，先看一张图。

#spring boot #spring #servlet

机器学习的30个基本概念，都在这里了（手绘图解）

作者：梅子行、毛鑫宇来源：大数据DT（ID：hzdashuju）01空间表征在学习深奥的机器学习理论之前，首先来介绍一些机器学习中最基本的概念。特征（Feature）：一个具体事物的属性描述，由属性向量表示。第j个记录xj的属性向量可以表示为：xj=(xj(1)，xj(2)，…，xj(i)，…，xj(n))， j=1，2，…，N， xj∈X其中每个xj(i)为一个特征维度上的取值。标记（Label

#机器学习

机器学习三要素之数据、模型、算法

机器学习三要素包括数据、模型、算法。简单来说，这三要素之间的关系，可以用下面这幅图来表示：总结成一句话：算法通过在数据上进行运算产生模型。下面我们先分别来看三个要素。1. 数据关于数据，其实我们之前已经给出了例子。源数据上一篇中，图1老鼠和其他动物和图2小马宝莉六女主就是现实中的两份样本集合。如果我们要训练“老鼠分类器”，或者做“小马种族聚类” 分析的话，它们就是原始数据（Raw Data）。不过

#自然语言处理 #机器学习

PostGIS空间数据库详细介绍

一、什么是空间数据库PostGIS是一个空间数据库，Oracle Spatial和SQL Server(2008和之后版本）也是空间数据库。但是这意味着什么？是什么使普通数据库变成空间数据库？简短的答案是...空间数据库像存储和操作数据库中其他任何对象一样去存储和操作空间对象。下面简短介绍了空间数据库的发展，然后回顾了将空间数据与数据库关联起来的三个要素：数据类型、索引和函数空间数据类型、空间索引

#postgresql #数据库 #database

算法平台在线服务体系的演进与实践（v2021-05-13）

目录0. 写在前面1.图灵平台介绍2. 图灵OS的建设背景3. 图灵OS 1.03.1 图灵OS 1.0介绍3.2 图灵OS 1.0遗留问题4. 图灵OS 2.04.1 标准化轻量级SDK4.2 算法插件化4.3 数据通道4.4 算法编排4.5 多模式集成4.6 图灵沙箱4.7 统一回放平台4.8 性能压测及调优5. 图灵OS 2.0建设成果5.1 算法研发流程5.2 图灵OS 2.0使用汇总6.

共 39 条

请选择