
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了在Kubernetes集群上部署JupyterHub的完整流程,包括环境准备、核心组件配置和部署步骤。主要内容包括:Kubernetes集群要求(1.14+版本、Helm工具等)、创建命名空间和服务账户、准备生产/测试环境配置文件、构建自定义Notebook镜像(集成Spark、Hail等生物信息学工具),以及使用Helm进行最终部署。部署架构包含JupyterHub Hub、HTTP代
Apache Kafka 作为当今最流行的分布式流处理平台之一,已被广泛应用于实时数据管道、事件驱动架构和流分析等场景。随着云原生技术的普及,在 Kubernetes 上运行 Kafka 已成为主流选择。本文将详细介绍在 2026 年 Kubernetes 环境中部署和管理 Kafka 集群的方案。
本文介绍了在Kubernetes中部署Redis的多种方案。针对不同场景需求,提供了单实例、主从复制、Redis Cluster集群和企业级Operator四种核心部署方式。详细说明了每种方案的实现方法,包括原生YAML配置、Helm Chart快速部署以及企业级Operator管理。同时给出了Spring Boot应用连接不同Redis部署模式的配置示例,并针对开发测试、常规生产、大数据量等场景
转载请注明出处:kubernetes—CentOS7安装kubernetes1.11.2图文完整版架构规划k8s至少需要一个master和一个node才能组成一个可用集群。本章我们搭建一个master节点和三个node节点。我们在生产环境中使用时k8s时可以适当增加节点。我们有三台服务器,ip和身份规划如下:192.168.11.90masternode19...
我们在上一章已经了解了presto的简介,本章进行部署和使用。官网教程https://prestodb.io/docs/current/installation.htmlhttp://prestodb-china.com/docs/current/installation/deployment.html (京东版本)https://teradata.github.io/presto...
我们在之前的文章中已经学习过了presto的安装部署和连接hive使用。 并且在cli命令界面中进行了操作。数据仓库(十)—分布式SQL查询引擎—presto安装部署和连接hive使用不过我们最终的应用场景肯定是在可视化web中进行查询分析,所以有必要在web的框架中使用presto对hive进行查询。因为我们一直用的比较多的都是SpringMVC框架,所以在这个基础上进行配置使用。...
我们本章进行hive的优化学习分区和分桶。hive分区背景1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。2、分区表指的是在创建表时指定的partition的分区空间。3、如果需要创建有分区的表,需要在create表的时候调用可选参数partitioned by,...
我们在之前的文章中已经学习了数据仓库hive,如果要对数据仓库进行交互查询,则需要交互查询的引擎用于提高查询效率。本章介绍presto。简介Presto是一个开源的分布式SQL查询引擎,适用于实时交互式分析查询,支持海量的数据;主要是为了解决商业数据仓库的交互分析,和处理速度低下的问题。它支持标准的ANSI SQL,包括复杂查询、聚合(aggregation)、连接(join)和窗口函数(...
大家早上好,非常高兴能来参加这次上海站的数据驱动增长大会。以前说到数据驱动业务增长,我们第一个想到的可能是数据分析的方法。但就目前来看,数据驱动业务的增长已经成为一个不仅仅是分析方法和模型,而是包括了数据人才培养、数据架构的设计,甚至整个公司组织架构设计的企业治理问题。所以今天我想从途家数据团队的发展、部门的构成及职责这两个方面去跟大家分享一下途家网的一些实践。如果对一个公司的业务没有足够...
我们在上一篇文章中已经学习了Hive的常用命令,但是如果使用其他的语言如何跟Hive进行交互呢。Thrift简介Hive拥有HiveServer(Thrift)或者Hiveserver2组件,提供了JDBC驱动服务,使得我们可以用Java代码或者Python来连接Hive并进行一些关系型数据库的sql语句查询等操作。HiveServer或者HiveServer2都是基于Thrift的,...







