张行之个人主页

@qq_33689414

张行之

2022-12-19 16:22:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Hive添加列、修改列（调整位置）、删除列操作等

1.添加1列或多列# 添加1列alter table table_name add columns(user_id bigint comment '用户ID');# 添加多列alter table table_name add columns(name string comment '用户名称',city string comment '城市',sex string comment '用户性别',

#数据库 #hive

Scrapy框架学习（八）----Scrapy-redis分布式爬虫学习

Scrapy框架学习（八）—-Scrapy-redis分布式爬虫学习Scrapy-redis分布式爬虫框架，是在Scrapy爬虫框架的基础上进行改进的，通过Redis来进行数据的缓存，可以在多台机器上运行爬虫程序。本文示例是在CentOS的虚拟机运行。1、Redis安装关于Redis的安装，网上有不少的文章，在配置Redis环境上也会有些问题，下面的2篇文章，详细的介绍了Redis...

#scrapy #redis

hadoop集群环境搭建之伪分布式集群环境搭建（一）

hadoop集群环境搭建之伪分布式集群环境搭建（一）1、Linux基本环境配置1.1 虚拟机网络模式选择NAT一般虚拟机默认是NAT模式1.2 修改主机名vim /etc/sysconfig/networkNETWORKING=yesHOSTNAME=zhang# 主机名1.3 修改IP切换root的用户，修改/etc/sysconfig/netw...

#hadoop #yarn #hdfs +1

使用JsonPath解析json数据

使用JsonPath解析json数据JsonPath介绍JsonPath是从JSON文档中抽取指定的信息的工具。提供多种语言实现版本，包括JavaScript，Python，PHP，java。JsonPath对于JSON，就好比xpath对于XML。JsonPath下载地址：https://pypi.python.org/pypi/jsonpathJsonPath安装：pip inst

#json #python

请求返回json串和文件下载实例

请求返回json串和文件下载实例请求返回json串JsonServlet代码：@WebServlet("/JsonServelt")public class JsonServelt extends HttpServlet {private static final long serialVersionUID = 1L;public JsonServelt() {

#json

SparkSql中DataFrame与json、csv、mysql、hive数据的互操作

SparkSql中DataFrame与json、csv、mysql、hive数据的互操作1.RDD转换成DataFrame1.1 RDD to DataFrameRDD转成DataFrame有2种方式，一种是通过隐式转换，一种是通过SparkSession来进行创建。1.1.1 RDD隐式转换成DataFrame(推荐)object RDDToDF {def ma...

#spark #hive #mysql +1

Flume+Kafka+SparkStreaming之wordcount示例

Flume+Kafka+SparkStreaming的结合使用之wordcount示例1. 生成log的py脚本脚本文件名称：produce_log3.py，内容如下：import timeimport schedimport randomdef create_log():file = open("/home/hadoop/log/access.log", ...

#spark #kafka #flume

Kafka常用命令

Kafka常用命令kafka启动命令# 指定对应的配置文件启动kafka-server-start.sh /hadoop/kafka/config/server.properties# -daemon 以后台的方式启动kafka-server-start.sh -daemon /hadoop/kafka/config/server.properties# 指定JMX p...

#kafka

Kafka Manager的使用

Kafka Manager的使用1.安装Kafka Manager是雅虎开发的一个基于Web的kafka管理工具。具有非常强大的功能。kafka manager项目地址：https://github.com/yahoo/kafka-manager下载编译kafka manager# 从git上下载Kafka manager源码git clone https://githu...

#kafka

Kafka核心配置参数与机制

Kafka核心配置参数与机制1. kafka集群安装kafka集群安装，参考文章: Kafka集群搭建及生产者消费者案例2. kafka配置参数broker.id：broker的id，id是唯一的非负整数，集群的broker.id不能重复。log.dirs：kafka存放数据的路径。可以是多个，多个使用逗号分隔即可。port：server接受客户端连接的端口，默认6667...

#kafka

共 25 条

请选择