上传文件到到大数据平台

业务侧给的是mysql导出的csv文件。一共31个文件每个接近30g。4 插入表（一定要在hive命令下，在库的用户下才能执行）最近有一批数据，需要从mysql库导入到大数据平台。1 把文件上传到大数据平台hdfs目录。2 查看目录是否有文件。

damondandan

905人浏览 · 2022-09-20 09:30:01

damondandan · 2022-09-20 09:30:01 发布

最近有一批数据，需要从mysql库导入到大数据平台。

业务侧给的是mysql导出的csv文件。一共31个文件每个接近30g。

大概步骤

1 把文件上传到大数据平台hdfs目录

hdfs dfs -put /xxx/xxx/xxx/xxx.csv hdfs://hbcluster/user/xxxx/hive/xxxx.db/file

2 查看目录是否有文件

hdfs://hbcluster/user/xxxx/hive/xxxx.db/file

3 连接上hive

beeline -u "jdbc:hive2://ip:11001,ip:11001/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2" -n username -p password

4 插入表（一定要在hive命令下，在库的用户下才能执行）use 库名；

load data inpath 'hdfs://hbcluster/user/xxxx/hive/xxxx.db/filename/file.csv' into table tablename partition(shard =1);

亚马逊云科技技术品牌专区

更多推荐

STM32节点移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）

STM32移植lorawan协议连接腾讯云物联网开发平台（IoT Explorer）前言前言在移植协议之前，先给大家科普一下Lora 和 lorawan 的区别。LoRa 是LPWAN通信技术中的一种，是美国Semtech公司采用和推广的一种基于扩频技术的超远距离无线传输方案。这一方案改变了以往关于传输距离与功耗的折衷考虑方式为用户提供一种简单的能实现远距离、长电池寿命、大容量的系统，进而扩...

亚马逊云科技技术品牌专区

物联网主机E6000引领工业自动化的新篇章

亚马逊云科技技术品牌专区

搞 IoT 物联网，你居然要懂这么多种协议...

物联网协议是指在物联网环境中用于设备间通信和数据传输的协议。根据不同的作用，物联网协议可分为传输协议、通信协议和行业协议。传输协议：一般负责子网内设备间的组网及通信。例如 Wi-Fi、Ethernet、NFC、 Zigbee、Bluetooth、GPRS、3G/4G/5G等。这些协议能够确保在网络上传输的数据的安全性和可靠性。通讯协议：主要是运行在传统互联网TCP/IP协议之上的设备通讯协议，负责