简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我的需求是从数据表中导出1亿条数据,要求不能出现内存溢出的问题,同时提高导出效率,因为我导出的表的具体数据库信息是不固定的,因此只能先通过JDBC读出数据,然后再写入。经过测试,通过该方式写入100万条数据的时间大约是14秒左右,同时没有出现内存溢出问题,笔记本上跑的时间大约在17秒左右。以上代码中通过SXSSFWorkbook向Excel的用户表Sheet中写入100万条数据,每行数据是从0-9
Ambari搭建Hadoop集群时为了实现集群之间的主机进行快速的联机,我们需要对集群的虚拟机进行免密登录配置。下面来说说具体步骤。前提:3台虚拟机。1.修改主机名a)首先root权限下分别对3台虚拟机进行修改。修改的命令如下:sudo hostnamectl set-hostname node1我这里是把3台主机名分别修改为node1、node2、node3。修改完成后可...
这里提供两种方法解决问题:方法一:1.通过命令 systemctl enablentpd 设置NTP服务开机自启动。2.重启虚拟机后查看 服务运行状态 systemctl status ntpd ,发现服务并没有成功启动。3.查看chrony是否被设置为开机自启动。通过指令 systemctl is-enabled chrony 查看,发现这个服务已经被设置为开机自启动所以导致N...
最近项目中遇到一个需求。统计用户的搜索热词Top5。于是就想到了用elasticsearch来记录用户检索时的关键词及用户信息,然后通过聚合操作实现统计用户搜索热词,返回搜索次数最多的前10个。Elasticsearch版本:7.0.0首先创建存储关键词及用户信息的索引:POSThttp://localhost:9200/hotwords_test/_mapping{"properties": {