bluishglc 个人主页

@bluishglc

bluishglc

2022-10-24 18:45:52 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Exec Maven Plugin全面解析和使用示例

本文原文连接: http://blog.csdn.net/bluishglc/article/details/7622286 ,转载请注明出处！1.为什么使用exec？现在的工程往往依赖众多的jar包，不像war包工程，对于那些打包成jar包形式的本地java应用来说，通过java命令启动将会是一件极为繁琐的事情，原因很简单，太多的依赖让参数-classpath变得异常的恐怖。为此，在发布应用时，

#maven #java #jar +1

领域驱动设计(Domain Driven Design)参考架构详解

领域驱动设计(Domain Driven Design)参考架构详解摘要本文将介绍领域驱动设计(Domain Driven Design)的官方参考架构，该架构分成了Interfaces、Applications和Domain三层以及包含各类基础设施的Infrastructure。本文会对架构中一些重要组件和问题进行讨论，给出一些分析结论。本文原文连接：http://blog.csdn.net/b

Shell 脚本：按日期排序和查找文件 / 删除指定时间范围内的文件

有时候，我们会向一个文件夹里添加或删除文件，随着文件越来越多，操作历史越来越长，最初文件夹的状态可能就记不清了，某些时候，我们可能想恢复到文件夹的初始状态，重新来过，这时候就只能依靠文件修改时间来查找和过滤文件了。一个典型的场景就是：为了运行各种组件，我们会往一个 lib 文件夹中添加各种 Jar 包，有时候，时间久了，Jar 包可能会出现版本冲突，于是我们想清理到近期安装的各种 Jar 包，从初

Matplotlib笔记 · 绘图区域的结构和子图布局与划分（figure, axes, subplots)

很多时候，我们需要将多张关系密切的图表放在一起展示，便于分析师比对差异或发现关联关系，这时候，我们就需要将画布切分成多个子区域，然后在选定的子区域上绘制需要的图表了。Matplotlib对于绘制区域是这样设计的：首先要有一张画布（figure），然后，我们既可以使用画布的全部幅面来绘制一张图表，也可以将画布切分成多个子区域（axes），在每一个子区域上绘制不同的图表，而第一种情况只是将画布切分为一

#matplotlib #python

TPC-C 、TPC-H、TPC-DS和SSB测试基准（Benchmark）介绍

TPC是一个非盈利组织，致力于定义事务处理和数据库benchmark，其提供了面向不同应用场景的多种Benchmark: https://www.tpc.org/information/benchmarks5.asp下图是对几个主要的benchmark的汇总：接下来，我们着重介绍一上最广泛讨论的四种Benchmark.面向OLTP测试，也就是测试关系型数据库的数据集。面向OLTP测试，也就是测试分

Flink CDC 的 debezium-json 格式和 debezium 原生格式是一回事吗？

这是一个很容易混淆和误解的问题，值得拿出来讨论对比一下。我们知道 Debezium 是专门用于捕获 CDC 数据的开源框架，它对接了多种数据库，同时也定义了自己的 CDC 数据交换格式，也就是常说的 `debezium` 格式。而Flink CDC 复用了 Debezium 的部分功能，也就是说：Debezium 是 Flink CDC 的底层采集工具，Flink CDC 的工程依赖会用使用到 D

#flink

使用 iperf 和 iftop 测试网络带宽

有时候，我们需要确切地知道服务器在当前网络环境下所能达到的上行和下行的网络带宽是多少，这对于测试一些上传或下载的作业效率非常重要。我们以位于AWS VPC 环境中的 EC2 为例，介绍一下如何实测出 EC2 节点所能达到的最大带宽。我们以 m5.4xlarge 这一机型为例，根据 AWS 官方文档的介绍：https://aws.amazon.com/ec2/instance-types/m5/，该

#测试

HBase 超大表迁移、备份、还原、同步演练手册：全量快照 + 实时同步（Snapshot + Replication）不停机迁移方案

本文首发于Apache HBase公众号。介绍的演练操作源于某真实案例，用户有一个接近 100 TB 的 HBase 数据库，其中有一张超大表，数据量约为数十TB，在一次迁移任务中，用户需要将该 HBase 数据库迁移到 Amazon EMR 上。本文将讨论并演示：使用全量快照 + 实时同步（Snapshot + Replication）的方式将一个数十TBHBase 单表不停机迁移数据到一个

#hbase #数据库 #大数据

Sklearn超参调优手段：网格搜索（Grid Search）和随机搜索（Randomized Search）

超参调优是“模型调优”（Model Tuning)阶段最主要的工作，是直接影响模型最终效果的关键步骤，然而，超参调优本身却是一项非常低级且枯燥的工作，因为它的策略就是：不断变换参数值，一轮一轮地去“试”，直到找出结果最好的一组参数。显然，这个过程是可以通过编程封装成自动化的工作，而不是靠蛮力手动去一遍一遍的测试。为此，Sklearn提供了多种（自动化）超参调优方法（官方文档），其中网格搜索（Gri

#sklearn

vsftpd 配置:chroot_local_user与chroot_list_enable详解

很多情况下，我们希望限制ftp用户只能在其主目录下（root dir）下活动，不允许他们跳出主目录之外浏览服务器上的其他目录，这时候我就需要使用到chroot_local_user,chroot_list_enable,chroot_list_file这三个选项了。以下是对三个配置项的解释：chroot_local_user #是否将所有用户限制在主目录,YES为启用 NO禁用.(该项默认值是NO

共 35 条

请选择