logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

python交互式脚本

用于es生成ssl认证证书:安装pexpect,ptyprocess模块编写脚本使用pexpect[root@master bin]# vim python.sh#!/usr/bin/env pythonimport pexpectdef main():c1 = pexpect.spawn('./elasticsearch-certutil ca')c1....

es实战-rebalance功能及源码解析

rebalance tasks在es集群里面的表现形式:通过调用 GET _cat/tasks?v API返回结果中 action 为 internal:index/shard/recovery/start_recovery(不仅仅是rebalance)判断shards移动状况:通过调用 GET _cat/recovery?v API返回结果中 type 为 peer;source_node 和

#elasticsearch
es实战-数据备份snapshot

灾备相关知识点RPO: 最多可能丢失的数据的时长,即我们可以将数据恢复到什么时候,并且越接近现在(崩溃/丢失点)越好。RTO: 从灾难发生到整个系统恢复正常所需要的最大时长。好的RPO实现: 频繁增量备份好的RTO实现: 加快从快照恢复数据速度ES snapshot 注意事项可在kibana的Snapshot and Restore功能模块进行操作不同快照间为增量式快照(节约时间空间),且删除一个

#elasticsearch#大数据#big data
es实战-加载性能优化

本文主要讨论es加载速度的优化,有些优化会导致部分功能及数据安全性丧失,需要理性使用。网络中大部分的性能优化方案基本源于官网,如下位置:以下优化包含但不限于官方文档:整体写入操作影响因子:1. indice相关设置{"settings": {"number_of_shards": n,//分片尽量设置多一些,能提高加载速度"number_of_replicas": 0,//副本设置为0,丧失数据安

#elasticsearch
es实战-深入内存以及熔断

在 ES 生产环境中,性能问题一直是各厂商最头疼的问题,而其中的痛点就是内存相关。ES 作为当前搜索引擎市场的 No.1,其显著特点就是检索速度非常快。之所以 ES 检索速度快,离不开其底层的合理存储结构以及对内存的充分利用,其中包括大量的缓存。由于 ES 和其底层依赖的 Lucene 均为内存的使用大户,在生产环境中经常会遇到一些内存相关的问题以及想要优化的欲望,本文主要浅析 ES 内存使用情况

#elasticsearch
ES 向量检索 dense_vector 类型

ES 7.X 版本引入了向量类型dense_vector,用于存储浮点类型的密集向量,其最大维度为2048。其用作是可以将待查询向量和文档内存储向量之间的距离作为查询评分使用,即越相似的向量评分越高。使用方式为在 query 的script_score中指定向量的计算方式,具体有四种:cosineSimilarity – 余弦函数dotProduct – 向量点积l1norm – 曼哈顿距离l2n

#elasticsearch
Flink 消费 Kafka 分区顺序性问题

1. kafka分区数据顺序性kafka具有分区内数据有序的特点,可以通过将数据指定到特定的分区来实现数据的顺序性。kafka分区逻辑代码如下:如果指定了分区号生产,则发送到指定分区;否则调用分区器计算方法partitioner.partition()private int partition(ProducerRecord<K, V> record, byte[] serialized

#kafka#flink
到底了