logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Elasticsearch分词

分词(Tokenization)是将连续文本切分成有意义的词元(Token)的过程。索引如何构建:文档被拆分成什么词条存储到倒排索引中查询如何执行:用户搜索词如何被解析并与索引匹配相关性如何计算:搜索结果排序的依据# IK词典目录结构 config/├── extra_main.dic # 主扩展词典 ├── extra_single_word.dic # 单字扩展词典 └── extra_sto

#elasticsearch#大数据
Airbyte 数据同步

CDC 全称 Change Data Capture 这是一种数据集成技术,用于捕获数据库中的变更(插入、更新、删除操作),并将这些变更实时地传输到数据仓库、数据湖或其它数据平台中。在处理数据库迁移过程中,可以考虑在第一次全量同步之后直至割接之前,使用此技术持续同步增量部分的数据,本文将介绍开源 CDC 工具 Airbyte。

文章图片
#kubernetes#database#云计算 +1
elastisearch安装和运维常用API

elasticsearch 是一个文档型数据库,在 k8s 运维中,通常和 kibana 和 fluentd 结合作为 k8s 上的日志数据库,本文将介绍 elasticsearch 的搭建和一些运维时常用的 api。

文章图片
#运维#elasticsearch#kubernetes +3
arm 架构 Centos 如何配置 yum 源

目前很多国产服务器都是 arm 的 CPU,本文将介绍如何配置 arm 版本的 CentOS 的 yum 镜像。

文章图片
#arm开发#centos#linux
elastisearch安装和运维常用API

elasticsearch 是一个文档型数据库,在 k8s 运维中,通常和 kibana 和 fluentd 结合作为 k8s 上的日志数据库,本文将介绍 elasticsearch 的搭建和一些运维时常用的 api。

文章图片
#运维#elasticsearch#kubernetes +3
ubuntu安装chrony时间管理软件

chrony 是一个开源软件包,用于在 Linux 和其他类 Unix 系统上实现时间同步。本文将介绍如何再 ubuntu 使用 chrony 搭建一个 NTP 服务器。

文章图片
#ubuntu#linux#运维
使用 iptables 限制 Docker 容器端口访问

在 Docker 环境中,容器的端口映射可能会暴露在宿主机的网络接口上,导致安全隐患。为了加强安全性,我们可以通过配置iptables来限制对 Docker 容器端口的访问。本文将深入探讨如何使用iptables的链来实现这一目标,并解析其默认规则的含义。

文章图片
#docker#eureka#容器
Project-HAMi:异构 AI 计算虚拟化中间件

HAMi(前身为 ‘k8s-vGPU-scheduler’)是一个面向 Kubernetes 的异构设备管理中间件。它可以管理不同类型的异构设备(如 GPU、NPU、MLU、DCU 等),实现异构设备在 Pod 之间的共享,并基于设备拓扑和调度策略做出更优的调度决策。HAMi 旨在消除不同异构设备之间的差异,为用户提供统一的管理接口,无需对应用程序进行任何修改。

#人工智能#中间件#云原生 +1
到底了