logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Disruptor深度源码解析以及实践案例

Disruptor是一种高性能无锁消息队列框架,其核心采用环形数组(RingBuffer)作为数据结构,通过序号(Sequence)管理实现生产者和消费者的高效通信。关键技术包括:CAS操作、内存屏障和缓存行填充,支持单/多生产者和消费者模式。主要组件包括:RingBuffer(环形队列)、Sequencer(序号管理)、EventHandler(事件处理器)和WaitStrategy(等待策略)

#java#中间件#数据库
Elasticsearch向量检索实践

Elasticsearch 8.x+支持向量检索功能,通过knn_vector字段存储高维向量(如128-768维),结合HNSW等算法实现KNN相似度查询。文章详细介绍了向量索引设计、数据写入方法、混合检索(结合结构化/全文查询)及性能优化建议,并提供了Python示例代码。同时阐述了向量生成技术(如BERT、CLIP模型)和与大模型集成的RAG应用场景,最后给出OpenAI+Milvus的实战

#elasticsearch#大数据#搜索引擎
Elasticsearch向量检索实践

Elasticsearch 8.x+支持向量检索功能,通过knn_vector字段存储高维向量(如128-768维),结合HNSW等算法实现KNN相似度查询。文章详细介绍了向量索引设计、数据写入方法、混合检索(结合结构化/全文查询)及性能优化建议,并提供了Python示例代码。同时阐述了向量生成技术(如BERT、CLIP模型)和与大模型集成的RAG应用场景,最后给出OpenAI+Milvus的实战

#elasticsearch#大数据#搜索引擎
向量数据库详解

向量数据库是专为存储和检索高维向量(数值数组)而优化的数据库,广泛应用于AI语义检索、推荐系统等场景。与传统数据库不同,它通过相似度查找(如ANN算法)实现高效检索,支持混合查询(向量+结构化数据)。主流产品包括Milvus、Faiss等,具有分布式扩展、高性能索引等特点。典型操作包括向量插入、相似度搜索等,常与LLM结合实现RAG等智能应用。部署方式灵活,支持Docker、K8s等,提供多语言S

#数据库
MongoDB慢查询锁机制及相关优化

MongoDB慢查询分析与优化指南 摘要:本文系统介绍了MongoDB慢查询的分析与优化方法。首先讲解了慢查询原理,通过Profiler记录操作日志,并详细说明配置方法(临时/永久设置阈值)。重点阐述了查看慢查询日志的多种方式,包括system.profile集合查询和日志文件分析。针对慢查询优化,提出了建立合理索引、使用explain分析、优化查询语句、分页与排序优化等实用建议。最后介绍了锁机制

#mongodb#数据库
Java Instrumentation详解

Java Instrumentation是Java提供的动态修改类字节码的API,主要用于性能监控、代码覆盖率、AOP和安全检查等场景。其核心是通过Java Agent在JVM启动或运行时加载,利用Instrumentation接口和ClassFileTransformer实现字节码修改。典型应用包括方法耗时统计、代码覆盖率收集等。开发时需注意类重定义限制和字节码修改风险,常用ASM、Javass

#java#python#开发语言
Java Instrumentation详解

Java Instrumentation是Java提供的动态修改类字节码的API,主要用于性能监控、代码覆盖率、AOP和安全检查等场景。其核心是通过Java Agent在JVM启动或运行时加载,利用Instrumentation接口和ClassFileTransformer实现字节码修改。典型应用包括方法耗时统计、代码覆盖率收集等。开发时需注意类重定义限制和字节码修改风险,常用ASM、Javass

#java#python#开发语言
MySQL InnoDB索引详解

InnoDB索引类型包括主键索引、辅助索引、唯一索引、组合索引等,底层采用B+树结构,主键索引存储整行数据,辅助索引存储主键值需"回表"查询。优化建议包括:主键使用自增整型、高选择性字段优先索引、遵循最左前缀原则构建联合索引、避免索引失效场景等。提供了索引创建、查看和删除等实用命令,以及EXPLAIN分析SQL执行计划的方法。

#mysql#数据库
数据湖仓技术

数据湖是一种存储海量原始数据的系统,支持结构化、半结构化及非结构化数据,采用"先存后用"模式。其架构包含数据采集、存储、处理、元数据管理和消费层,具备多样性、可扩展性、低成本及灵活性等特点,适用于大数据分析、AI及数据科学场景。与数据仓库相比,数据湖存储原始数据且成本更低,但查询性能较弱。主流技术包括HDFS、Amazon S3、Spark等。未来趋势包括湖仓一体、云原生及智能

#数据仓库#big data
Python基础开发

本文提供Python编程入门指南,涵盖基础语法到高级应用。主要内容包括:环境搭建(Python安装、IDE选择)、基础语法(变量、数据类型、流程控制)、常用数据结构(字符串、列表、字典)、函数与模块、文件操作与异常处理。进阶部分介绍面向对象编程、装饰器与生成器、网络编程(socket/requests/aiohttp)、异步编程(asyncio)、Web开发和单元测试等。文章还包含代码风格规范、虚

#python#开发语言
到底了