logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【ElasticSearch】BM25 深度解析:从概率模型到工程实践

BM25是工业界广泛应用的经典信息检索算法,作为ElasticSearch的默认排序函数,它通过紧凑的公式同时处理词频、逆文档频率和文档长度归一化三个关键因素。其核心公式包含IDF分量和TF分量,其中k1参数控制词频饱和速度,b参数调节文档长度影响。经过TREC评测验证,默认参数k1=1.2和b=0.75在多数场景表现稳定。BM25具有三个显著的结构特征:分子分母差k1、凸组合长度归一化和平滑ID

文章图片
#elasticsearch#大数据
【JAVA】JVM深度剖析:内存模型(JMM)与核心区域详解

本文深入解析JVM内存模型(JMM)的运行时数据区架构,重点剖析堆、栈和方法区/元空间的结构与内存分配机制。线程私有区包括程序计数器、Java虚拟机栈和本地方法栈,具有线程隔离特性;线程共享区包含堆和方法区,是GC主要战场。堆采用分代设计(新生代Eden/Survivor、老年代),通过TLAB、逃逸分析等优化对象分配;方法区在JDK8+由元空间实现,使用本地内存避免OOM。文章结合Mermaid

文章图片
#java#jvm#开发语言
到底了