logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python操作Excel表格,这5个库你一定要知道(附选型建议)

你的文件是.xlsx?→ 用 openpyxl你的文件是.xls?→ 用 xlutils两种格式都有?├─ 能转换格式?→ 全转.xlsx,用 openpyxl└─ 不能转换?→ 用 xlwings(需安装Excel)需要执行宏/复杂公式?→ 用 xlwings经验之谈:很多团队在项目初期没有规范表格处理库的使用,导致后期同一个项目里出现了3-4个不同的表格处理库,排查问题非常痛苦。建议在项目初期

#python#numpy#pandas +1
Embedding相似度的三重博弈:当长度、语义与关键词在向量空间狭路相逢

在RAG系统中,余弦相似度分数常常被盲目迷信。本文通过真实的PostgreSQL检索事故切入,深度剖析文档长度、语义相关性和关键词密度三股力量如何在向量空间中博弈。文章包含可直接运行的Python实验代码,揭示L2归一化的隐藏陷阱,并提出混合相似度策略与多信号融合框架,为RAG系统的Chunk划分、模型选型和阈值设定提供实战参考。

到底了