logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

pkuseg:中文分词这件事,它分得很细

做中文 NLP 系统的开发者,jieba 的准确率已经卡住瓶颈了,换 pkuseg 的领域模型能把分词准确率往上拉几个百分点。这些数字意味着什么?支持新闻、网络、医药、旅游等多个细分领域的预训练模型,分词准确率压过 jieba 和 THULAC,还支持用户自训练模型和词性标注。用默认模型做跨领域对比,pkuseg 在四个测试集上的平均 F-score 是 91.29,THULAC 是 88.08,

#中文分词#自然语言处理#其他
RPA for Python:几行代码替代重复劳动

RPA for Python是一个轻量级自动化工具,通过封装机器人流程自动化功能为Python包(pip install rpa)。它支持网页操作(打开页面、输入点击等)、视觉定位(截图识别元素)、OCR文字识别及键鼠模拟,内置自动等待和10倍速模式,兼容多平台和后台运行。基于TagUI开源项目开发,提供简洁API和丰富示例,适合个人快速实现数据采集、表单填写等重复任务自动化。虽然不适用于企业级复

#rpa#python#开发语言 +1
Locust:用 Python 写压测脚本,27.8K Star

Locust是一款开源的Python性能测试工具,GitHub Star数达27.8K。它采用纯Python编写压测脚本,无需学习特定DSL或使用GUI,支持Git版本控制和CI集成。Locust通过轻量级协程模拟高并发用户,可测试HTTP及其他协议(需扩展),提供实时Web UI展示吞吐量、响应时间等指标,并支持分布式执行。其优势在于Python生态兼容性,允许直接使用Python逻辑(如条件分

#python#开发语言#其他
Cal.diy:43k Star 的开源预约平台,100% MIT 授权

Cal.diy是一款获得43k Star的开源预约平台,基于MIT协议完全开放源代码。作为Cal.com的分支版本,它移除了所有商业功能,提供纯粹的开源解决方案。技术栈采用Next.js、React、tRPC等现代框架,支持与Google Calendar、Zoom等服务的集成。项目支持Docker部署和多种云平台一键安装,适合个人非生产环境使用。开发者可轻松搭建本地开发环境,项目还包含完整的E2

#开源#其他
到底了