logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

命名实体识别

基于规则的命名实体识别简单的分词器(如二元分词器)无法识别OOV,所以需要运用一些规定的规则来辅助识别如:在识别音译人名时,可以设置规则:一旦发现某词是人名,而该词后面跟随人名词时,将他们合并层叠马尔科夫模型实现命名实体识别针对不同情况,需要设计相应的标注集拿人名识别举例输入数据集进行训练后,代码会将人名拆分为碎片,模拟人名的错误切分.接着,检查拆分后的姓名与其前后组成的词是否在辞典中.若在,根据

《机器学习实战》python3代码(5):逻辑回归

逻辑回归的优缺点优点:1.容易实现2.计算量小。对比于knn,实在是太小了缺点:1.容易欠拟合2.处理特征空间很大,多类特征数据的时候不方便,处理非线性特征需要转换逻辑回归思想梯度上升数学原理如下图基本思想是通过一定次数的梯度上升(或者下降)输出经过数次调整的θ矩阵逻辑回归梯度上升算法的构建步骤一数据预处理,将数据和标签分离步骤二确定循环次数,通过上述推导的梯度上升数...

#机器学习#逻辑回归
python连接SQL Server并读取数据,结巴分词处理后写入SQL Server

前一阵子在虚拟机上整MySQL整的有点崩溃,明明已经在入站规则里开放了3306端口和映射端口还是无法外网访问。还好需求从MySQL变成了SQL Server,于是又开始上手SQL Sever。但是SQL Server也不是那么好操作的,新手第一次操作肯定要吃点苦。本机操作半个下午总算完成了任务:读取SQL Server里的数据,结巴分词之后存入新的表中1.首先是pymssql的安装,该库可以使..

#sqlserver#数据库
安装python时需要注意的

因为总是需要在虚拟机上跑python程序, 报错报的都总结出一些经验了在安装python时需要注意两点1.将 python加入 path,这个选项一定要勾选,不然到时候需要用到pip等功能时就需要手动插入路径, 有点麻烦2.务必选择自定义安装,并勾选为所有用户安装不勾选的话可能会遇到一些报错,如无法识别python编辑器...

到底了