logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

有监督学习-----支持向量机(含python实现代码)

支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器;SVM的的学习策略就是间隔最大化,SVM的的学习算法就是求解凸二次规划的最优化算法。SVM的实现中,最流行的一种实现是序列最小优化(Sequential Minimal Optimization, SMO)。SVM可以使用核函数(kernel)的方式,可以对

#支持向量机
监督学习--逻辑回归

逻辑回归(Logistic Regression,LR)是分类常用的算法。逻辑回归在西瓜书中又被称为对数几率回归。进行分类的主要思想是:根据现有数据对分类边界线建立回归公式,以此进行分类。训练分类器时的做法就是寻找最佳拟合参数,使用的是最优化算法。适合数据类型:数值型优点:计算代价不高,易于理解和实现缺点:容易欠拟合,分类精度可能不高原理正负类区分正负类没有明确区分,但是按经验来说负类(0):一般

#机器学习#python#逻辑回归
利用Python进行数据分析(中文第一版)

​通过对《利用Python进行数据分析》这本中文书的学习,了解和掌握了很多python相关知识,将自己编写的脚本和数据集附上。​由于我用的是python3.6版本,用书中有些地方会报错,所以,我的代码中会有相关修改,保证运行成功!数据集+脚本点这里环境说明系统:Win10python版本:3.6数据集说明​数据集多集中在‘datasets.rar’压缩包中,具体包括以下数据集:具体章节​主要包括以

#python#数据分析
在windows x64上安装CRFPP并进行地址识别【亲测有效】--python自然语言处理实战

安装CRFPP在百度网盘上下载CRF+±0.58链接:点这里提取码:peub在windows x64上安装,需要在\CRF+±0.58\python\中,运行下面两个语句pythonsetup.py buildpython setup.py install说明:python setup.py install 有可能会遇到权限不足的问题, 需要换成管理员模式安装验证是否安装成功,如果导入后没有报错,

文章图片
#python#自然语言处理
中文分词算法之--最大匹配法

中文分词算法之–最大匹配法​前段时间研究了如何用分词工具进行分词,但是分词中涉及的一些算法,不太了解,所以,准备这段时间专攻分词算法原理,大家有补充,或者建议,欢迎留言。1. 最大匹配法(Maximum Matching)​最大匹配法是指以词典为依据,取词典中最长词长度作为第一次取字数量的长度,在词典中进行扫描。例如:词典中最长词为“中华人民共和国”共7个汉字,则最大匹配起始字数为7...

#自然语言处理#算法
朴素贝叶斯原理【详细介绍,一文看懂】

贝叶斯分类算法是统计学是一种概率分类方法,朴素贝叶斯分类时贝叶斯分类中最简单的一种。利用贝叶斯公式根据某特征的先验概率计算出其后延概率,然后选择具有最大后延概率的类作为该特征所属的类。朴素贝叶斯,称之为“朴素”,是因为整个形式化过程只做了最原始、最简单的假设,具体假设如下:特征之间相互独立每个特征同等重要1. 概率相关先验概率: 比如向女生表白成功的概率是20%,记为P(A)=20%条件概率:在事

#机器学习#python
python自然语言处理--安装JDK和Stanford Parser

1. 安装JDK和设置JAVA_HOME在windows系统上安装JDK和设置JAVA_HOME的步骤如下:下载JDK,点这里,选择相应的JDK,并单击"Download"安装JDK将JDK安装在您的计算机上,例如: C:\Program Files\Java\jdk1.6.0_02 下,如果需要,也可以安装在其他位置安装完成后,设置JAVA_HOME右键点击“我的电脑”,然后选择“属性”在“高级

#python
python+Pysesseract+Tesseract-OCR中文图像识别

python+Pysesseract+Tesseract-OCR中文图像识别最近在研究中文图像识别的内容,发现需要安装一些软件,尤其是要下载并安装Tesseract-OCR,安装后遇到了很多bug(坑),一直运行不了代码,终于查了多好资料,搞定了。如果运行脚本报错,一定是你忘记重启电脑了。为了大家安装调试能顺利,避免这些坑,决定写一篇文章来介绍整个流程。如果某些地方不明白,可以留言,一一为大家..

#python
Pycharm 设置默认文件头

在Pycharm中创建py文件时,希望每次能自动添加默认文件头。打开Pycharm后,按照如下进行设置:File -> settings -> Editor -> File and Code Templates -> Python Script找到Python Script选项,然后将以下内容添加进文本框,点击 ok 即可:# !/usr/bin/env python# -

到底了