无限大地NLP_空木个人主页

@u010454729

无限大地NLP_空木

2023-12-22 18:50:22 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

《机器学习实战》笔记之八——预测数值型数据：回归

第八章预测数值型数据：回归8.1 用线性回归找到最佳拟合曲线假设输入数据存放在矩阵X中，而回归系数存放在向量w中，那么对于给定的数据X1，预测结果将会通过Y1=X1.T×w给出。如何找出误差最小的W，一般采用平方误差最小，即最小二乘法。平方误差可以写做：用矩阵表示还可以写做（y-x*w）.T*(y-x*w)。如果对w求导，得到x.T*(y-xw)，令其等于

#机器学习 #python #线性回归 +2

python中threading模块详解（一）

threading提供了一个比thread模块更高层的API来提供线程的并发性。这些线程并发运行并共享内存。下面来看threading模块的具体用法：一、Thread的使用目标函数可以实例化一个Thread对象，每个Thread对象代表着一个线程，可以通过start()方法，开始运行。这里对使用多线程并发，和不适用多线程并发做了一个比较：首先是

SVMrank——Support Vector Machine for Ranking(SVMrank——使用svm的排序)

preface：最近所忙的任务需要用到排序，同仁提到SVMrank这个工具，好像好强大的样纸，不过都快十年了，还有其他ranklib待了解。原文链接：SVMrank，百度搜索svm rank即可。SVMrank基于支持向量机的排序作者：:Thorsten Joachims 康奈尔大学计算机系版本号：1.00日起：2009年3月21总览

#搜索

python sklearn包——混淆矩阵、分类报告等自动生成

preface：做着最近的任务，对数据处理，做些简单的提特征，用机器学习算法跑下程序得出结果，看看哪些特征的组合较好，这一系列流程必然要用到很多函数，故将自己常用函数记录上。应该说这些函数基本上都会用到，像是数据预处理，处理完了后特征提取、降维、训练预测、通过混淆矩阵看分类效果，得出报告。1.输入从数据集开始，提取特征转化为有标签的数据集，转为向量。拆分成训练集和测试集，这里不多讲，在

#算法 #机器学习

eclipse设置java虚拟机内存大小

最近NLP课程，需要做新词发现与新词

python——工作常用包合集

preface：工作中使用python进行处理常会遇到各种问题及技巧，为此汇总。python功能太多，记住常用即可。环境：python3.7及以上、macpython——pip、conda、ipython常用1：创建虚拟环境（从一个爸爸创造多个儿子，各个儿子之间环境不影响，同一个服务器上自己的python环境不被其他人干扰，自己的多个人可采用不同版本tensorflow包等等）which cond

#python #自然语言处理 #pytorch

vim工具——常用插件

提高效率：善用工具、刻意练习。preface：偶然想用vim的插件，搜了下打算安装jedi，后面不可收拾，发现插件贼香，便删了sublime，一切代码都从vim，真正觉悟vim的强大。vim插件太多，常用即可。知晓相关配置即可前置环境：mac、pythonvim：用系统自带的不够用vim --version（只提示支持python2，不支持python3）需要brew install vim安装（

#linux #vim #macos

NLP工具——stanford coreNLP NER模块学习

环境Macjava1.8Maven一、调用pom依赖<dependency><groupId>edu.stanford.nlp</groupId><artifactId>stanford-corenlp</artifactId><version&

python-Levenshtein几个计算字串相似度的函数解析

安装：$ pip install python-Levenshtein$ ipython>>> import Levenshteinlinux环境下，没有首先安装 python_Levenshtein ，用法如下：重点介绍几个该包中的几个计算字串相似度的几个函数实现。1. Levenshtein.hamming(str1, str2)计算汉明距离。

#python

python调用shell命令之三大方法

preface: 忙于最近的任务，需要用到libsvm的一些命令，如在终端运行javasvm_train train_file model_file. pythonsubset.py file train_num train_file test_file等命令，但file的准备又是通过python写好的，file需要是libsvm能够接受的格式，故用python写好特征，转为libsvm

共 11 条

请选择