
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
from numpy import *from sklearn.datasets import load_iris# import datasets# load the dataset: irisiris = load_iris()samples = iris.data#print samplestarget = iris.target# import the
preface:最近所忙的任务需要用到排序,同仁提到SVMrank这个工具,好像好强大的样纸,不过都快十年了,还有其他ranklib待了解。原文链接:SVMrank,百度搜索svm rank即可。SVMrank基于支持向量机的排序作者::Thorsten Joachims 康奈尔大学计算机系版本号:1.00日起:2009年3月21总览
preface:做着最近的任务,对数据处理,做些简单的提特征,用机器学习算法跑下程序得出结果,看看哪些特征的组合较好,这一系列流程必然要用到很多函数,故将自己常用函数记录上。应该说这些函数基本上都会用到,像是数据预处理,处理完了后特征提取、降维、训练预测、通过混淆矩阵看分类效果,得出报告。1.输入从数据集开始,提取特征转化为有标签的数据集,转为向量。拆分成训练集和测试集,这里不多讲,在
最近NLP课程,需要做新词发现与新词
preface:不知不觉在终端下学习干活一年多,终端开多了成了习惯,之前嫌麻烦没用分屏,而当真正用起来比想象中的简单,终端下的分屏命令tmux及vim自带分屏命令vsp都相当不错,加快干活效率。1、终端分屏tmux功能:提供了强劲的、易于使用的命令行界面。可横向和纵向分割窗口。窗格可以自由移动和调整大小,或直接利用四个预设布局之一。支持 UTF-8 编码及
preface:工作中使用python进行处理常会遇到各种问题及技巧,为此汇总。python功能太多,记住常用即可。环境:python3.7及以上、macpython——pip、conda、ipython常用1:创建虚拟环境(从一个爸爸创造多个儿子,各个儿子之间环境不影响,同一个服务器上自己的python环境不被其他人干扰,自己的多个人可采用不同版本tensorflow包等等)which cond
提高效率:善用工具、刻意练习。preface:偶然想用vim的插件,搜了下打算安装jedi,后面不可收拾,发现插件贼香,便删了sublime,一切代码都从vim,真正觉悟vim的强大。vim插件太多,常用即可。知晓相关配置即可前置环境:mac、pythonvim:用系统自带的不够用vim --version(只提示支持python2,不支持python3)需要brew install vim安装(
环境Macjava1.8Maven一、调用pom依赖<dependency><groupId>edu.stanford.nlp</groupId><artifactId>stanford-corenlp</artifactId><version&
安装:$ pip install python-Levenshtein$ ipython>>> import Levenshteinlinux环境下,没有首先安装 python_Levenshtein ,用法如下:重点介绍几个该包中的几个计算 字串相似度 的几个函数实现。1. Levenshtein.hamming(str1, str2)计算 汉明距离。
preface: 忙于最近的任务,需要用到libsvm的一些命令,如在终端运行javasvm_train train_file model_file. pythonsubset.py file train_num train_file test_file等命令,但file的准备又是通过python写好的,file需要是libsvm能够接受的格式,故用python写好特征,转为libsvm







