logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【复杂网络系列】模块度(Modularity )的计算方法

Modularity Measure(模块化度量值),由Newman等人提出,是目前常用的一种衡量网络中社区稳定度的方法。如上图所示,我们将这个图以图中两根横线为方式进行划分,共得三个社区(community),其中红色,绿色以及蓝色的点各为一个社区。这里我们采用的计算公式为:Q=∑(I/E-((2I+O)/2E)**2)。在上式中I表示两个端点

【机器学习系列】SVD奇异值分解(python代码)

说明NumPy有一个称为linalg的线性代数工具箱。本文主要介绍如何使用该工具箱实现矩阵的SVD处理。参考《机器学习实战》P255代码#coding:utf-8from numpy import *def loadData():return [[1,1,1,0,0],[2,2,2,0,0],

#机器学习#python
【机器学习系列】机器学习界大牛林达华推荐的书籍

Recommended BooksHere is a list of books which I have read and feel it is worth recommending to friends who are interested in computer science.Machine LearningPattern Recognition and M

文章图片
#机器学习
【python系列】numpy中的tile函数

tile函数        在看机器学习实战这本书时,遇到numpy.tile(A,B)函数,愣是没看懂怎么回事,装了numpy模块后,实验了几把,原来是这样子:重复A,B次,这里的B可以时int类型也可以是远组类型。>>> import numpy>>> numpy.tile([0,0],5)#在列方向上重复[0,0]5次,默认行1次array([0, 0, 0, 0

#python
【机器学习系列】看懂信息检索和网络数据挖掘领域论文的必备知识总结

信息检索和网络数据领域(WWW, SIGIR, CIKM, WSDM, ACL, EMNLP等)的论文中常用的模型和技术总结引子:对于这个领域的博士生来说,看懂论文是入行了解大家在做什么的研究基础,通常我们会去看一本书。看一本书固然是好,但是有一个很大的缺点:一本书本身自成体系,所以包含太多东西,很多内容看了,但是实际上却用不到。这虽然不能说是一种浪费,但是却没有把有限力气花在刀口上。

数据挖掘方向牛人(Business Intelligence, KDD and Data Mining People)

Business Intelligence, KDD and Data Mining People OrganizationCountryAchim HoffmannUniversity of New South WalesAustraliaAd FeeldersUniversiteit UtrechtThe Neth

#数据挖掘
【数据挖掘系列】7种alga的预测

7种alga(水藻)的预测这一节我们尝试完成对140个样品中7种alga的预测,2.7节我们使用来了一些筛选最好模型的方法,通过交叉检验过程,我们可以根据无偏估计NMSE对7个预测任务的模型进行评价。本次数据挖掘过程的主要任务是完成对140个样品中7种alga的预测,任何一个预测任务我们都会选择交叉检验中得分最好的模型进行预测,我们可以通过bestScores()函数来快速获得模型

#数据挖掘#机器学习
机器学习&数据挖掘笔记_20(PGM练习四:图模型的精确推理)

机器学习&数据挖掘笔记_20(PGM练习四:图模型的精确推理)      转自:http://www.cnblogs.com/tornadomeet  前言:  这次实验完成的是图模型的精确推理。exact inference分为2种,求边缘概率和求MAP,分布对应sum-product和max-sum算法。这次实验涉及到的知识点很多,不仅需要熟悉图模型的represe

文章图片
【机器学习系列】机器学习界大牛林达华推荐的书籍

Recommended BooksHere is a list of books which I have read and feel it is worth recommending to friends who are interested in computer science.Machine LearningPattern Recognition and M

#机器学习
到底了