logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Java设计模式——工厂模式

前言工厂模式是一种比较常见的创建模式。有时,可能你使用了工厂模式而你却还不知道你已经使用了它。至少我感觉下面说的第一种简单工厂模式,你是已经很熟悉了。并且是经常使用的。不信,就继续向下看。版权说明著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。本文作者:Q-WHai发表日期: 2016年4月14日本文链接:https://qwhai.blog.cs...

#设计模式
从 WordCount 到 MapReduce 计算模型

虽然现在都在说大内存时代,不过内存的发展怎么也跟不上数据的步伐吧。所以,我们就要想办法减小数据量。这里说的减小可不是真的减小数据量,而是让数据分散开来。分开存储、分开计算。这就是 MapReduce 分布式的核心。

#mapreduce#分布式#大数据
从 WordCount 到 MapReduce 计算模型

虽然现在都在说大内存时代,不过内存的发展怎么也跟不上数据的步伐吧。所以,我们就要想办法减小数据量。这里说的减小可不是真的减小数据量,而是让数据分散开来。分开存储、分开计算。这就是 MapReduce 分布式的核心。

#mapreduce#分布式#大数据
数据挖掘:基于朴素贝叶斯分类算法的文本分类实践

如果你想对一个陌生的文本进行分类处理,例如新闻、游戏或是编程相关。那么贝叶斯分类算法应该正是你所要找的了。贝叶斯分类算法是统计学中的一种分类方法,它利用概率论中的贝叶斯公式进行扩展。下面我们就针对朴素贝叶斯分类算法,进行原理浅析和文本分类实践。

#分类#数据挖掘
数据挖掘:基于TF-IDF算法的数据集选取优化

前言:此前在做一个关于文本分类的小调研。本人使用的是基于朴素贝叶斯的文本分类算法,关于朴素贝叶斯的文本分类更多的内容,请参见《数据挖掘:基于朴素贝叶斯分类算法的文本分类实践》.不过在做朴素贝叶斯的时候,我遇到一个问题。因为贝叶斯的算法有一个阶段是关于数据训练的,这个用于训练的数据集是一个比较头疼的问题。要怎么选择这些数据集呢?人工手打上去吗?是不是有一点不太实际。下面,我就基于这一...

#数据挖掘
Android开启adb

最近在学习Android开发,用的开发工具是Eclipse。不过,也不知道从什么时候起开起虚拟机进行程序发布的时候出现了错误,错误是说我的ADB没开启,提示信息:The connection to adb is down, and a severe error has occured.然后上网查了一下,我们可以这样来解决:1. 我们把我们的Eclipse和虚拟机都关闭;2. 打开PC的

#android#adb
VHD(Virtual Hard Disk)的解析(上篇)——PyVinil的使用

VHD 是Microsoft Virtual Hard Disk format(微软虚拟磁盘文件)的简称。可以由Microsoft Virtual PC2007,Windows Vista,Windows 7/8,Hyper-V,Windows Server 2008R2/2012,Microsoft Virtual Server 2005等创建,Virtual Box,VMWare等可以挂载使用

#虚拟机
使用MySQL Workbench远程管理工具进行远程管理Mysql的错误及解决办法

最近要使用MySQL Workbench远程管理工具进行远程管理虚拟机上的MySQL。可是,在配置的过程中,遇到了一些问题,下面是这个问题(HOSt ip is not allowed to connect to this MySql server)的描述以及解决办法。

#mysql
HBase Shell 的基本操作

前面写了一些 Hadoop, Zookeeper 及 Hbase 分布式环境搭建的文章。或许你在搭建的过程中遇到了一些不如意的事情,但我相信总是可以解决的。如果你已经完成了环境的搭建,那么就可以尽情玩耍了。

#hbase#hadoop#大数据 +1
Linux下的一些问题收集及解决方法(二)

这篇博客主要是针对博主在学习Linux的过程中遇到的一些问题,对这些问题进行记录和解决的过程。所以此文会一直更新下去。

    共 13 条
  • 1
  • 2
  • 请选择