logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘基本算法

数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。R语言博大精深,吸纳了来自各方的挖掘算法包,这些包都是由统计学家或是算法研究人员提供,我们可以站在这些伟人的肩膀上实现算法的应用。下面对常用的数据挖掘包做一个汇总:连续因变量的预测:stats包lm函数,实现多元线性回归stats包 glm函数,实现广义线性回归stats包 nls函数,实

#数据挖掘
Tableau 不同数据源的join

http://community.tableausoftware.com/ideas/1113

hadoop报 No route to host

这是由于我在工作环境中频繁使用VPN 然而在hosts 文件中固化了ip ,导致在本机的ip更改了之后没有更新hosts 里面的IP 导致了没有办法识别虚拟机中的namenode,将hosts的IP更新,此问题化解

主机不联网时和vitrualbox虚拟机通信

主机:ubuntu虚拟:virualbox(4台ceontos虚拟机)原来所有的虚拟及全部之配置一个网卡选择桥接的方式,但是虚拟机中的网卡有时候无法启动,索性在增加一块网卡,重启虚拟机后,多出一个网卡eth1(原来的是eth0),启动eth1成功,但是为了设置静态IP,到/etc/sysconifg/network-scripts中新建ifcfg-eth1,内容如下:DEVIC

python main 函数

模拟一个类似java的main函数:1. 可以看出如果单独执行时先进入main[root@hadoop Desktop]# cat hongrao.py#! /usr/bin/python# this is test main function by hongraodef hongrao():    name="weihongrao"    prin

MR python joiner

继承http://blog.csdn.net/weihongrao/article/details/16826763 把上次得出的数据在和group维度表进行关联得到group名称mapper:joinm#!/usr/bin/pythonimport sysclass mapper:    def map(self):        for line in

到底了