
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据挖掘主要分为4类,即预测、分类、聚类和关联,根据不同的挖掘目的选择相应的算法。R语言博大精深,吸纳了来自各方的挖掘算法包,这些包都是由统计学家或是算法研究人员提供,我们可以站在这些伟人的肩膀上实现算法的应用。下面对常用的数据挖掘包做一个汇总:连续因变量的预测:stats包lm函数,实现多元线性回归stats包 glm函数,实现广义线性回归stats包 nls函数,实
http://community.tableausoftware.com/ideas/1113
这是由于我在工作环境中频繁使用VPN 然而在hosts 文件中固化了ip ,导致在本机的ip更改了之后没有更新hosts 里面的IP 导致了没有办法识别虚拟机中的namenode,将hosts的IP更新,此问题化解
主机:ubuntu虚拟:virualbox(4台ceontos虚拟机)原来所有的虚拟及全部之配置一个网卡选择桥接的方式,但是虚拟机中的网卡有时候无法启动,索性在增加一块网卡,重启虚拟机后,多出一个网卡eth1(原来的是eth0),启动eth1成功,但是为了设置静态IP,到/etc/sysconifg/network-scripts中新建ifcfg-eth1,内容如下:DEVIC
模拟一个类似java的main函数:1. 可以看出如果单独执行时先进入main[root@hadoop Desktop]# cat hongrao.py#! /usr/bin/python# this is test main function by hongraodef hongrao(): name="weihongrao" prin
继承http://blog.csdn.net/weihongrao/article/details/16826763 把上次得出的数据在和group维度表进行关联得到group名称mapper:joinm#!/usr/bin/pythonimport sysclass mapper: def map(self): for line in







