韩王-信个人主页

@jixianqiuxue

韩王-信

2023-06-27 08:44:01 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

数据挖掘基本算法

数据挖掘主要分为4类，即预测、分类、聚类和关联，根据不同的挖掘目的选择相应的算法。R语言博大精深，吸纳了来自各方的挖掘算法包，这些包都是由统计学家或是算法研究人员提供，我们可以站在这些伟人的肩膀上实现算法的应用。下面对常用的数据挖掘包做一个汇总：连续因变量的预测：stats包lm函数，实现多元线性回归stats包 glm函数，实现广义线性回归stats包 nls函数，实

#数据挖掘

Tableau 不同数据源的join

http://community.tableausoftware.com/ideas/1113

hadoop报 No route to host

这是由于我在工作环境中频繁使用VPN 然而在hosts 文件中固化了ip ，导致在本机的ip更改了之后没有更新hosts 里面的IP 导致了没有办法识别虚拟机中的namenode，将hosts的IP更新，此问题化解

主机不联网时和vitrualbox虚拟机通信

主机：ubuntu虚拟：virualbox（4台ceontos虚拟机）原来所有的虚拟及全部之配置一个网卡选择桥接的方式，但是虚拟机中的网卡有时候无法启动，索性在增加一块网卡，重启虚拟机后，多出一个网卡eth1（原来的是eth0）,启动eth1成功，但是为了设置静态IP，到／etc/sysconifg/network-scripts中新建ifcfg-eth1,内容如下：DEVIC

python main 函数

模拟一个类似java的main函数：1. 可以看出如果单独执行时先进入main[root@hadoop Desktop]# cat hongrao.py#! /usr/bin/python# this is test main function by hongraodef hongrao(): name="weihongrao" prin

MR python joiner

继承http://blog.csdn.net/weihongrao/article/details/16826763 把上次得出的数据在和group维度表进行关联得到group名称mapper：joinm#!/usr/bin/pythonimport sysclass mapper: def map(self): for line in

到底了