
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
分布式系统(distributed system)正变得越来越重要,大型网站几乎都是分布式的。分布式系统的最大难点,就是各个节点的状态如何同步。CAP 定理是这方面的基本定理,也是理解分布式系统的起点。CAP原则又称CAP定理,它是在1998年,由加州大学的计算机科学家 Eric Brewer 提出,分布式系统有三个指标指的是在一个分布式系统中, Consistency(一致性)、 Availab
1. scala的版本选择. 请先到spark安装目录下 lib中查看此版本spark支持的scala版本.从上图可知,我的spark 2.0 的scala版本为 2.11.8.2。 到idea中创建项目,并设定当前的idea的版本.如果不是这个版本,可以在线通过idea的sbt自动下载一下,但请注意,这个下载会很慢,可以配置一下sbt的仓库位置( sbt的插件其实就是一个包管理工具,例如 jav
# coding: utf-8# 使用花瓣测量数据绘制 2D散点图,并绘出决策边界import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn import datasetsfrom sklearn.neighbors import
# coding: utf-8# 使用萼片测量数据绘制 2D散点图,并绘出决策边界import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapfrom sklearn import datasetsfrom sklearn.neighbors import
#!/usr/bin/env python2# -*- coding: utf-8 -*-#检测系统用户路径import oshome_folder=os.path.expanduser("~")print("user's path {0}".format(home_folder))#拼接数据集位置data_folder=os.path.join(home_folder,"Dat
#%load python_8_2.py此命令以加载本脚本到到ipython中# coding: utf-8from sklearn import datasetsiris=datasets.load_iris()#数据集描述信息iris.DESCR#iris数据集的数据iris.data#以上总共150组数据,对应以下150个结果iris.target#0
接上一篇,使用 oneR算法来实现iris分类. # coding: utf-8#使用oneR算法来实现iris分类#参考:http://www.cnblogs.com/htynkn/archive/2012/04/14/2446905.html#算法思路: 根据已有数据中,具有相同特征值的个体最可能属于哪个类别进行分类.#oneR是one rule(一条规则)的简写, 表示
K-近邻分类器完成分类
#%load python_8_1.py此命令以加载本脚本到到ipython中# coding: utf-8from sklearn import datasetsiris=datasets.load_iris()#数据集描述信息iris.DESCR#iris数据集的数据iris.data#以上总共150组数据,对应以下150个结果iris.target#0
# coding: utf-8#使用PCA(principal component analysis主成分分析法)减少系统的维数( 因为以上四个测量数据减少到三个后,就可以使用3D散点图更好的描述)#PCA可以保留足以描述各数据点特征的信息,其中新生成的各维叫主成分.#scikit-learn库中的fit_transform()函数就是用来降维处理的.#PCA对象简介 :http: