
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2.3 基于IDEA开发第一个MapReduce大数据程序WordCount开源地址 https://github.com/wangxiaoleiAI/big-data卜算子·大数据 目录开源“卜算子·大数据”系列文章、源码,面向大数据(分布式计算)的编程、应用、架构——每周更新!Linux、Java、Hadoop、Spark、Sqoop、hive、pig、hbase、z...
1.Pipeline大数据架构(create by 王小雷)Pipeline大数据架构,面向大数据仓库和大数据处理平台。是基于lambda的大数据架构的变种,增加了企业级服务,而并非只是大数据组件的对切,是一种更落地的方案。如同骨架之间使用软骨连接起来一样,是一个完整可执行的架构设计。形成Pipeline架构。Pipeline大数据架构由一个源、四个层(1+4)组成。2.数据源数据源...
概述:基于Docker的TensorFlow机器学习框架搭建和实例源码解读,TensorFlow作为最火热的机器学习框架之一,Docker是的容器,可以很好的结合起来,为机器学习或者科研人员提供便捷的机器学习开发环境,探索人工智能的奥秘,容器随开随用方便快捷。源码解析TensorFlow容器创建和示例程序运行,为热爱机器学者降低学习难度。默认机器已经装好了Docker(Docker安装和使用可以看
参加完2017CCAI,听完各位专家的演讲后受益匪浅。立志写“人工智能之机器学习”系列,此为开篇,主要梳理了机器学习算法体系,人工智能相关趋势,Python与机器学习,以及结尾的一点感想。抱着一颗严谨学习之心,有不当之处欢迎斧正。
1.什么是雪花模型 Snowflake schema雪花模型是多维数据库中的表的逻辑排列方式,使得实体关系图类似于雪花形状。雪花模型由连接到多个维度的集中式事实表组成。“Snowflaking”是一种在星型模型中规范化维度表的方法。 当它沿着所有维度表完全标准化时,结果结构类似于雪花,其中事实表位于中间。雪花背后的原理是通过删除低基数属性和形成单独的表来对维度表进行规范化。雪花模型类似于星型模..
SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序,2. BY语句,DATA步中,BY语句规定分组变量,用于控制SET,MERGE,UPDATE或MODIFY语句。BY<DESCENDING>variable-1<...<DESCENDING>variable-n><NOTSORTED><GROUPFOR
SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制1.各种循环与控制DO组创建一个执行语句块DO循环根据下标变量重复执行DO和END之间的语句DO WHILE重复执行直到条件为假则退出循环DO UNTIL重复执行直到条件为真则退出循环DO OVER对隐含下标数组元素执行DO/END之间的语
SAS学习笔记之《SAS编程与数据挖掘商业案例》(5)SAS宏语言、SQL过程1. 一个SAS程序可能包含一个或几个语言成分:DATA步或PROC步全程语句SAS组件语言(SCL)结构化查询语言(SQL)SAS宏语言2. 宏触发:% 是一个宏语句或宏函数;&是一个宏变量引用3.局部宏变量:一般程序定义的为宏变量。全局宏变量:使用%global语句或通过data步接口子程序产生宏变
SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理1. SAS变量操作的常用语句ASSIGNMENT创建或修改变量SUM累加变量或表达式KEEP规定在数据集中保留的变量DROP规定在数据集中删除的变量ARRAY定义一个数组RENAME重命名数据集变量LENGTH
SAS进阶《深入解析SAS》之SAS数据挖掘的一般流程1. 所谓数据挖掘,是指通过对大量的数据进行选择、探索与建模,来揭示包含在数据中以前不为人所知的模式或规律,从而为商业活动或科学研究提供帮助和服务。2. 数据挖掘重要的两个类别:有监督分析(SupervisedAnalysis),无监督分析(UnsupervisedAnalysis)。有监督分析属于目标导向(GoalDirected)型分析。无







