logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

两种数据仓库分层实例

数据仓库分层,目前见到的两种分层:分层一标准的数据仓库分层:ods(临时存储层),pdw(数据仓库层),mid(数据集市层),app(应用层)ods:历史存储层,它和源系统数据是同构的,而且这一层数据粒度是最细的,这层的表分为两种,一种是存储当前需要加载的数据,一种是用于存储处理完后的数据。pdw:数据仓库层,它的数据是干净的数据,是一致的准确的,也就是清洗后的数据,它的数据一般都...

#数据仓库
Fuel 9.0安装Openstack网络验证失败解决

故障现象网络验证失败,报错信息如下:Repo availability verification using public network failed on following nodes Untitled (99:1b).Following repos are not available - http://archive.ubuntu.com/ubuntu/, http://mirr

《TensorFlow 2.0深度学习算法实战教材》学习笔记(一、人工智能绪论)

人工智能绪论人工智能,机器学习,神经网络,深度学习之间关系机器学习分类机器学习可以分为有监督学习(Supervised Learning)、无监督学习(UnsupervisedLearning)和强化学习(Reinforcement Learning)有监督学习 有监督学习的数据集包含了样本????与样本的标签????,算法模型需要学习到映射????????: ???? → ????,其中????

混淆矩阵与精确度、召回率、F1 Score

1、计算公式从混淆矩阵计算精确度、召回率、F1 Score的过程如下图所示,其中P和R即Precision和Recall:2、验证实验如下图为Azure ML自带的一个示例给出的模型评分结果:原始计算结果给出了混淆矩阵与Accuracy、精确度、召回率和F1 Score,图中插入的文字给出了这些评估值的计算过程,计算过程一目了然:

#机器学习
Python从文本构建词典

背景信息本文实现基于输入英文文本的词典构建功能,构建的词典的key为文本中出现的单词,对应的value按如下规律取值:输入文本中词频最大的词对应的value取值为0,词频次最大的取值为1,依次类推,词频最低的词的value的取值为(字典的长度-1)。本文主要是为之后词向量训练做准备工作。说明:如果输入为英文文本,则可以直接处理;如果是中文文本,则需要先进行分词等预处理工作,并且最终输出的字典中,k

常见机器学习算法分类及名称

机器学习算法类型缩写全称中文名称分类NNNeural Network神经网络 Decision Tree决策树SVMSupport Vector Machine支持向量机 XGBoostXGBoostRFRandom Forest随机森林LR...

#机器学习
工业41大类

工业(41)采矿业(7)煤炭开采和洗选业石油和天然气开采业黑色金属矿采选业有色金属矿采选业非金属矿采选业开采专业及辅助性活动其他采矿业制造业(31)农副食品加工业食品制造业酒、饮料和精制茶制造烟草制品业纺织业纺织服装、服饰业皮革、毛皮、羽毛及其制品和制鞋业木材加工和木、竹、藤、棕、草制品业家具制造业造纸和纸制品业印刷和记录媒介复制业文教、工美、体育和娱乐用品制造业石油、煤炭及其他燃

#机器学习
sklearn训练模型、保存模型文件(文本、pkl)、模型文件转换(pkl2onnx)以及模型可视化

1.使用环境IDE:Jupyter Lab,使用Python2 kernel实现模型可视化:GraphViz,可以直接在jupyter中使用;Netronwindow版本模型转化:在onnx/onnx-ecosystem容器中进行2.代码创建并训练模型import matplotlib.pyplot as plt%matplotlib inlineimport...

#sklearn
Python机器学习数据预处理:读取txt数据文件并切分为训练和测试数据集

背景信息在使用Python进行机器学习时,经常需要自己完成数据的预处理,本节主要实现对txt文本数据的读取,该文本满足如下要求:每行为一条样本数据,包括特征值与标签,标签在最后样本数据的特征值之间以及标签之间使用,分割文本末尾无空行(在人为编辑过程中很容易在末尾加入空行,要检查并删除)本文先给出实现代码,最后以Iris数据集为例说明如何使用。代码实现# 引入所需包import numpy as .

#机器学习
Python中Numpy数组的归一化处理

背景介绍在对机器学习的数据进行预处理时,往往都需要归一化,从而避免因特征值范围不同而造成学习结果偏差。本节给出Python中将Numpy数组实现(0,1)归一化的代码,其它种类的归一化再遇到时再进行补充。所谓(0,1)归一化,就是通过遍历feature vector里的每一个特征值的数据,将Max和Min的记录下来,并通过Max-Min作为基数(即Min=0,Max=1)进行数据的归一化处理。详细

    共 51 条
  • 1
  • 2
  • 3
  • 6
  • 请选择