logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Python数据分析之fit,fit_transform和transform

最近学习了sklearn中数据的标准化其实出了fit_transform函数概述1. fit()fit函数主要用来计算一组数据的特征值,例如平均值,方差,中位数等等固定属性。2.transformtransform这个函数主要是就是进行标椎化,降维,归一化等操作3.fit_transformfit_transform这个函数主要就是将上述fit函数和transform函数结合起来一步操作,例如标椎

#python#数据分析
python数据结构之排序

????上次学习了搜索的算法后,给我印象最深的当然就是hash搜索,学习完搜索之后最为重要的就是排序算法了,对以往内容感兴趣的同学可以查看以下内容????:python数据类型: python数据结构之数据类型.python的输入输出: python数据结构之输入输出、控制和异常.python数据结构之面向对象: python数据结构之面向对象.python数据结构之算法分析: python数据结

#数据结构#python#排序算法
阿里云MaxComputer SQL学习之DML

????上一节中,我们介绍了阿里云MaxComputer中的数据定义语言,这一节中,我们将学习数据操作语言。对往期内容感兴趣的小伙伴可以查看如下内容????:第一篇: Hadoop之Hive数据的导入与导出(DML).第二篇: Hadoop之Hive查询语句.第三篇:Hadoop之Hive的7种Join语句.第四篇: Hadoop之Hive的排序.第五篇: Hadoop之Hive的分区表.第六篇:

#阿里云#sql#大数据
python机器学习之(sklearn)岭回归

1.岭回归今天看了会L2正则化,大致的意思就是在惩戒函数中加入高次项的惩戒项,用来减小线性回归中高次项的系数,避免过拟合的状态。这样就产生了一种具有正则化的线性回归模型------岭回归。2.岭回归在sklearn中的apisklearn.linear_model.Ridge(alpha=1.0)#具有正则化的线性最小二乘法#alpha 表示正则化力度#coel_ 表示回归系数from sklea

#机器学习#python
Hadoop学习之大数据概论

1.大数据的概念大数据:是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。一般来说就是指存储数据在TB、PB、EB量级的数据。主要解决海量数据的采集、存储和分析计算的问题。数据量大产生速度快数据类型多样:结构化(数据库/文本)和非结构化数据(网络日志、音频、视频、图片、地理位置等

#hadoop#大数据
阿里云MaxComputer SQL学习之DDL

???? 今天我们介绍一下大数据引擎MaxComputer的一些特点,以及MaxComputer SQL的一些特点。有对hive sql 感兴趣的同学可以查看下面的内容????:第一篇: Hadoop之Hive数据的导入与导出(DML).第二篇: Hadoop之Hive查询语句.第三篇:Hadoop之Hive的7种Join语句.第四篇: Hadoop之Hive的排序.第五篇: Hadoop之Hiv

#hadoop#阿里云#sql
spark学习之执行计划explain

本文主要介绍了spark的执行计划explain的使用方法,以及对逻辑执行计划和物理执行计划进行了说明,让大家更加了解spark的运行原理。

#大数据#spark
tensorflow2.0搭建神经网络

tensorflow2.0中主要通过tf.keras搭建神经网络这节我们就来介绍一下搭建神经网络的步骤和函数搭建神经网络的基本步骤#第一步导入api1.import tensorflow as tf#第二步分割数据集为训练集和测试集2.train,test#第三步是搭建合适的网络模型(前向传播过程)3.model=tf.keras.models.Sequential#第四步是配置训练方法,选择训练

#深度学习#tensorflow
hadoop大数据优化之数据倾斜

一直想写一篇关于数据倾斜的问题,面试必问,可自己又没有碰见过,一直难以下手,最近公司大佬讲述了一节关于数据倾斜的课程,对数据倾斜有了更深的理解,于是想记录一下。

#hadoop#spark#big data
    共 114 条
  • 1
  • 2
  • 3
  • 12
  • 请选择