logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Spark安装配置2_class

1 . 进入kafka 目录, 启动 Zookeeper。验证 Spark 是否安装成功。

#spark#大数据#分布式
Spark数据分析1_环境配置

Linux│├─ Java│├─ Hadoop│├─ MySQL│├─ Kafka│这是Spark / Flink / 大数据课程实验的基础环境。

#spark#数据分析#大数据
python数据挖掘基础

array / arange / linspace / zeros / ones / random / dtype / ndim / shape / 索引切片 / sort / 数组运算 / 统计函数。

#python#数据挖掘#numpy
Python数据挖掘之回归问题

#1. 什么是回归问题?回归问题的核心目标是学习一个函数fff,使得给定输入特征XXX,能预测出对应的连续输出YYY。这与分类问题不同,分类问题输出离散类别(如“狗”或“猫”),而回归问题输出连续数值(如房价、温度、销售额等)。回归问题在机器学习中非常常见,涉及到预测连续数值型目标。理解不同模型的特点、损失函数和训练方法,有助于根据具体任务选择合适的模型,提升预测效果。“波士顿房价数据集”是经典的

#数据挖掘#python#回归
Python数据挖掘之基础分类模型_支持向量机(SVM)

支持向量机是一种监督学习算法,主要用于分类(如将数据分为两个类别)和回归(预测连续值)任务。它的核心思想是:在数据中找到一个“最佳的分割界线”或“超平面”,使得不同类别的样本被尽可能清楚地划分开,而同时最大化两个类别之间的“间隔”或“边界”。换句话说,SVM试图找出一种分类方式,不仅能够正确分割所有训练数据,还能在未知数据上拥有较好的泛化能力。线性支持向量机(Linear SVM)是一种通过寻找一

#支持向量机#数据挖掘#python
Python数据挖掘之数据预处理

一、 数据预处理的理由在现实应用中,原始数据往往直接来源于企业业务系统、传感器、用户输入或网络采集等多种渠道。这类数据通常存在以下问题:不完整性:部分属性缺失,导致数据无法完整反映对象特征。不一致性:同一对象在不同数据源中的描述可能不一样。冗余性:不同来源的数据存在重复,影响分析效率。噪声与错误:包括异常值、录入错误或不合理的取值。规模庞大:数据量巨大,直接挖掘会导致计算开销过高。因此,数据预处理

#python#数据挖掘#开发语言
Python数据挖掘之数据探索

简要来说,数据探索(Data Exploration)是指在数据分析和数据挖掘的早期阶段,通过多种方法对原始数据进行初步的理解和分析,以掌握数据的基本特征和结构。具体包括以下几个方面:统计描述:计算基本统计指标,如均值、中位数、众数、方差、标准差、最大值、最小值等。查看数据的集中趋势和离散程度。数据分布规律:利用直方图、密度曲线、箱线图等可视化工具,观察数据的分布形态(正态分布、偏态、双峰分布等)

#python#数据挖掘#人工智能
Python数据挖掘之 scikit-learn(简版)

scikit-learn(简称sklearn)是一个基于Python的开源机器学习库,其设计目标是让机器学习变得更简单、更高效。自2007年由法国INRIA研究所的David Cournapeau首次提出并开发以来,scikit-learn经历了多次版本更新,逐步成为数据科学和人工智能领域最受欢迎的工具之一。

#python#数据挖掘#scikit-learn
数据挖掘/机器学习常用数据集

UCI 红酒品质数据集简介数据集名称:Wine Quality Data Set来源:由葡萄酒化学分析数据组成,收集自葡萄酒制造商。数据公开在UCI机器学习仓库中。数据集概述目的:预测红酒的品质评分(quality),根据其化学属性。数据特征:包含11个连续型的化学特性和一个品质评分标签。特征(输入变量)fixed acidity(固定酸)volatile acidity(挥发酸)citric a

#数据挖掘#机器学习#人工智能
树莓派控制舵机

模块作用树莓派产生 PWM 控制信号PWM 信号告诉舵机转到哪个角度(脉宽编码)舵机内部电路解码信号 → 比较反馈电位器位置 → 调整电机角度外部电源提供足够电流驱动舵机项英文全称主要作用缺点P快速响应容易超调IIntegral消除稳态误差易振荡DDerivative抑制超调、平稳系统对噪声敏感。

#单片机#嵌入式硬件
    共 39 条
  • 1
  • 2
  • 3
  • 4
  • 请选择