logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【机器学习】数据预处理 - 归一化和标准化

处理数据之前,通常会使用一些转换函数将特征数据转换成更适合算法模型的特征数据。这个过程,也叫数据预处理。归一化是常用的预处理方式之一,就是把数据转换到 0~1 之间。

文章图片
#机器学习#人工智能
【机器学习】分类算法 - KNN算法(K-近邻算法)KNeighborsClassifier

K-近邻算法的核心思想是根据「邻居」来「推断」你的类别。

文章图片
#机器学习#算法#分类
【机器学习】分类算法 - 模型选择与调优GridSearchCV(网格搜索)

网格搜索也叫超「参数搜索」,比如K-近邻算法的K值需要手动指定参数,这种参数就叫超参数。网格搜索通过预设几组超参数组合,每组超参数都用交叉验证进行评估,从而选出「最优」的参数组合来建立模型。sklearn 模块 GridSearchCV 很好的实现了网格搜索,它可以自动调参,只要把参数输进去,就能给出最优的结果和参数。

文章图片
#机器学习#分类#人工智能
中国BI,敢于开源

一直以来国内的同学想找一个方便好用的开源BI都不是一件易事,国外的页面不好修改,国内的基本都收费,现在有了润乾开源BI了,同学们可以去试一下了,润乾是做报表起家,是报表行业的领头羊,报表功能好,BI功能也不差,还天然弥补了BI缺少报表能力的短板润乾报表的新老用户,遍布各行各业,已经有很多在用润乾的开源BI了,因为报表自带BI,直接集成到系统里,改改页面,就成了自己系统的BI模块了。

#开源#大数据#云原生
《最强大模型平台上线,被很多行业“盯”上了》

千帆大模型平台是面向企业开发者的一站式大模型开发及服务运行平台,也是百度智能云推出的全球首个一站式企业级大模型平台。在提供全套文心大模型服务的基础上,还支持第三方开源大模型、各种AI开发工具和整套开发环境。

文章图片
#机器学习#人工智能
【机器学习】sklearn数据集的使用,数据集的获取和划分

机器学习是人工智能的一个实现途径,可以从「数据」中自动分析获得「模型」,并利用模型对未知数据进行「预测」。简单来说就是从历史数据中总结规律,用来解决新出现的问题。从数据中总结规律,需要提供一个「数据集」,数据集由「特征值」和「目标值」两部分组成。

文章图片
#人工智能#机器学习#分类
【机器学习】特征工程 - 字典特征提取

特征工程就是从「原始数据」中提取「特征」,以供「算法」和「模型」使用。简单来说就是将任意数据(比如文本和图像)转换为可用于机器学习的数字特征。

文章图片
#机器学习#人工智能#网络安全
【机器学习】分类算法 - 模型选择与调优GridSearchCV(网格搜索)

网格搜索也叫超「参数搜索」,比如K-近邻算法的K值需要手动指定参数,这种参数就叫超参数。网格搜索通过预设几组超参数组合,每组超参数都用交叉验证进行评估,从而选出「最优」的参数组合来建立模型。sklearn 模块 GridSearchCV 很好的实现了网格搜索,它可以自动调参,只要把参数输进去,就能给出最优的结果和参数。

文章图片
#机器学习#分类#人工智能
【机器学习】数据预处理 - 归一化和标准化

处理数据之前,通常会使用一些转换函数将特征数据转换成更适合算法模型的特征数据。这个过程,也叫数据预处理。归一化是常用的预处理方式之一,就是把数据转换到 0~1 之间。

文章图片
#机器学习#人工智能
【机器学习】特征降维 - 主成分分析PCA

主成分分析(Principal Component Analysis,PCA), 是一种「统计」方法。通过正交变换将一组可能存在「相关性」的变量转换为一组「线性不相关」的变量,转换后的这组变量叫「主成分」。

文章图片
#机器学习#人工智能
暂无文章信息