logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

spark机器学习-分类回归总结

1.spark支持的分类包括以下几个场景:a.二分类,顾名思义就是只分成A和B两类b.多分类分成A,B,C,D等多个分类不支持多标签分类,所谓的多标签分类是指一个样本可以属于多个分类,也就是比如样本X既属于A分类又属于B分类,spark目前不支持分类的算法主要有逻辑回归分类算法,决策树,随即森林等,不管是哪种算法,不同点主要在于支持的分类数量和样本数量的限制不同,评价分类算法的好坏的标志主要是看准

#spark#机器学习#分类
kafka性能高的影响因素

1.使用操作系统的页缓存kafka的性能非常依赖于操作系统的页缓存,页缓存提供了比kafka进程内存更好的缓存方式。2.零拷贝(linux的sendfile函数,对应FileChannel.transferto函数)正常的从磁盘发送数据到网络要经过一下几个步骤:a.把数据从磁盘读取到内核的read buffer内存中b.把内核read buffer内存的数据读取到应用程序的用户内存uer buff

#kafka
Hbase架构图及数据存储格式

hbase架构图hbase数据存储格式hbase存储

文章图片
#hbase#数据库#大数据
mybatis打印sql日志

sql打印日志mybatis打印日志mybatis支持打印日志到logback中

文章图片
#mybatis#sql#数据库
    共 18 条
  • 1
  • 2
  • 请选择