logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

聚类——监督学习与无监督学习

机器学习的常用方法,主要分为有监督学习(supervised learning)和无监督学习(unsupervisedlearning)。监督学习,就是人们常说的分类,通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就

#算法
bilibili视频批量下载

看到B站一个机器学习的系列视频,为节约时间,想将视频下载后加速观看,视频太多,一个个下载太费事,研究了一下通过程序得到所有的下载连接,直接放迅雷中批量下载。下载起始页面https://space.bilibili.com/97678687/#/video?tid=0&page=1&keyword=&order=pubdate(我需下载的内容)在URL

#爬虫
hive 配置参数说明

hive.exec.mode.local.auto决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行)truehive.exec.mode.local.auto.inputbytes.max如果 hive.exec.mode.local.auto 为 true,当输入文件大小小于此阈值时可以自动在本地模式运行,默

到底了