logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据中台技术组件

元数据管理:开源的Netflix的Metacat、Apache的Atlas,商业化的产品Cloudera Navigator。任务调度:Oozie,Azakaban,AirFlow,DolphinScheduler等。在线实时分析:ClickHouse,Kylin,Doris,Druid,Kudu等。数据计算:MapReduce,Spark,Flink。资源调度:YARN,Mesos,Kubern

#java#开发语言
GBDT+LR算法入门理解

CTR估计也就是广告点击率预估,计算广告训练与平滑思想说明了是用LR算法对于预测的有效性。LR(Logistic Regression)是广义线性模型,与传统线性模型相比,LR通过Logit变换将函数值映射到0~1区间,映射后的函数就是CTR的预估值。LR模型十分适合并行化,因此对于大数据的训练十分有效。但是对于线性模型而言,学习能力是有限的,因此需要大量的特征工程预先分析出有效的特征或者是特征组

linux使用nload查看网卡流量

nload 的官方网站为: http://www.roland-riegel.de/nload/在 CentOS 下,nload 目前就只能基于源代码进行编译安装了。默认安装的 CentOS ,要编译安装 nload 时,可能还需要安装几个需要的软件包:gcc 、gcc-c++ 和 ncurses-develyum install gcc gcc-c++ ncurses-devel

XGBoost:二分类问题

二分类问题本文介绍XGBoost的命令行使用方法。Python和R的使用方法见https://github.com/dmlc/xgboost/blob/master/doc/README.md。下面将介绍如何利用XGBoost解决二分类问题。以下使用的数据集见mushroom dataset简介产生输入数据XGBoost的输入数据格式和LibSVM一样。下面是XGB

NVDIA GPU参数列表: 3090,4090, A40, A30,V100, A100, A800性能参数

而据英伟达的说法,新的 A800 可以替代 A100,两者都是 GPU(图形处理单元)处理器。芯片经销商 OMNISKY 容天官网介绍的英伟达 A800 GPU 信息显示,新的芯片数据传输速率为每秒 400GB,低于 A100 的每秒 600GB,代表了数据中心的性能明显下降。NVIDIA A100 GPU采用全新Ampere安培架构的超大核心GA100,7nm工艺,542亿晶体管,826平方毫米

文章图片
#深度学习#自然语言处理
Eclipse查看jar包源码

Java Decompiler Plugin For Eclipse IDE1. 下载JAD , 1.5.8版本的jad在 http://www.softpedia.com/progDownload/JAD-Download-85911.html将展开后的jad.exe放到某个目录,例如D:\jadnt158\jad.exe2. 下载JADClipse插件ht

python切分apache日志文件

1、使用python将文件切分为两个文件#!/usr/bin/env python# -*- coding:UTF-8 -*-import os,sysN = 0.8lines = open('access_2013.log','r').readlines()#读取文件lines_for_b = int(len(lines)*N)#计算行数open('a.t

使用python脚本备份crontab定时任务

近期打算备份下服务器crontab任务,以防个人失误,清空定时任务,其实我觉得shell脚本更简单,但是想练习下python,决定使用python脚本进行,前提执行主机做好对其他节点服务器ssh免秘钥登录vi crontab_back.py#!/usr/bin/env python# -*- coding : UTF-8 -*-# Author : CuiLei# Date: 201

使用sklearn优雅地进行数据挖掘

目录1 使用sklearn进行数据挖掘  1.1 数据挖掘的步骤  1.2 数据初貌  1.3 关键技术2 并行处理  2.1 整体并行处理  2.2 部分并行处理3 流水线处理4 自动化调参5 持久化6 回顾7 总结8 参考资料1 使用sklearn进行数据挖掘1.1 数据挖掘的步骤  数据挖掘通常包括数据采集,数据分析,特

python数据分析5:双色球 两个红球哪组合比例高

统计两个红球,哪个组合最多,显示前19组数据#!/usr/bin/python# -*- coding:UTF-8 -*-#导入pandas、numpy、matplotlib、operator包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport operator#读取文件df

#python#数据分析#数据挖掘
暂无文章信息