logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

浅析GBDT+LR

1.前言最近在做的项目中,一直用到了GBDT+LR算法模型来做二分类,好好梳理了下。下面介绍下这个算法。先来解答下面三个问题。GBDT+LR模型是什么:是一种具有stacking思想的二分类器模型,所以可以用来解决二分类问题。这个方法出自于Facebook 2014年的论文 Practical Lessons from Predicting Clicks on Ads at Facebook 。G

#机器学习
TensorFlow和深度学习入门教程(TensorFlow and deep learning without a PhD)

前言上月导师在组会上交我们用tensorflow写深度学习和卷积神经网络,并把其PPT的参考学习资料给了我们, 这是codelabs上的教程:《TensorFlow and deep learning,without a PhD》当然登入需要翻墙,我也顺带巩固下,做个翻译,不好之处请包含指正。当然需要安装python,教程推荐使用python3。如果是Mac,可以参考博主的另外两片博文,Mac下

#深度学习#tensorflow
Spark分布式搭建(2)——ubuntu14.04下修改hostname和hosts

0.前言我搭建的伪分布式是1台Master,3台Worker节点,4台虚拟机都要在管理员root状态下。所以4台都要设置root自动登入,具体内容见博客,在Spark伪分布式搭建(1)——ubuntu14.04 设置root自动登入:http://blog.csdn.net/xummgg/article/details/506305831.修改hostnamehostname就是安装时自己取得机

#ubuntu#spark#分布式 +1
在shell下,用命令将U盘挂载到ubuntu上,并将文件copy到U盘里面

为什么转载:怕自己忘啊首先将鼠标定位到ubuntu上,然后插上U盘,这时候先用指令:fidsk -l查看一下U盘,(这是应该有一个盘符了)(1)有的话就可以跳过此步骤:在虚拟机的VM->snapshot-.>找到你的U 盘符,点击上面的connect(1)如果没有的话,就尽享下面的步骤:首先使用命令查看是那个分区,在U盘插入前后,各使用一次下面的命令cat /proc/part

#ubuntu
Spark学习笔记1-Scala基础语法

1.Scala简介Scala是一门多范式的编程语言,一种类似java的编程语言 ,设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性。java之父JamesGosling也曾说过,在java虚拟机JVM上,他除了用java,其他更多的就是使用scala,可见scala也是十分强大的语言。2基本语法2.1值2.1.1整型scala> 1+2res0: Int

#spark#scala#大数据
Spark学习笔记8-搭建spark的HA(用zookeeper实现spark的高可用)

0.说明我配置的是一个standby节点。如果电脑多建议配置2个standby。1.下载zookeeper下载网址:zookeeper.apache.org我下载的是3.4.6版:用tar命令解压到/usr/local/spark里面:2.配置zookeeper的bin目录在~/.bashrc里面,配置zookeeper的bin目录:3.修改zookeeper配置文件在zoo

#spark#zookeeper
到底了