logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据工程师修炼笔记

想要成为大数据工程师?你需要掌握以下知识(上) 文|林肯公园(拒绝任何不标明来源的转载)国际数据公司IDC预测,到2020年,企业基于大数据计算分析平台的支出将突破5000亿美元,大数据解决方案在未来四年中,帮助全球企业分享大约1.6万亿美元新增收入的数据红利。数联寻英近日发布的首份《大数据人才报告》显示,目前全国大数据人才只有46万,未来3到5年人才缺口达150万之多。根据麦

国内物联网平台初探(五) ——机智云IoT物联网云服务平台及智能硬件自助开发平台

平台定位机智云平台是致力于物联网、智能硬件云服务的开放平台。平台提供了从定义产品、设备端开发调试、应用开发、产测、运营管理等覆盖智能硬件接入到运营管理全生命周期服务的能力。机智云平台为开发者提供了自助式智能硬件开发工具与开放的云端服务。通过傻瓜化的工具、不断增强的SDK与API服务能力最大限度降低了物联网硬件开发的技术门槛,降低研发成本,提升开发者的产品投产速度,帮助开发者进行硬件智能化升

win10完美去除快捷方式小箭头的方法

1.去掉小箭头reg add "HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows\CurrentVersion\Explorer\Shell Icons" /v 29 /d "%systemroot%\system32\imageres.dll,197" /t reg_sz /ftaskkill /f /im explorer.exe

R语言中的缺失值处理

作者 Selva Prabhakaran译者 钱亦欣在处理一些真实数据时,样本中往往会包含缺失值(Missing values)。我们需要对缺失值进行适宜的处理,才能建立更为有效的模型,使得后续预测分析能有更小的偏差。本文将罗列不同的缺失值处理方法,并进行具体应用。数据准备和缺失模式设定本文使用mlbench包中的BostonHousing数据集作为示例来演示不同的缺失值处理方法。由于原始的数据集

【机器学习Machine Learning】资料大全

昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^)  推荐几本好书:1.Pattern Recognition and Machine Learning (by Hastie, Tibshirani, and Friedman's )2.Elements of Statistical Learning(by Bishop's)  这

R 数据导入读取read.table函数详解

【R】数据导入读取read.table函数详解,如何读取不规则的数据(fill=T)函数 read.table 是读取矩形格子状数据最为便利的方式。因为实际可能遇到的情况比较多,所以预设了一些函数。这些函数调用了 read.table 但改变了它的一些默认参数。注意,read.table 不是一种有效地读大数值矩阵的方法:见下面的 scan 函数。一些需要考虑到问题是:编码问题如果文件中包含非-A

关于Ubuntu中Could not get lock /var/lib/dpkg/lock解决方案

在Ubuntu中,有时候运用sudo  apt-get install 安装软件时,会出现一下的情况E: Could not get lock /var/lib/dpkg/lock - open (11: Resource temporarily unavailable)E: Unable to lock the administration directory (/var/lib/dpk

方向分布(标准差椭圆)

点模式的分析中,一般会考察如下五种内容: 1、点的疏密,包括点数据的分布探索,是否一致、均匀或者不均匀。 2、点的方位,包括点的分布和方向。 3、点的数量:多少(极值和均值)。 4、点的大小:代表的含义(如点一个点代表多少人口)。 5、其他,如点的一些动态变化等。(关于点数据分析的其他详细的内容,请看虾神以前的文章,或者再公众号里面回复“点分析”) 

Docker容器和主机如何互相拷贝传输文件

docker cp :用于容器与主机之间的数据拷贝。语法docker cp [OPTIONS] CONTAINER:SRC_PATH DEST_PATH|-docker cp [OPTIONS] SRC_PATH|- CONTAINER:DEST_PATHOPTIONS说明:-L :保持源目标中的链接实例将主机./RS-MapReduce

阿里开源首款自研科学计算引擎 Mars

日前,阿里巴巴正式对外发布了分布式科学计算引擎 Mars 的开源代码地址,开发者们可以在Github上获取源代码并参与开发。Mars 突破了现有大数据计算引擎的关系代数为主的计算模型,将分布式技术引入科学计算/数值计算领域,极大地扩展了科学计算的计算规模和效率。目前已应用于阿里巴巴及其云上客户的业务和生产场景。下面,我们将详细介绍Mars的设计初衷和技术架构,希望和大家共同交流探讨。G...

    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择