logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍

1、Spark Streaming简介1.1 概述Spark Streaming 是Spark核心API的一个扩展,可以实现高吞吐量的、具备容错机制的实时流数据的处理。支持从多种数据源获取数据,包括Kafk、Flume、Twitter、ZeroMQ、Kinesis 以及TCP sockets,从数据源获取数据之后,可以使用诸如map、reduce、join和window等高级函数进行复杂算

#spark#大数据
NIO学习笔记

NIO 从 JDK1.4  才开始有:JDK1.7 推出 NIO 2.0在JDK1.4推出Java NIO之前,基于Java的所有Socket通信都采用了同步阻塞模式(BIO),这种一请求一应答的通信模型简化了上层的应用开发,但是在性能和可靠性方面却存在着巨大的瓶颈因此,在很长一段时间里,大型的高性能服务端应用程序都采用C或者C++语言开发,因为它们可以直接使用操作系统提供的异步I/O或者AIO能

Spark与Pandas中DataFrame对比(详细)

 PandasSpark工作方式单机single machine tool,没有并行机制parallelism不支持Hadoop,处理大量数据有瓶颈分布式并行计算框架,内建并行机制parallelism,所有的数据和操作自动并行分布在各个集群结点上。以处理in-memory数据的方式处理distributed数据。支持Hadoop,能处理大量数据延迟机制not lazy-evaluatedlazy

Java中 VO、PO、DO、DTO、BO、QO、DAO、POJO的概念

PO(persistant object) 持久对象在 o/r 映射的时候出现的概念,如果没有 o/r 映射,没有这个概念存在了。通常对应数据模型 ( 数据库 ), 本身还有部分业务逻辑的处理。可以看成是与数据库中的表相映射的 java 对象。最简单的 PO 就是对应数据库中某个表中的一条记录,多个记录可以用 PO 的集合。 PO 中应该不包含任何对数据库的操作。DO(Domain

#java
十大算法,让你轻松进阶高手

算法一:快速排序算法快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序n个项目要Ο(nlogn)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(nlogn)算法更快,因为它的内部循环(innerloop)可以在大部分的架构上很有效率地被实现出来。快速排序使用分治法(Divideandconquer...

#算法#数据结构#排序算法
jQuery学习和知识点总结归纳

1、jQuery简介jQuery是一个实用的JavaScript库。jQuery极大地简化了JS对DOM的操作,实现一些常用的方法,jQuery还可以链式操作。2、jQuery的基本用法//引入jQuery文件,可以本地也可以远程//当文档完成加载完时触发,避免获取dom对象时,dom对象还没有加载$(document).ready(function(){//写js语句或者j

#jquery#javascript
Linux文件与目录的三种时间状态(mtime,atime,ctime)区别

1. mtime(modify time):最后一次修改文件或目录的时间2. ctime(change time) :最后一次改变文件或目录(改变的是原数据即:属性)的时间如:记录该文件的inode节点被修改的时间。touch命令除了-d和-t选项外都会改变该时间。而且chmod,chown等命令也能改变该值。3. atime(access time)::最后一次访问文件或目录的时间

#linux
人工智能最全图谱

在过去的几个月中,我一直在收集有关人工智能的相关资料。随着各种的问题被越来越频繁的提及,我决定整理并分享有关人工智能、神经网络、机器学习、深度学习与大数据的技术合辑。同时为了内容更加生动易懂,本文将会针对各个大类展开详细解析。神经网络机器学习机器学习: Scikit-learn 算法此部分内容可以帮助你解决机器学习中最难的部分,即找到正确的估计器(Estimator)。下图可帮助快速查找文档与简介

#人工智能#AI#机器学习 +1
Java中 VO、PO、DO、DTO、BO、QO、DAO、POJO的概念

PO(persistant object) 持久对象在 o/r 映射的时候出现的概念,如果没有 o/r 映射,没有这个概念存在了。通常对应数据模型 ( 数据库 ), 本身还有部分业务逻辑的处理。可以看成是与数据库中的表相映射的 java 对象。最简单的 PO 就是对应数据库中某个表中的一条记录,多个记录可以用 PO 的集合。 PO 中应该不包含任何对数据库的操作。DO(Domain

#java
机器学习算法岗常见笔试面试题整理

数据库中的主键、索引和外键(数据分析岗经常问)决策树ID3和C4.5的差别?各自优点?Boost算法CART(回归树用平方误差最小化准则,分类树用基尼指数最小化准则)GBDT与随机森林算法的原理以及区别。优化算法中常遇到的KKT条件?作用是?最近邻算法KNN(分类与回归)L1和L2函数?L1和L2正则项的比较,如何解决 L1 求导困难?L1正则为何可把系数压缩成0,说明坐标下降法的具体实现细节LR

#机器学习#算法
    共 42 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择