logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据-Storm流式框架(七)---Storm事务

storm 对于保证消息处理,提供了最少一次的处理保证。最常见的问题是如果元组可以被重发,可以用于计数吗?不会重复计数吗?strom0.7.0 引入了事务性拓扑的概念,可以保证消息仅被严格的处理一次。因此可以以完全精确的、可扩展的、容错的方式处理类似计数这类的情形。跟分布式 RPC 类似,事务性拓扑也不是 storm 的新特性,而仅仅是在 storm 原语如数据流、spout、bolt 和拓扑基础

文章图片
#大数据#storm
华为云云耀云服务器L实例评测使用 | 云耀云服务器L实例Docker可视化Portainer容器管理

1、总体来说,按照教程就能直接使用Portainer,并完成对容器的管理和服务部署2、安装的是英文版本,此处我没搜有没有中文包。最好直接安装中文的3、使用教程和实际安装版本有一定区别,在实际应用时候找不到对应解决方案4、Portainer创建容器的时候有时候报错不好看日志,这点不是很亲和这块技术我还在摸索中,总体来说华为的服务器和镜像还是很方便的,就是使用过程还得逐渐适应。

文章图片
#服务器#运维
阿里云OSS上传图片教程-附案例

阿里云OSS图片上传案例

文章图片
#java
机器学习---环境准备

window安装python,配置python环境变量。安装python后,在环境变量path中加入安装的路径,cmd中输入python,检验python是否安装成功。注意:如果使用的是anaconda安装的python环境,建议安装python3.5.x版本,这个版本和spark1.6兼容。如何在anaconda中安装python3.5.x版本的python环境?参考文档:“Anaconda安装

文章图片
#python#开发语言
机器学习---模型评估

如:拿到第一个样本,该样本真实类别是p,Score=0.9,将0.9看成分类阈值threshold,那么该样本预测是正例,TPR=1/10,FPR=0/10=0,拿到第二个样本,该样本真实类别是p,Score=0.8,将0.8作为threshold,该样本预测是正例,TPR=2/10,FPR=0/10=0 …预测错误的样本标号为:3,7。下图中,如果ROC的图像是通过(0,0)点和(1.1)点的一

文章图片
#机器学习#人工智能#算法
机器学习---垃圾邮件分类案例

依次需要使用pip命令安装numpy、scipy、skikit_learn、matplotlib模块。

文章图片
#机器学习#分类#人工智能
机器学习---决策树和随机森林代码

【代码】机器学习---决策树和随机森林代码。

文章图片
#机器学习#决策树#随机森林
机器学习---K-Means聚类算法

机器学习中有两类的大问题,一个是分类,一个是聚类。分类是监督学习,原始数据有标签,可以根据原始数据建立模型,确定新来的数据属于哪一类。聚类是一种无监督学习,聚类是指事先没有“标签”,在数据中发现数据对象之间的关系,将数据进行分组,一个分组也叫做“一个簇”, 组内的相似性越大,组间的差别越大,则聚类效果越好,也就是簇内对象有较高的相似度,簇之间的对象相似度比较低,则聚类效果越好。K-means就是一

文章图片
#机器学习#算法#kmeans
机器学习---KNN最近邻算法

K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一,有监督算法。该方法的思路是:如果一个样本在特征空间中的k个最相似的样本中的大多数属于某一个类别,则该样本也属于这个类别。KNN算法由你的邻居来推断出你的类别,KNN算法就是用距离来衡量样本之间的相似度。如果K = 3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方

文章图片
#机器学习#近邻算法#人工智能
机器学习---环境准备

window安装python,配置python环境变量。安装python后,在环境变量path中加入安装的路径,cmd中输入python,检验python是否安装成功。注意:如果使用的是anaconda安装的python环境,建议安装python3.5.x版本,这个版本和spark1.6兼容。如何在anaconda中安装python3.5.x版本的python环境?参考文档:“Anaconda安装

文章图片
#python#开发语言
    共 41 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择