logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Flink流批一体计算(12):PyFlink Tabel API之构建作业

当在 mini cluster 环境执行作业(比如,在IDE中执行作业)且在作业中使用了如下API(比如 Python Table API 的 TableEnvironment.execute_sql, Statementset.execute 和 Python DataStream API 的 StreamExecutionEnvironment.execute_async) 的时候,因为这些A

文章图片
#flink#c##数据库
基于大数据做文本分析

在对大数据的认识中,人们总结出它的4V特征,即容量大、多样性、生产速度快和价值密度低,为此产生出大量的技术和工具,推动大数据领域的发展。为了利用好大数据,如何有效的从其中提取有用特征,也是重要的一方面,工具和平台化必须依靠正确的数据模型和算法才能凸显出其重要的价值。现在就文本分析作为案例来分析数据处理技术在大数据领域的作用和影响。首先讨论文本分析的三种模型:词袋模型、TF-IDF短语加权表示和

五步评估Ad Hoc报表工具

AdHoc报表工具被组织终端用户用于实时的深度数据分析,这样的解决方案需要具备广泛的功能,比如高度可定制的管理特征业务用户想要的直观的报表模版。实现的业务是资源集中的流程,因此需要确保选择正确的工具。为保证Adhoc报表解决方案被成功采用,需要有一个评估流程。下述5步法可以充分评价报表工具的功能。1. 生成样例报表2. 增加交互3. 使用自己的数据4. 提炼出管理功能5.

Azure虚拟机增加磁盘步骤

1. 新增一块空磁盘2. sudo fdisk -l3. fdisk /dev/sdd4. cat /etc/fstabUUID="4b81d15f-50ac-4ead-8122-6f5eca05002f"    /opt    ext4   defaults   0 0

Flink流批一体计算(1):流批一体和Flink概述

数字化经济革命的浪潮正在颠覆性地改变着人类的工作方式和生活方式,数字化经济在全球经济增长中扮演着越来越重要的角色,以互联网、云计算、大数据、物联网、人工智能为代表的数字技术近几年发展迅猛,数字技术与传统产业的深度融合释放出巨大能量,成为引领经济发展的强劲动力。第三,数据口径天然一致。无论是离线的流程,还是实时的流程,都是一套引擎,一套 SQL,一套 UDF,一套开发人员,所以它天然是一致的,不存在

文章图片
#flink#大数据
tensorflow如何做到分布式计算

I. 从简单开始,首先是单机单卡:服务器是虚拟机,只有CPU,下面程序分别计算加法、乘法#coding=utf-8#单机单卡#对于单机单卡,可以把参数和计算都定义再gpu上,不过如果参数模型比较大,显存不足等情况,就得放在cpu上import  tensorflow as tfwith tf.device('/cpu:0'):#也可以放在gpu上        w=

Jenkins上配置从git上拉代码

jenkins 要从git上拉代码,现在git服务器是基于tfs的,与以往不同。1. 首先确定Repository URL怎么写是规范的 2. 建立Creentials,即登录git服务器的用户和密码3. 在Jenkins服务器上通过ssh-keygen -t rsa,并将公钥发布到git服务器自己账号下的ssh密钥管理4.

Hadoop集群重启过程记录

1. brain02~04启动zksu - hadoopsudo service zookeeper-server restart2. brain01~03启动JNsudo service hadoop-hdfs-journalnode restart3. brain01上格式化namenodesudo -u hdfs hadoop namenode

部署 K8s 集群

Kubeadm是一个K8s部署工具,提供kubeadm init和kubeadm join,用于快速部署Kubernetes集群。--image-repository 由于默认拉取镜像地址k8s.gcr.io国内无法访问,这里指定阿里云镜像仓库地址。--pod-network-cidr Pod网络,与下面部署的CNI网络组件yaml中保持一致。注:--apiserver-advertise-add

#docker
harbor使用问题

在harbor系统上创建项目distribute-train,再次执行,成功。修改harbor服务器和客户端服务器上docker的daemon.json。然后重启docker并启动所有docker进程。

#docker#容器#运维
    共 15 条
  • 1
  • 2
  • 请选择