donger__chen 个人主页

@donger__chen

donger__chen

2022-11-24 21:52:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

spark提交scala代码

目的：通过spark-submit提交scala代码scala代码需要先编译才能在spark上跑工具：sbt下载地址sbt正式开始假设现在的地址是 /home/sparknode/scalacode，则需要先mkdir -p src/main/scala（路径必须严格遵守，少一个都不行）然后在 /home/sparknode/scal...

#spark #scala

Pyspark 导入第三方包报错

pyspark导入第三方包的方式在spark-submit时添加参数--py-filesspark-submit --py-files 文件1或py文件1,zip文件2或py文件2（多个文件用,分开）在sparkContext中使用addPyFilesc.addPyFile(“xxxx.zip”)或spark.sparkContext.addFile(“xxx.zip”)报错...

#spark #python

国内数据科学竞赛平台

找了一段时间数据竞赛平台，发现别人总结的都是一些主流的，不够齐全，现相对完整列举一些天池大数据DataFountainDataCastle科赛百度点石京东JDATA数愿biendata竞技乎（好像不更新了...泰迪杯AI ChallengerflyAI...

python连接hbase

1.happybase访问使用的是thrift，因此必须开启thrift(hbase thrift start)如果hbase-site.xml的hbase.regionserver.thrift.http设置为true，则该方式无法访问。会有No protocol version 的错误# pip install happybase# 官方文档 https://happybase.readthe

#hbase

到底了