logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

并行与分布式计算导论—性能分析

对应北大罗老师课件:PDC08.MPI.scalability以及书《MPI与OpenMP并行程序设计:C语言版》第七章重要公式:加速比通用公式Amdahl定律:决定一个程序是否值得并行化Gustafson-Barsis定律:评估并行程序性能的方法Karp-Flatt度量:确定影响加速比的障碍,来自串行部分/并行开销等效加速比度量:衡量在并行计算机上执行算法的可扩展性,帮助你选择在处...

大数据管理技术 | 一些遇到的错误

文章目录一些遇到的错误hbasesparkpyspark一些遇到的错误hbasegedit ~/.bashrc时显示Unable to init server: Could not connect: Connection refused(gedit:4223): Gtk-WARNING **: 23:15:04.898: cannot open display:原因:进入了ssh/hdfs之类的操

并行与分布式计算导论—HW02

死了死了(。)1 . 题目:回顾 MPI 的通信机制,写出如下 Collective Communications 操作的伪代码: ① One-to-all Broadcast ;② All-to-all Reduction ;③ Scatter① One-to-all Broadcast (& all-to-one Reduction)先回顾一下概念:这里One to all...

GPU训练模型遇到的报错

注意os.environ[“CUDA_VISIBLE_DEVICES”] 要在import torch前面,否则可能无法生效:https://zhuanlan.zhihu.com/p/582993579。1.查看pytorch是否是cpu版本,是的话参考:https://blog.csdn.net/wqufhu/article/details/129295385。

文章图片
#pytorch#深度学习#人工智能
大数据管理技术实习——MapReduce之WordCount(去标点符号)

大数据管理技术实习——MapReduce文章目录大数据管理技术实习——MapReduce要求:基础代码1.map部分2.Reduce部分改进代码运行过程(命令行shell相关)1.开启hdfs2.初始化/格式化(以前的输入输出 没有可略过)3.打包jar4.运行程序5.部分bug5.1 HDFS Corrupt block5.2 正则表达式中的“-”问题5.3 retry policy is...

#大数据#mapreduce#hadoop
大数据管理技术 | 基于Spark的tpc-h22条查询语句及优化

文章目录基于Spark的tpc-h查询语句及优化1.实验目的2.实验环境2.1 电脑&虚拟机配置2.2 Java&Spark设置3.数据上传&建表4.tpc-h测试集22条查询4.1 查询语句4.2 运行时间分析5.优化5.1 数据倾斜5.2 shuffle5.3 持久化5.4 Spark多核运行5.5 虚拟机设置6.结果与分析7.心得体会基于Spark的tpc-h查询语句

到底了