问题:MapReduce 作业失败 -- 线程“main”中的异常 java.io.IOException: java.net.ConnectException

我在 Hadoop 上运行一个简单的计数程序。我的输入文件大小为 4 GB。由于某种原因,这项工作不断失败并出现以下错误:

在此处输入图像描述

在此处输入图像描述

但是,如果我用一个小的输入文件(比如 100MB )尝试相同的代码,它工作得非常好。我是新手,我似乎找不到任何可行的解决方案。我的设置是伪分布式。

我需要进行任何配置更改吗?我已经按照 hadoop 文档提供的 Psuedo 分布式设置进行了标准配置。

任何帮助将不胜感激。

解答

从您发布的错误堆栈跟踪中,ConnectionRefused 异常适用于 JobHistoryServer。

对于伪分布式设置,无需更改配置即可启动JobHistoryServer。使用此命令启动它,

$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh start historyserver
Logo

更多推荐