Hadoop快速入门
常见的Hadoop部署模式分为单机模式和集群模式,也称为伪分布式模式和分布式模式。
单机模式(伪分布式)模式是在一个节点上部署所有的Hadoop服务。在使用上,单机模式(伪分布式)模式跟集群模式(分布式模式)是一样的。Hadoop单机配置
2.3节到2.5节内容参考官方文档:
修改hadoop-env.sh
Hadoop的配置文件存放于Hadoop根目录下的etc/hadoop目录,进入该目录
通过vi hadoop-env.sh
命令来编辑hadoop-env.sh脚本文件
在第25行左右可以找到export JAVA_HOME=${JAVA_HOME}
内容
将改行修改为export JAVA_HOME=/opt/jdk1.8.0_112
然后保存退出
修改slaves文件
同样通过命令vi slaves
编辑slaves文件
将默认值localhost修改为node1,保存退出。
修改hdfs-site.xml
vi hdfs-site.xml
在<configuration>
和</configuration>
之间添加如下内容:
dfs.replication 1
保存退出
修改core-site.xml
vi core-site.xml
在<configuration>
和</configuration>
之间添加如下内容:
fs.defaultFS hdfs://node1:9000
保存退出
修改mapred-site.xml 文件
默认情况下该目录下没有mapred-site.xml文件,而是存在一个模版文件mapred-site.xml.template,因此首先将模版文件复制一份为mapred-site.xml。然后在通过vi编辑该mapred-site.xml文件cp mapred-site.xml.template mapred-site.xml
vi mapred-site.xml
在<configuration>
和</configuration>
之间添加如下内容:
mapreduce.framework.name yarn
保存退出。
修改yarn-site.xml
vi yarn-site.xml
在<configuration>
和</configuration>
之间添加如下内容:
yarn.nodemanager.aux-services mapreduce_shuffle
保存退出