时间:2024-10-23 16:01:51
hadoop配置与使用方式
Hadoop的配置与使用主要包括以下几个步骤:
1. 安装一台最小化安装的虚拟机,修改虚拟机基本属性,如IP、主机名、hosts文件等,并关闭防火墙和NetworkManager服务。
2. 安装虚拟机插件,创建账户和设置账户权限,创建文件夹,重启电脑。
3. 安装JDK和Hadoop,配置环境变量,使用sudo vim /etc/profile.d/my_env.sh文件进行配置。
4. 克隆两台虚拟机,搭建集群,修改hostname和IP地址。
5. 编写脚本,分发同步脚本,配置ssh无密登录。
6. 配置规划,确定namenode、2nn和sourcemanager计划放在哪台节点。
7. 配置文件,包括core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml。
8. 分发同步配置文件,启动集群,编写启动集群脚本。
9. 测试job,配置历史服务器和日志聚集,同步集群时间。
需要注意的是,Hadoop的配置文件是XML格式,使用相应的配置文件类读取,并配置集群的运行。每个配置项一般包括配置属性名称、值和一个关于配置项的描述。元素final和Java中的关键字final类似,意味着这个配置项是“固定不变的”。
科技之家 广州小漏斗信息技术有限公司 版权所有 提供支持 粤ICP备20006251号