HDFS体系结构(各种进程状态)_hdfs中包含哪些守护进程-程序员宅基地

技术标签： datanode HDFS hadoop yarn namenode

HDFS体系结构(各种进程状态)

NameNode【名称节点】

开启方式(关闭方式)：
- 1. hdfs namenode（关闭Terminal）
- 1. hadoop-daemon.sh start namenode（hadoop-daemon.sh stop namenode或杀死进程）
- 1. start-dfs.sh（stop-dfs.sh或杀死进程）

namenode默认大小1000M
namenode守护进程作用：
1. 维护HDFS集群元数据的镜像文件[fsimage]，【fsimage】包括：文件属性信息，文件与block块的对应关系
2. 维护客户端对HDFS的相关操作，并记录[Edits_log]
3. 接收所有来自datanode的心跳汇报，内容：block块的信息与所属节点位置

DataNode【数据节点】

开启方式(关闭方式)：
- 1. hdfs datanode（关闭Terminal）
- 1. hadoop-daemon.sh start datanode（hadoop-daemon.sh stop datanode或杀死进程）
- 1. start-dfs.sh（stop-dfs.sh或杀死进程）

datanode守护进程作用：
1. datanode负责实时监控当前节点的运行状态
2. datanode以block块的形式进行存储
3. datanode要响应客户端的请求

SecondaryNameNode【辅助名称节点】

开启方式(关闭方式)：
- 1. hdfs secondarynamenode（关闭Terminal）
- 1. hadoop-daemon.sh start secondarynamenode（hadoop-daemon.sh stop secondarynamenode或杀死进程）
- 1. start-dfs.sh（stop-dfs.sh或杀死进程）
【定期合并fsimage文件和edits_log文件，保证集群的可靠性】

secondarynamenode守护作用：【解决HDFS的可靠性】
- 【secondarynamenode利用检查点机制，将fsimage和edits_log合并，解决宕机以后对HDFS的】
- 【HA高可用是解决HDFS的单点故障】
- 【区别：】
  - secondarynamenode是解决高可靠
    
    HA解决的是高可用，两者实现系统稳定运行的角度不一样
    
    用了高可用就不需要secondarynamenode了，有另一台节点存储namenode在运行的namenode挂掉的时候，该节点顶上去，保证高可用
可靠性：
- 数据3份副本：确保数据的可靠性
  
  心跳机制：确保数据节点的可靠性
  
  secondarynamenode：确保宕机恢复的可靠性
  
  机架感知：性能的可靠性

YARN体系结构

ResourceManager（资源管理器）

开启方式（关闭方式）：
- start-yarn.sh
- stop-yarn.sh或杀死进程
作用：
1. 监控并分配集群全局资源，包括：CPU、内存、磁盘和网络。
2. 通过心跳机制获取每个NodeManager节点的资源数据以及运行情况。
3. 它将用于开启ApplicationMaster，分配所需资源。

NodeManager（节点管理器）守护进程

开启方式（关闭方式）：
- start-yarn.sh
- stop-yarn.sh或杀死进程
作用：
1. 管理并监控当前节点（自己）的资源使用情况。
2. 通过心跳机制向ResourceManager进行汇报，汇报内容：CPU、内存、磁盘和网络。
3. 用户执行启动Task任务（MapTask和ReduceTask）。

ApplicationMaster（应用主节点）守护进程

作用：
1. MRAppMaster生命周期随着Job产生而产生。
2. 监控当前Job应用程序的调度，内容：资源（jar、conf、split）
3. 向ResourceManager申请提交所需任务的资源。
jar 默认10份副本

split 默认10份

job.xml 默认3份

splitmetainfo 默认3份，切分元数据

YarnChild（yarn运行MapReduce应用时开启的）

【随应用的开启而开启，生命周期同应用】

作用：
1. YarnChild生命周期随着Job产生而产生
2. 被MRAppMaster调度，用于运行mapTask或者reduceTask
3. 一个节点默认最多开启2个
4. 每个进程默认使用200M内存

JobHistoryServer

开启方式：

[hadoop@master hadoop]$ mr-jobhistory-daemon.sh start historyserver
starting historyserver, logging to /home/hadoop/soft/hadoop-2.7.3/logs/mapred-hadoop-historyserver-master.out

[hadoop@master hadoop]$ jps
21896 JobHistoryServer
21931 Jps
作用：
1. 记录Job作业的历史情况

伪分布式集群守护线程开启状态

方式一：start-dfs.sh + start-yarn.sh

start-dfs.sh会开启如下线程：
- [hadoop@master ~]$ start-dfs.sh
  Starting namenodes on [master]
  master: starting namenode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-namenode-master.out
  master: starting datanode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-datanode-master.out
  Starting secondary namenodes [0.0.0.0]
  0.0.0.0: starting secondarynamenode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-secondarynamenode-master.out
  
  主节点：（仅一个节点）
  
  [hadoop@master ~]$ jps
  17922 Jps
  
  17804 SecondaryNameNode
  
  17583 NameNode
  
  17886 DataNode
start-yarn.sh会开启如下线程：【只能在主节点执行该命令，从节点执行ResourceManager无法开启】
- [hadoop@master ~]$ start-yarn.sh
  starting yarn daemons
  starting resourcemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-resourcemanager-master.out
  slave02: starting nodemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-nodemanager-slave02.out
  slave03: starting nodemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-nodemanager-slave03.out
  slave01: starting nodemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-nodemanager-slave01.out
  
  主节点：
  
  [hadoop@master ~]$ jps
  18262 Jps
  17804 SecondaryNameNode
  17998 ResourceManager
  17583 NameNode
  17886 DataNode

完全分布式集群守护线程开启状态：

方式一：start-dfs.sh + start-yarn.sh
- start-dfs.sh会开启如下线程：
  - [hadoop@master ~]$ start-dfs.sh
    Starting namenodes on [master]
    master: starting namenode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-namenode-master.out
    slave03: starting datanode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-datanode-slave03.out
    slave01: starting datanode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-datanode-slave01.out
    slave02: starting datanode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-datanode-slave02.out
    Starting secondary namenodes [0.0.0.0]
    0.0.0.0: starting secondarynamenode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-secondarynamenode-master.out
    
    主节点：
    
    [hadoop@master ~]$ jps
    17922 Jps
    17804 SecondaryNameNode（仅1个，辅助名称节点单独主机上开启）
    17583 NameNode（仅1个，主节点中开启）
    
    【主节点开启NameNode守护进程以及SecondaryNameNode（一般会再启用一个主机给辅助名称节点）】
    
    从节点：
    
    [hadoop@slave01 ~]$jps
    19360 DataNode（多个，每个数据节点都会开启，用于维护和管理数据）
    19472 Jps
    
    【从节点开启DataNode守护进程，每个数据节点都会开启】
- start-yarn.sh会开启如下线程：【只能在主节点执行该命令，从节点执行ResourceManager无法开启】
  - [hadoop@master ~]$ start-yarn.sh
    starting yarn daemons
    starting resourcemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-resourcemanager-master.out
    slave02: starting nodemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-nodemanager-slave02.out
    slave03: starting nodemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-nodemanager-slave03.out
    slave01: starting nodemanager, logging to /home/hadoop/soft/hadoop-2.7.3/logs/yarn-hadoop-nodemanager-slave01.out
    
    主节点：
    
    [hadoop@master ~]$ jps
    18262 Jps
    17804 SecondaryNameNode
    17998 ResourceManager（仅1个，主节点中开启）
    17583 NameNode
    
    【在主节点中会开启ResourceManager,，用于调度整体的资源】
    
    从节点：
    
    [hadoop@slave03 ~]$ jps
    18870 DataNode
    19035 NodeManager（多个，每个数据节点都会开启）
    19485 Jps
    
    【从节点会开启NodeManager，用于管控本节点的资源调度】
方式二：

hadoop-daemon.sh start namenode +

hadoop-daemon.sh start datanode +

hadoop-daemon.sh start secondarynamenode +

start-yarn.sh
- hadoop-daemon.sh start namenode
  - [hadoop@master ~]$ hadoop-daemon.sh start namenode
    starting namenode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-namenode-master.out
    
    [hadoop@master ~]$ jps
    18731 NameNode
    18862 Jps
hadoop-daemon.sh start datanode
- [hadoop@slave01 ~]$ hadoop-daemon.sh start datanode
  starting datanode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-datanode-slave01.out
  
  [hadoop@slave01 ~]$ jps
  19877 Jps
  19829 DataNode
  
  【分别在要开启的数据节点执行该命令，开启DataNode】
- hadoop-daemon.sh start secondarynamenode
- [hadoop@master ~]$ hadoop-daemon.sh start secondarynamenode
  starting secondarynamenode, logging to /home/hadoop/soft/hadoop-2.7.3/logs/hadoop-hadoop-secondarynamenode-master.out
  
  [hadoop@master ~]$ jps
  18827 SecondaryNameNode
  18862 Jps
  
  【任意节点都能开，将fsimage和edits_log文件做合并操作】
- start-yarn.sh
【通常采用方式二开启守护进程】

Job运行状态下的守护线程

主节点：
- [hadoop@master hadoop]$ jps
  20321 SecondaryNameNode
  20119 NameNode
  20761 Jps
  20474 ResourceManager
  
  【没有变化】
从节点：
- [hadoop@slave03 ~]$ jps
  20544 NodeManager
  20420 DataNode
  20857 YarnChild（在MRAppMaster开启后，MRAppMaster会根据Mapper任务的开启，启动YarnChild，用于执行Mapper任务以及reducer任务，一个数据节点默认最多开启2个YarnChild，而在哪个数据节点开启YarnChild也是随机的）
  20905 Jps
  20765 MRAppMaster（Job开启后，ResourceManager随机选定某个NodeManager，让其开启一个应用主节点，管理所有应用的运行，生命周期随Job的开启而开启，随Job的消亡而消亡）
  
  【开启了两个守护线程，MRAppMaster和YarnChild】

本文链接：https://blog.csdn.net/weixin_43855370/article/details/101721637

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

解决electron+vue项目起始加载慢的问题_electron vue项目打开慢-程序员宅基地

文章浏览阅读461次。_electron vue项目打开慢

linux下编译GDAL外加扩展格式支持（五）--完-程序员宅基地

文章浏览阅读229次。接1、2、3、4篇。10、安装mysql支持安装fedora15或者16系统时若选择安装mysql数据库，则必须自行安装mysql开发包。因为自带默认数据库不会安装这个包。否则会遇到mysql错误：ogr_mysql.h:34:23: fatal error: my_global.h: No such file or directory#问题原因：找不到mysql头文件..._linux gdal netcdf5

Linux tc qdisc 模拟网络丢包延时-程序员宅基地

文章浏览阅读1.2k次。Linux tc qdisc 模拟网络丢包延时_tc qdisc

linux64bit 安装 jdk 1.7-程序员宅基地

文章浏览阅读336次。linux64bit 安装 jdk 1.7下载地址： https://edelivery.oracle.com/otn-pub/java/jdk/7u21-b11/jdk-7u21-linux-x64.rpm0. 卸载rpm版的jdk： #rpm -qa|grep jdk 显示：jdk-1.6.0_10-fcs 卸载：#rpm -e --nodep..._liunx64位得jdk1.7

【Linux笔记】-----Nginx/LVS/HAProxy负载均衡的优缺点_中间件应用场景nginx lvs proxy-程序员宅基地

文章浏览阅读552次。开始听到负载均衡的时候，我第一反应想到的是链路负载均衡，在此之前主要是在学习网络方面知识，像在NA、NP阶段实验做链路负载均衡时常会遇到，后来还接触到SLB负载分担技术，这都是在链路基础上实现的。其实负载均衡可以分为硬件实现负载均衡和软件实现负载均衡。硬件实现负载均衡：常见F5和Array负载均衡器，配套专业维护服务，但是成本昂贵。软件实现负载均衡：常见开源免费的负载均衡软件有Ngin..._中间件应用场景nginx lvs proxy

多维时序 | MATLAB实现CNN-LSTM多变量时序预测_cnn可以进行多步预测-程序员宅基地

文章浏览阅读4.7k次。多维时序 | MATLAB实现CNN-LSTM多变量时序预测目录多维时序 | MATLAB实现CNN-LSTM多变量多步预测基本介绍模型特点程序设计学习总结参考资料基本介绍本次运行测试环境MATLAB2020b，MATLAB实现CNN-LSTM多变量多步预测。模型特点深度学习使用分布式的分层特征表示方法自动提取数据中的从最低层到最高层固有的抽象特征和隐藏不变结构. 为了充分利用单个模型的优点并提高预测性能, 现已提出了许多组合模型。CNN 是多层前馈神经网络, 已被证明在提取隐藏_cnn可以进行多步预测