HDFS数据节点目录结构
数据节点可以管理多个目录结构,可以通过 dfs.data.dir
配置指定
dfs.data.dir 包含四个目录和两个文件
四个目录
- Temp:用于记录正在写入的数据块,该写入过程是由于数据块复制产生,由一个数据节点写入另一个数据节点
- bloksBeingWriten:用于保证正在写入的数据块,与 temp 不同之处是该目录下是客户端发起的写
- Current:用于保存已经写入并提交的数据块,校验信息以及数据块扫描器用到的文件和 version 文件(包含 HDFS 运行时的版本信息)
- Detach:与系统升级相关的目录
数据块开始写入时位于 blocksBeingWriten 或者 Temp 目录下,当数据顺利写入提交后会迁移到 Current 目录
两个文件
- Storage:保存提示信息,系统版本相关
- In_use.lock:表明该目录目前已经被某个实例所占用,是一种锁机制,防止多个数据节点实例共享同一个目录,当停止数据节点时该文件会消失,既锁解除