小2C


  • 首页

  • 标签

  • 分类

  • 归档

HDFS 中在 ClientProtocol 中出现的基本概念的抽象

发表于 2019-09-23 | 分类于 Hadoop | 阅读次数:
字数统计: 317 | 阅读时长 ≈ 1
  • 与数据块相关

    • 数据块:在 HDFS 中抽象为 block,block 包含三个成员变量:blockId,numbytes(数据块大小),generationStamp(数据块版本号,每次对数据块的修改版本号都会跟着修改,用于数据一致性检查,具有相同 blockId 但版本号不同的数据块至少有一个是无效的,需要删除),数据块的名称是 blk_<blockId>

    • LocateBlock:已经确定了存储位置的数据块,成员变量有:Block、数据块所在节点信息 locs、数据块在对应文件中的偏移量。Locs 是一个类型为 DataNodeIndo 的数组,包含了所有可用的数据块位置

    • locatedBlocks:可用于一次定位多个 block,包含一系列的 locatedBlock 对象

    • BlockLocalPathInfo:用于 HDFS 数据块本地读优化,当数据块与客户端位于同一台机器时,不通过数据节点读数据,而是直接本地读

  • 与 DataNode 相关:DataNodeID、DataNodeInfo

    • DataNodeID:用于在集群中唯一确定某一数据节点。可以从中获得数据节点的主机地址

    • DataNodeInfo:提供附加状态信息,包括容量,已使用流量,剩余流量,数据节点在集群中的位置,数据节点状态等信息

HDFS 的安全模式

发表于 2019-09-23 | 分类于 Hadoop | 阅读次数:
字数统计: 440 | 阅读时长 ≈ 1

当 namenode 刚启动时会进入安全模式,具体顺序是首先将 fsimage 载入内存,并执行 editLog 中的操作。一旦文件系统元数据创建成功,便会创建一个空的 editLog。此时 nameNode 开始监听 RPC 和 Http 请求。但是此时 namenode 处于安全模式,只接收客户端的读操作。

阅读全文 »

fsImage 与 Editlog

发表于 2019-09-23 | 分类于 Hadoop | 阅读次数:
字数统计: 571 | 阅读时长 ≈ 2

fsimage 存储的都是文件系统元数据信息(文件及目录结构,组成文件的块的信息,副本数量信息),是文件元数据信息的持久性检查点,当 namenode 重启后都需要载入 fsimage 进入内存,恢复到某一检查点,再执行检查点后的编辑日志(editlog),进行重建。 检查点之后的操作记录会保存到 editlog 中,注意 editlog 存储的是操作记录而并非元数据,当 fsimage 与 editlog 合并时,会先将 editlog 执行一遍,生成元数据信息再与 fsimage 合并,每次合并后的位置就称为检查点

阅读全文 »

hdfs 中的接口类型

发表于 2019-09-23 | 分类于 Hadoop | 阅读次数:
字数统计: 494 | 阅读时长 ≈ 1

Rpc协议就是Server实现一个声明了很多方法的接口并对外暴露此接口,Client通过调用此接口中声明的方法向server发送信息从而实现了与server的通信

HDFS 中的接口主要包括三种类型:

阅读全文 »

分布式协议之 Paxos

发表于 2019-09-21 | 分类于 分布式 | 阅读次数:
字数统计: 1.2k | 阅读时长 ≈ 4

Paxos 算法是基于消息传递且具有高度容错特性的一致性算法,是目前公认的解决分布式一致性问题最有效的算法之一,其解决的问题就是在分布式系统中如何就某个值(协议)达成一致

阅读全文 »

一致性协议之 3PC

发表于 2019-09-20 | 分类于 分布式 | 阅读次数:
字数统计: 997 | 阅读时长 ≈ 3

为了弥补二阶段提交的缺点,研究人员又提出了三阶段提交。3PC,全称 “three phase commit”,其将 2PC 的 “提交事务请求” 过程一分为二

阅读全文 »

一致性协议之 2PC

发表于 2019-09-20 | 分类于 分布式 | 阅读次数:
字数统计: 750 | 阅读时长 ≈ 2

2PC,不是两个 PC 机的意思,而是 Two-Phase-Commit。可以认为是一种算法,也可以认为是一种协议,主要目的就是为了保证分布式系统数据的一致性

阅读全文 »

CAP 定理

发表于 2019-09-19 | 分类于 分布式 | 阅读次数:
字数统计: 1.5k | 阅读时长 ≈ 5

分布式系统有三大指标

  • consistency

  • availability

  • partition tolerance

阅读全文 »

简述 zookeeper 及 ZAB 协议

发表于 2019-09-18 | 分类于 分布式 | 阅读次数:
字数统计: 1.5k | 阅读时长 ≈ 5

Zookeeper 简介

Zookeeper 为分布式应用提供了一个高效可靠的分布式协调服务。实现依赖于 ZAB 协议,实现了一种主备模式的架构来保持集群中数据的一致性。Zookeeper 使得分布式应用可以通过一个共享的树形结构的命名空间实现协调。Zookeeper 的所有数据都存储再内存中。Zookeeper 集群中的任何一台机器都可以响应客户端的读操作,且全量数据存储在内存中,因此 Zookeeper 更适合以读操作为主的应用场景。

阅读全文 »

七层协议每一层的任务及作用

发表于 2019-09-11 | 分类于 计算机网络 | 阅读次数:
字数统计: 187 | 阅读时长 ≈ 1

7.应用层 6.表示层 5.会话层 4.传输层 3.网络层 2.数据链路层 1.物理层

阅读全文 »
123…8
or

or

未来的全栈工程师

79 日志
9 分类
6 标签
© 2021 or
历史访客数: 总访问量:
0%