pk10计划-容错 - HDFS最重要的特性

HDFS的容错性是指系统在不利条件下pk10计划的工作强度以及系统如何处理这种情况。HDFS具有高度的容错能力。它通过创建副本来处理错误。用户数据的副本在HDFS集群中的不同机器上创建。因此,无论集群中的任何一台机器何时关闭,都可以从创建了相同数据副本的其他机器访问数据。如果突然一台机器出现故障,HDFS还会通过在群集中的其他可用机器上创建数据副本来维护复制因素。要了解更多关于世界上最可靠的存储层的信息。
HDFS通过复制过程实现容错机制。在用户存储文件时,在HDFS中,首先将该文件分成块,然后将这些数据块分布在HDFS群集中存在的不同机器上。之后,每个块的副本将在群集中的其他机器上创建。默认情况下,HDFS会在集群中存在的其他机器上创建3个文件副本。因此,由于某种原因,如果HDFS上的任何计算机出现故障或失败,用户也可以轻松地访问集群中存在其副本的其他计算机上的数据。因此,由于HDFS独特的分布式存储功能,HDFS提供了更快的文件读写机制。
假设有一个名为FILE的用户数据。这个数据文件被分成块pk10计划B1,B2,B3并发送给主站。现在主站将这些块发送给从站,比如S1,S2和S3。现在,从站创建这些块的副本到群集中存在的其他从站,如S4,S5和S6。因此,在从站上创建多个块的副本。说S1包含B1和B2,S2包含B2和B3,S3包含B3和B1,S4包含B2和B3,S5包含B3和B1,S6包含B1和B2。现在,如果由于某些原因,从站S4崩溃。因此S4中的数据是B2和B3变得不可用。但我们不必担心,因为我们可以从其他从站S2获取块B2和B3。因此,在不利条件下,我们的数据也不会丢失。因此HDFS具有高度容错能力。
在像RDBMS这样的遗留系统中,用户执行的所有读写操作都是在单台机器上完成的。如果由于诸如机器故障,内存崩溃,硬盘故障,关机等不利条件而导致用户不得不等待问题被手动纠正。因此,在机器崩溃或故障时,用户无法访问他们的数据,直到机器中的问题恢复并可供用户使用。同样在遗留系统中,我们只能将数据存储在GB范围内。所以为了增加数据存储容量,必须购买一台新的服务器机器。因此,为了存储大量的数据,pk10计划必须购买许多服务器机器,因此成本变得非常昂贵。

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:http://www.buaamba.net/a/pk10kaijiang/125.html