首页编程正文内容

hadoop架构

编程

更新时间：2026-04-03 15:26:48 91

admin 管理员组

文章数量: 1184232

2024年3月7日发(作者：图片转换成xml)

Hadoop有许多元素构成。其最底部是Hadoop Distributed File System（HDFS），它存储Hadoop集群中所有存储节点上的文件。HDFS的上一层是 MapReduce 引擎，该引擎由JobTrackers和TaskTrackers组成。

HDFS

对外部客户机而言，HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件，等等。但是HDFS的架构是基于一组特定的节点构建的，这是由它自身的特点决定的。这些节点包括 NameNode（仅一个），它在HDFS内部提供元数据服务；DataNode，它为HDFS提供存储块。由于仅存在一个 NameNode，因此这是HDFS的一个缺点（单点失败）。

存储在HDFS中的文件被分成块，然后将这些块复制到多个计算机中（DataNode）。这与传统的RAID架构大不相同。块的大小（通常为64MB）和复制的块数量在创建文件时由客户机决定。NameNode可以控制所有文件操作。HDFS内部的所有通信都基于标准的TCP/IP协议。

NameNode

NameNode是一个通常在HDFS实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。NameNode决定是否将文件映射到 DataNode上的复制块上。对于最常见的3个复制块，第一个复制块存储在同一机架的不同节点上，最后一个复制块存储在不同机架的某个节点上。注意，这里需要您了解集群架构。

实际的I/O事务并没有经过NameNode，只有表示DataNode和块的文件映射的元数据经过NameNode。当外部客户机发送请求要求创建文件时，NameNode会以块标识和该块的第一个副本的DataNode IP地址作为响应。这个NameNode还会通知其他将要接收该块的副本的DataNode。

NameNode在一个称为FsImage的文件中存储所有关于文件系统名称空间的信息。这个文件和一个包含所有事务的记录文件（这里是EditLog）将存储在 NameNode的本地文件系统上。FsImage和EditLog文件也需要复制副本，以防文件损坏或NameNode系统丢失。

DataNode

DataNode也是一个通常在HDFS实例中的单独机器上运行的软件。Hadoop集群包含一个

NameNode和大量DataNode。DataNode通常以机架的形式组织，机架通过一个交换机将所有系统连接起来。Hadoop的一个假设是：机架内部节点之间的传输速度快于机架间节点的传输速度。

DataNode响应来自HDFS客户机的读写请求。它们还响应创建、删除和复制来自NameNode的块的命令。NameNode依赖来自每个DataNode的定期心跳（heartbeat）消息。每条消息都包含一个块报告，NameNode可以根据这个报告验证块映射和其他文件系统元数据。如果DataNode不能发送心跳消息，NameNode将采取修复措施，重新复制在该节点上丢失的块。

文件操作

可见，HDFS并不是一个万能的文件系统。它的主要目的是支持以流的形式访问写入的大型文件。如果客户机想将文件写到HDFS上，首先需要将该文件缓存到本地的临时存储。如果缓存的数据大于所需的HDFS块大小，创建文件的请求将发送给NameNode。NameNode将以DataNode标识和目标块响应客户机。同时也通知将要保存文件块副本的DataNode。当客户机开始将临时文件发送给第一个DataNode时，将立即通过管道方式将块内容转发给副本DataNode。客户机也负责创建保存在相同HDFS名称空间中的校验和（checksum）文件。在最后的文件块发送之后，NameNode将文件创建提交到它的持久化元数据存储（在EditLog和FsImage文件）。

Linux集群

Hadoop框架可在单一的Linux平台上使用（开发和调试时），但是使用存放在机架上的商业服务器才能发挥它的力量。这些机架组成一个Hadoop集群。它通过集群拓扑知识决定如何在整个集群中分配作业和文件。Hadoop假定节点可能失败，因此采用本机方法处理单个计算机甚至所有机架的失败。

本文标签：文件机架客户机节点创建

版权声明：本文标题：hadoop架构内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/b/1709809313a547173.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

电脑管家如何清理内存及垃圾，提升电脑性能

编程

10天前

电脑在长时间使用后，常常会变得越来越卡顿，打开程序的速度变慢，甚至响应迟缓。这时，不少用户会选择使用电脑管家来进行内存清理和垃圾清理。那么，电脑管家是如何清理内存的？它又是如何清理垃圾的？清理后为何电脑变得更流畅？本文将一一解答这些问

《英雄联盟》游戏闪退弹窗“找不到d3dcompiler 47.dll”该如何应对？LOL英雄联盟游戏崩溃提示“缺失d3dcompiler 47.dll文件”的处理妙招

编程

10天前

当游戏因“找不到d3dcompiler_47.dll”而崩溃时，一种方法是重新安装DirectX组件，因为该文件是DirectX的一部分。也可以从可靠的网站下载该文件，然后放置到系统相应目录中。还可以通过更新显卡驱动来尝试解决，因为显

隐藏文件无法显示的解决方法_修改注册表windows隐藏文件无法显示

技术日记

10天前

Windows Registry Editor Version 5.00[HKEY_LOCAL_MACHINESoftwareMicrosoftWindowsCurrentVersionexplorerAdvance

为什么打不开网页 ……技术_为什么有网络打不开网页

技术日记

10天前

1、可以在“运行”中执行ipconfig flushdns来重建本地DNS缓存。2、重装IE或重装网卡驱动。3、HOSTS文件被修改，也会导致浏览的不正常，解决方法当然是清空HOSTS文件里的内容。

cf-blue-green-deploy 项目使用教程

技术日记

10天前

cf-blue-green-deploy 项目使用教程 1. 项目的目录结构及介绍 cf-blue-green-deploy├── acceptance├── coverage├── fixtures├──

拯救移动硬盘实录 - 参数不正确卡系统_参数错误格式化又正常了

技术日记

9天前

结论大多数我们碰到的硬盘故障都不是物理故障，也就是硬件没坏，所以都是能修的，不要在询问数据恢复相关的人后盲目的相信。先说结论是因为这个才是重点。最近移动硬盘莫名其妙就挂了，就是下

Windows Media Player专用VOB格式播放插件

编程

9天前

简介：此插件专为Windows Media Player设计，使得WMP能够播放VOB格式的视频文件，即DVD光盘上的主要视频容器格式。用户需要根据提供的说明逐步安装，安装过程中可能包括注册dll文件、添加滤镜或解码器等步骤。该插件不

病毒利用autorun.inf做了什么_autorun.inf利用

技术日记

9天前

病毒作者可以利用autorun.inf的自动功能，让移动设备在用户系统完全不知情的情况下，“自动”执行任何命令或应用程序。因此，通过这个autorun.inf文件，可以放置正常的启动程序，如我们经常使用的各种教学光盘，一插入电脑就自动

彻底清除U盘Autorun.inf病毒的自动化脚本

技术日记

9天前

简介：本文介绍了一个自动化脚本，专门用于删除利用Autorun.inf文件自动运行的病毒。通过一系列详细的步骤，包括断开U盘连接、显示隐藏文件、删除Autorun.inf文件、检查注册表以及全面扫描修复等，帮助用户清除病毒并提供防护建

js字体溢出字体变小_可变字体：它们是什么，以及如何使用它们

编程

9天前

js字体溢出字体变小In this article, we’ll take a look at the exciting new possibilities surrounding variable fonts —

Windows10与笔记本配合时函数紊乱？轻松搞定指南

编程

8天前

笔记本Windows10函数不正确？这里有解决方法在Windows10操作系统的使用过程中，许多笔记本电脑用户可能会遇到“函数不正确”的错误提示，这不仅影响了用户的正常使用，还可能导致一些关键功能无法正常运行。面对这种情

深度剖析：小米AX1800路由器SSH与IPv6网关设置的实操技巧

技术日记

8天前

WiFI6版本弃子，小米路由器AX1800，通过配置文件永久开启ssh和ipv6传入网关设置作为小米路由器的第一款 wifi6路由器(ax.)，最近一次的更新是2021年底，版本为

狂怒2的WPCAP.DLL丢失？轻松几步，游戏恢复流畅

编程

8天前

遇到《狂怒2》（Rage 2）游戏提示“wpcap.dll”文件丢失的问题，意味着您的系统中可能缺少或损坏了用于网络抓包和监控的WinPcap或其替代品Npcap的动态链接库文件。以下是解决此问题的步骤： 1. 安装或重新安装

WinPcap.exe出问题？三步轻松搞定wpcap.dll缺失的烦恼！

技术日记

8天前

WinPcap.exe：解决wpcap.dll缺失问题在此提供的WinPcap.exe文件，主要用于解决在部分Windows操作系统中出现的【wpcap.dll】缺失问题。该问题可能导致一些网络相关的软件无法正常运行，出现错

Win7系统下的wpcap.dll找不到了？快速修复方法分享

技术日记

8天前

wpcap.dll作为WinPcap组件之一，在Windows 7 32位系统中扮演着核心角色，专门用于实现网络数据包的捕获功能。该动态链接库的缺失，可能会直接影响到系统中网络监控及分析软件的正常运作，进而妨碍到网络安全监控与系统性能

让Flash焕发生机，快速解决wpcap.dll丢失，防患于未然

技术日记

8天前

在使用计算机的过程中，有时会遇到系统提示丢失wpcap.dll文件的情况。这种情况可能会导致某些依赖于该DLL（动态链接库）的程序无法正常运行。那么，当您遭遇这种问题时，应该如何应对呢？本文将详细介绍几种有效的解决方案，并提供一些预防

掌握C#中的Flash中心压缩与解压缩，提升项目效率

编程

8天前

【【【【C#压缩文件】】】】方法1：【filepath想要压缩文件的地址】【zippath输出压缩文件的地址】private void GetFileToZip(string f

不再为文件安全担忧！用WinRAR轻松实现压缩文件的终极保护！

技术日记

8天前

在职场中，我们经常会使用 WinRAR 来打包文档、项目文件或资料合集。压缩的好处显而易见：节省空间、方便传输、归档整洁。但你是否遇到过这些情况：压缩文件被他人解压后重新打包，原文件被篡改？项目资料被错

PHP编程中的压缩魔法：ZipArchive实例解析

编程

8天前

参考文档：1.创建新的压缩文件： functioncreateNewZip(){$zipFileName = 'D:projectvrwebtemp190627_113400.zip&

系统维护必备工具：DISM++助你轻松应对Flash中心和Player

技术日记

7天前

简介：DISM++是一款全方位的电脑维护软件，提供深度扫描和清理功能，专为优化个人计算机而设计。它能够高效清除各种系统垃圾和无用文件，释放硬盘空间，并通过系统清理、优化、备份和恢复功能提高电脑的运行速度和性能。该软件还支持多语言界面，

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

hadoop架构

更多相关文章

电脑管家如何清理内存及垃圾，提升电脑性能

《英雄联盟》游戏闪退弹窗“找不到d3dcompiler 47.dll”该如何应对？LOL英雄联盟游戏崩溃提示“缺失d3dcompiler 47.dll文件”的处理妙招

隐藏文件无法显示的解决方法_修改注册表windows隐藏文件无法显示

为什么打不开网页 ……技术_为什么有网络打不开网页

cf-blue-green-deploy 项目使用教程

拯救移动硬盘实录 - 参数不正确 卡系统_参数错误格式化又正常了

Windows Media Player专用VOB格式播放插件

病毒利用autorun.inf做了什么_autorun.inf利用

彻底清除U盘Autorun.inf病毒的自动化脚本

js字体溢出字体变小_可变字体：它们是什么，以及如何使用它们

Windows10与笔记本配合时函数紊乱？轻松搞定指南

深度剖析：小米AX1800路由器SSH与IPv6网关设置的实操技巧

狂怒2的WPCAP.DLL丢失？轻松几步，游戏恢复流畅

WinPcap.exe出问题？三步轻松搞定wpcap.dll缺失的烦恼！

Win7系统下的wpcap.dll找不到了？快速修复方法分享

让Flash焕发生机，快速解决wpcap.dll丢失，防患于未然

掌握C#中的Flash中心压缩与解压缩，提升项目效率

不再为文件安全担忧！用WinRAR轻松实现压缩文件的终极保护！

PHP编程中的压缩魔法：ZipArchive实例解析

系统维护必备工具：DISM++助你轻松应对Flash中心和Player

发表评论

推荐文章

HTTP 500: IIS里的神秘代码，我们来破译！

光纤猫与无线路由器连接教程：让你的网络覆盖无死角！

CPU占用100%的原因及解决办法_资源管理器占用cpu100%

路由器连接上但上不了网是什么故障_连上路由了为什么没网

家里的网络设备为啥用192.168？揭秘路由器设置的常见模式与技巧

热门文章

构建高效应用：.NET Framework 2.0的强大功能揭秘

打印机驱动安装失败？解决指南，让你轻松搞定！

Word删除空白页的几种高效方法_第一章后直接空了一页

五种方法查看电脑配置：从系统信息到网络安全入门

如何优雅地解决C盘空间不足的问题

使用Python实现Windows系统垃圾清理_系统垃圾清理代码

电脑没声音怎么办？电脑没声音了怎么恢复？_电脑没有声音了怎么恢复

CSS分页居中技巧

移动硬盘打开文件突然变得很卡_使用chkdsk命令后移动硬盘速度很慢

Python进程优化, 释放_excelpython释放进程

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑

拯救移动硬盘实录 - 参数不正确卡系统_参数错误格式化又正常了