首页技术日记正文内容

(完整版)大数据试题

技术日记

更新时间：2026-04-04 01:54:00 89

admin 管理员组

文章数量: 1184232

2024年3月13日发(作者：sql2022安装教程)

一、填空题（将正确的答案写入答题纸中。每空1分，共20分）

1、HDFS有 _ NameNode__ _，_ DataNode__ _和_ SecondaryNameNode__ _组成；

2、

Hadoop集群可以运行在

_ 单机模式__ _，_ 伪分布式模式__ _和_ 完全分布式

模式__ _

3个模式？

3、安装完全分布式Apache Hadoop的核心配置文件有

_ __ _

_ hdfs-

__ _

_ __ _

。

4、HBase中通过_ HDFS__ _存储底层数据,通过_ _Zookeeper_ _提供消息通信机制

5、HIVE默认采用_ _ Derby _ __ __ _数据库进行元数据的存储，而真实的数据是存储在

_ __HDFS __ __ _中。

6、如何在浏览器中查看HDFS运行状况的默认端口号是_ 50070__ _查看yarn运行状态的

默认端口号是_ 8088__ _

7、HDFS中当前block大小为128M,如果当前要上传到HDFS中的文件大小为300M，那

么在存储时会分配_ 3__ _个block进行存储。

8、HDFS 获取根目录下的文件列表的命令shell命令是_hadoop fs -ls -R / __ __ __ __

__ _；根目录下创建hdfs文件夹的shell命令是_ _ hadoop fs -mkdir /hdfs__ __ __ __

_ 。

9、YARN架构中整个集群同一时间提供服务的ResourceManager有_ 1__ _个，负责集群资

源的统一管理和调度。

二、选择题（将正确的答案写入答题纸中。每题2分，共20分）

1、配置Hadoop时，JAVA_HOME包含在哪一个配置文件中(B)

A．

B．

C．

D．

2、下面哪个程序负责 HDFS 数据存储。（C）

A)NameNode

B)Jobtracker

C)Datanode

D)secondaryNameNode

3、下列关于Hadoop API的说法错误的是（A）

A． Hadoop的文件API不是通用的，只用于HDFS文件系统

B． Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的

C． FileStatus对象存储文件和目录的元数据

D． FSDataInputStream是putStream的子类

4、HDfS 中的 block 默认保存几份? （A）

A)3 份

B)2 份

C)1 份

D)不确定

5、为销售报表展示开发一个MapReduce作业，Mapper输入数据的Key是年份（IntWritable），

Value表示商品标识（Text）。下列哪一项决定该Mapper的数据类型？（D）

A. InputKeyClass与InputValuesClass

B. HADOOP_MAP_DATATYPES环境变量

C. 随作业一起提交的文件

D. InputFormat格式类

6、HDFS无法高效存储大量小文件，想让它能处理好小文件，比较可行的改进策略不包括

（D）

A. 利用SequenceFile、MapFile、Har等方式归档小文件

B. 多Master设计

C. Block大小适当调小

D. 调大namenode内存或将文件系统元数据存到硬盘里

7、下列哪个程序通常与NameNode 在一个节点启动？（D）

a)SecondaryNameNode

b)DataNode

c)TaskTracker

d)Jobtracker

8、下面与 HDFS 类似的框架是？（C）

(A) NTFS

(B) FAT32

(D) EXT3

9 、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的，默认的最基本的存储

单位是64M，具有高容错、高可靠性、高可扩展性、高吞吐率等特征，适合的读写任务是

（C）

A．一次写入，少次读写

B．多次写入，少次读写

C．一次写入，多次读写

D．多次写入，多次读写

10、

HBase中的批量加载底层使用（A）实现。

A MapReduce

B Hive

C Coprocessor

D Bloom Filter

三、简答题（将正确的答案写入答题纸中。每题5分，共20分）

1、简述下HDFS 数据读流程；

答：步骤如下，能大致描述清楚流程，没有关键错误即可

1、跟namenode通信查询元数据（block所在的datanode节点），找到文件块所在的datanode

服务器

2、挑选一台datanode（就近原则，然后随机）服务器，请求建立socket流

3、datanode开始发送数据（从磁盘里面读取数据放入流，以packet为单位来做校验）

4、客户端以packet为单位接收，先在本地缓存，然后写入目标文件，后面的block块就相

当于是append到前面的block块最后合成最终需要的文件。

2、如何查看hadoop 进程并列出hadoop的几个进程名

答：使用jps命令可查看hadoop进程。 Namenode, SecondaryNameNode，Datanode ，

ResourceManager， NodeManager

3、请简述MapReduce中combiner、partition的作用

答：

combiner：

有时一个map可能会产生大量的输出，combiner的作用是在map端对输出先做一次合并，

以减少网络传输到reducer的数量。

注意：mapper的输出为combiner的输入，reducer的输入为combiner的输出。

partition：

把map任务输出的中间结果按照key的范围划分成R份(R是预先定义的reduce任务的个

数)，划分时通常使用hash函数，如：hash(key) mod R

这样可以保证一段范围内的key，一定会由一个reduce任务来处理。

4、HBase的检索支持3种方式是哪些？

答：

（1）通过单个Rowkey访问，即按照某个Rowkey键值进行get操作，这样获取唯一一条

记录；

（2）通过Rowkey的range进行scan，即通过设置startRowKey和endRowKey，在这个范

围内进行扫描。这样可以按指定的条件获取一批记录；

（3）全表扫描，即直接扫描整张表中所有行记录。

四、程序题（将正确的答案写入答题纸中。每题10分，共20分）

1、以一段文本作为输入对象，写一个WordCount程序。

例如文本数据的情况如下

本文标签：文件数据默认输出

版权声明：本文标题：(完整版)大数据试题内容由网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：http://www.roclinux.cn/p/1710341531a568555.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

Macbook 显示隐藏的文件文件夹_mac显示隐藏文件夹

技术日记

11天前

前言使用命令行的方式显示隐藏文件。提示：以下是本篇文章正文内容，下面案例可供参考一、mac显示隐藏文件在终端输入 defaults write com.apple.finder Apple

小米路由器SSH安装与alist服务自动化部署,

编程

10天前

1.安装开发版2.刷ssh3.putty用ssh模式连接到路由器，用户名root，密码见小米路由器开ssh网页时的提示。4.下载alist的linux二进制文件包。选3.28.0. 下载正确

R3nzSkin常见问题解答：解决注入失败、游戏崩溃等10大痛点

编程

10天前

R3nzSkin常见问题解答：解决注入失败、游戏崩溃等10大痛点 R3nzSkin作为一款热门的《英雄联盟》皮肤修改工具，帮助玩家自定义游戏体验。但在使用过程中，许多用户会遇到注入失败、游戏崩溃等问题。本文汇总了10个最常见的

如何利用 Media Creation Tool 来创建安装介质或 ISO 文件_mediacreationtooliso没有专业版

技术日记

10天前

Window 10 Media Creation Tool 的另一个功能是它可以帮助你为另一台 PC 创建安装介质或下载 ISO 文件。选择 Windows 10 时，所有 Windows 10 版本都可用，企业版除外。完成后，你可以使

为什么打不开网页 ……技术_为什么有网络打不开网页

技术日记

10天前

1、可以在“运行”中执行ipconfig flushdns来重建本地DNS缓存。2、重装IE或重装网卡驱动。3、HOSTS文件被修改，也会导致浏览的不正常，解决方法当然是清空HOSTS文件里的内容。

Ghost11简体中文版：全面应用指南与技巧

技术日记

10天前

简介：Ghost11作为Symantec公司开发的著名系统备份与恢复软件，引入简体中文界面，极大提升了国内用户的使用便捷性。本指南深入解析了Ghost11的核心功能，包括全盘克隆、分区克隆、映像文件创建与还原、自动备份计划和网络克隆等

【软件】DVDStyler报错找不到VOB文件_err:2 opening input video file

技术日记

10天前

DVDStyler失败报错找不到VOB文件零、错误如下ERR:2 opening input video file “D:MinuhyDesktopdvdtdvd-cacheentry001.vo

解读Autorun.inf病毒和autorun.inf_光盘里有autorun exe

编程

10天前

这几天我的机子病毒大暴发，其中有一种病毒就是关于autorun.inf的。和它一起运行的是sxs.exe文件。它在每个驱动盘下都有这两个文件，并且文件夹选项里显示所有隐藏文件和文件夹选中后又会被改回去，很苦恼啊！于是上网查了一些这方面

删除autorun.inf病毒的批处理简单三招预防_autoruninf批处理

编程

10天前

选择“显示隐藏文件”这一选项后，发现U盘有个文件闪出来一下就马上又消失了，而再打开文件夹选项时，发现仍就是“不显示隐藏文件”这一选项。而且刚发现点击C、D等盘符图标时会另外打开一个窗口！这就是臭名昭著的autorun.inf病毒，下面

Msinfmgr和Autorun.inf病毒火热流行！

编程

10天前

近日，Msinfmgr和Autorun.inf病毒异常火暴，尤以高校为主。有中招者，U盘所到之处，系统全部重装！该病毒是以U盘为主要载体进行传播的，查看Autorun.ini文件应该会发现其自动调用Msinfmgr.exe的字样，即U

电脑用久了又卡又慢，教你一招让你电脑调整为最佳性能_电脑卡顿怎么办教你一招恢复流畅

技术日记

9天前

我相信每个人都有这样的经历。电脑用久了卡顿、变慢怎么办？教你学会这些操作，瞬间提升电脑速度，让我们来看看。方法一：清理磁盘空间电脑死机很可能是因为C盘空间不足，长期使用会产生大量的缓存垃圾。因此，您需要打开【本电脑

一学就会：EasyRecovery简易指南帮你快速恢复误删的文件

技术日记

9天前

简介：EasyRecovery是一款高效的文件恢复软件，它帮助用户恢复因误删除、格式化或其他原因丢失的文件。该工具扫描未被覆盖的硬盘空间，找回丢失文件的元数据和内容。它支持包括硬盘、外部硬盘、USB驱动器和SD卡在内的多种存储设备，并

EasyRecovery：Windows系统下的神奇文件恢复工具，让你的SWF文件起死回生！

编程

8天前

简介：EasyRecovery是一款为Windows用户打造的高效文件恢复工具，可轻松找回误删除或丢失的重要数据。软件操作简便，界面直观，适合所有层次的用户使用。其核心功能包括深度扫描未实际删除的文件、支持多种文件格式恢复，并提供文件

EasyRecovery实战指南：从新手到高手，Windows文件恢复轻松搞定！

编程

8天前

遇到wpcap.dll问题？解决攻略与预防小妙招，一步到位

编程

8天前

在使用计算机的过程中，有时会遇到系统提示丢失wpcap.dll文件的情况。这种情况可能会导致某些依赖于该DLL（动态链接库）的程序无法正常运行。那么，当您遭遇这种问题时，应该如何应对呢？本文将详细介绍几种有效的解决方案，并提供一些预防

面对wpcap.dll缺失？立即采取行动，确保网络监控工具有效运行

编程

8天前

wpcap.dll是Windows系统中用于网络数据包捕获的关键文件，缺失或损坏会影响网络监控工具的运行。以下是针对缺少wpcap.dll文件的最新修复方法：一、重新安装WinPcap或Npcap访问WinPca

让Flash焕发生机，快速解决wpcap.dll丢失，防患于未然

技术日记

8天前

解决Flash Player启动问题：快速找到并修复wpcap.dll

技术日记

8天前

方法一：下载一个everything，用everything搜索一下本地是否有wpcap.dll，可能是因为存在的目录位置不对，而导致找不到。这种请况就将对应dll文件拷贝到目标目录下，将wpcap.dll复制到C：WindowsS

自动解压秘籍：Python帮你搞定各种压缩文件

编程

8天前

压缩文件是我们在使用电脑时经常会遇到的。压缩文件并不只有一种压缩模式。平常我们都是通过安装一些解压缩软件来打开这些不同的压缩文件。今天我们来谈一谈，如何用Python解压几种常见类型的压缩文件。一、需求描述编写

当Windows系统出问题时，如何借助DISM挂载映像进行修复，让电脑焕然一新？

技术日记

8天前

如何使用DISM对Windows系统映像进行修复在前些天我更新电脑驱动的时候，更新程序报错了。我检查后发现是系统映像完整性的问题。在我解决完问题后，我决定把这个解决的过程记录下来，希望能帮到别人。那么正文开始

发表评论

全部评论 0

暂无评论

Linux大棚 – 不忘初心的技术博客，浮躁时代的安静角落

(完整版)大数据试题

更多相关文章

Macbook 显示隐藏的文件文件夹_mac显示隐藏文件夹

小米路由器SSH安装与alist服务自动化部署,

R3nzSkin常见问题解答：解决注入失败、游戏崩溃等10大痛点

如何利用 Media Creation Tool 来创建安装介质或 ISO 文件_mediacreationtooliso没有专业版

为什么打不开网页 ……技术_为什么有网络打不开网页

Ghost11简体中文版：全面应用指南与技巧

【软件】DVDStyler报错找不到VOB文件_err:2 opening input video file

解读Autorun.inf病毒和autorun.inf_光盘里有autorun exe

删除autorun.inf病毒的批处理 简单三招预防_autoruninf批处理

Msinfmgr和Autorun.inf病毒火热流行！

电脑用久了又卡又慢，教你一招让你电脑调整为最佳性能_电脑卡顿怎么办教你一招恢复流畅

一学就会：EasyRecovery简易指南帮你快速恢复误删的文件

EasyRecovery：Windows系统下的神奇文件恢复工具，让你的SWF文件起死回生！

EasyRecovery实战指南：从新手到高手，Windows文件恢复轻松搞定！

遇到wpcap.dll问题？解决攻略与预防小妙招，一步到位

面对wpcap.dll缺失？立即采取行动，确保网络监控工具有效运行

让Flash焕发生机，快速解决wpcap.dll丢失，防患于未然

解决Flash Player启动问题：快速找到并修复wpcap.dll

自动解压秘籍：Python帮你搞定各种压缩文件

当Windows系统出问题时，如何借助DISM挂载映像进行修复，让电脑焕然一新？

发表评论

推荐文章

Ubuntu新手必备：静态IP配置步骤详述

SSM新闻热点微信小程序 基于SSM框架的新闻热点小程序开发 微信小程序中的新闻资讯管理系统

cpu温度过高怎么办？7种有效解决方法分享_冷机状态开机cpu温度高怎么办

CPU温度过高导致性能下降如何解决？_编程语言-问答

电脑族护眼小技巧：调整桌面颜色与浏览器背景

热门文章

解密Tomcat启动失败代码500，通过日志快速定位问题

激活Typora，解锁深度写作与编辑功能，提升效率

VB6 ByRef用法困惑？解答类型不匹配的难题！

Linux电脑配置秘闻：如何高效地了解你的硬件信息？

生成exe目录问题_to correct this, please make sure that $(outdir),

如何查看电脑IP地址？_查找电脑ip地址命令

简易烟雾监测系统搭建(一) 烟雾传感原理篇_光电式烟雾传感器原理图

如何在Linux中查找您的路由器的IP地址_linux查看路由器ip

Python进程优化, 释放_excelpython释放进程

‘xxx‘ “将对您的电脑造成伤害。 您应该将它移到废纸篓。”mac一直弹窗并关不掉的解决方式_“docker”将对你的电脑造成伤害。 你应该将它移到废纸篓。

最新文章

一文教会你AIX系统备份：mksysb实用指南

SWF文件备份失败？这些步骤让你轻松搞定

Win10系统备份轻松搞定：掌握captureimage命令的关键技巧

Linux系统安全小贴士：掌握备份与恢复，安心每一天

省时省心！三步完成电脑系统高效备份！

Ubuntu系统维护秘籍：备份步骤详解，保护你的劳动成果！

Linux系统不哭：高效备份与快速恢复方案

Ubuntu系统安全大计，备份技巧大公开

GHOST教程：系统备份和还原，小白也能变成高手！

Linux备份与恢复必修课：SWF文件安全策略从入门到精通

Exploring the Finest Accommodations: A Comprehensive Guide to Ruston LA Hotels

The Enchanting Experience of ScaliniTella NYC: A Culinary Gem in the Heart of Manhattan

Exploring the Exquisite Aloft Chicago O'Hare: A Blend of Modern Luxury and Convenience

A Culinary Journey: Discovering the Finest Dining Experiences in Waco, TX

A Culinary Journey: Discovering the Finest Dining Experiences in Athens, GA

电脑设备管理器在哪里？一次让我抓狂又兴奋的寻找经历

与GWX的持久战：一段关于Windows10升级弹窗的私人记忆

以管理员身份运行：那些年我们追过的权限与踩过的坑

删除autorun.inf病毒的批处理简单三招预防_autoruninf批处理

SSM新闻热点微信小程序基于SSM框架的新闻热点小程序开发微信小程序中的新闻资讯管理系统

‘xxx‘ “将对您的电脑造成伤害。您应该将它移到废纸篓。”mac一直弹窗并关不掉的解决方式_“docker”将对你的电脑造成伤害。你应该将它移到废纸篓。