admin 管理员组

文章数量: 1086019


2024年4月16日发(作者:substring函数截取后2位)

南开大学2021年9月《大数据开发技术》作业考核试题及答案参考

1. 数据归约(Data Reduction)主要有( )。

A.维度规约

B.样本规约

C.数据聚集

D.离散化概念分层

参考答案:ABCD

2. 以下哪个方法可以创建RDD( )

elize

D

le

le

参考答案:ABC

3. SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD。

A.正确

B.错误

参考答案:B

4. RDD的( )操作通常用来划分单词

p

titions

参考答案:C

5. 矩阵连乘问题的算法可由动态规划设计实现。( )

A.错误

B.正确

参考答案:B

( )

6. 快速排序算法的性能取决于划分的对称性。( )

A.错误

B.正确

参考答案:B

7. 决策树是( )的常用算法

A.分类

B.聚类

C.降维

D.回归

参考答案:AD

8. Scala中使用( )方法来查看两个集合的交集元素

.&

.&&

ect

参考答案:BD

9. Scala通过( )来定义变量

参考答案:A

10. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回

到Driver 端,适用于大数据处理后的返回。( )

T.对

F.错

参考答案:F

11. 按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海

量级数据分析。( )

A.对

B.错

参考答案:A

12. 哪些属于数据可视化的重要作用( )

A.分析数据

B.采集数据

C.辅助理解数据

D.观测跟踪数据

参考答案:ACD

13. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高

的延迟。( )

A.正确

B.错误

参考答案:A

14. 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据

就是( )数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对

企业有价值的信息。

A.动态

B.存量

C.实时

D.静态

参考答案:D

15. 回溯法解旅行售货员问题时的解空间树是( )。

A.子集树

B.排列树

C.深度优先生成树

D.广度优先生成树

参考答案:A

16. Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种

Stream Groupings( )。

eGrouping

uping

Grouping

Grouping

参考答案:C

17. Spark DataFrame中( )方法可以返回一个Array对象

t

List

tAsList

参考答案:AB

18. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的

读写请求

服务器

D.客户端

参考答案:C

19. UMP系统中面对多个小规模用户如何进行资源调度( )

A.可以共享同一个MySQL实例

B.每个用户独占一个MySQL实例

C.会占用多个独立的MySQL实例

D.随机分配MySQL实例

参考答案:A


本文标签: 数据 用户 算法 实例 划分