admin 管理员组文章数量: 1086019
2024年4月16日发(作者:substring函数截取后2位)
南开大学2021年9月《大数据开发技术》作业考核试题及答案参考
1. 数据归约(Data Reduction)主要有( )。
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
参考答案:ABCD
2. 以下哪个方法可以创建RDD( )
elize
D
le
le
参考答案:ABC
3. SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD。
A.正确
B.错误
参考答案:B
4. RDD的( )操作通常用来划分单词
p
titions
参考答案:C
5. 矩阵连乘问题的算法可由动态规划设计实现。( )
A.错误
B.正确
参考答案:B
( )
6. 快速排序算法的性能取决于划分的对称性。( )
A.错误
B.正确
参考答案:B
7. 决策树是( )的常用算法
A.分类
B.聚类
C.降维
D.回归
参考答案:AD
8. Scala中使用( )方法来查看两个集合的交集元素
.&
.&&
ect
参考答案:BD
9. Scala通过( )来定义变量
参考答案:A
10. RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回
到Driver 端,适用于大数据处理后的返回。( )
T.对
F.错
参考答案:F
11. 按照数据量的大小,可将数据分析分为内存级数据分析、Bl级数据分析和海
量级数据分析。( )
A.对
B.错
参考答案:A
12. 哪些属于数据可视化的重要作用( )
A.分析数据
B.采集数据
C.辅助理解数据
D.观测跟踪数据
参考答案:ACD
13. 大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高
的延迟。( )
A.正确
B.错误
参考答案:A
14. 很多企业为了支持决策分析而构建的数据仓库系统,其中存放的大量历史数据
就是( )数据。技术人员可以利用数据挖掘和OLAP分析工具从静态数据中找到对
企业有价值的信息。
A.动态
B.存量
C.实时
D.静态
参考答案:D
15. 回溯法解旅行售货员问题时的解空间树是( )。
A.子集树
B.排列树
C.深度优先生成树
D.广度优先生成树
参考答案:A
16. Storm中如果要让所有的Tuple都发送到同一个Task中,应该采用哪种
Stream Groupings( )。
eGrouping
uping
Grouping
Grouping
参考答案:C
17. Spark DataFrame中( )方法可以返回一个Array对象
t
List
tAsList
参考答案:AB
18. Hbase中( )是最核心的模块,负责维护分配给自己的Region,并响应用户的
读写请求
服务器
D.客户端
参考答案:C
19. UMP系统中面对多个小规模用户如何进行资源调度( )
A.可以共享同一个MySQL实例
B.每个用户独占一个MySQL实例
C.会占用多个独立的MySQL实例
D.随机分配MySQL实例
参考答案:A
版权声明:本文标题:南开大学2021年9月《大数据开发技术》作业考核试题及答案参考10_ 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.roclinux.cn/b/1713252266a626045.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论