查答案就用赞题库小程序 还有拍照搜题 语音搜题 快来试试吧
无需下载 立即使用

你可能喜欢

多项选择题

A.hive.exec.compress.intermediate
B.hive.intermediate.compression.codec
C.hive.exec.compress.output
D.hive.intermediate.compression.type

单项选择题

A.获取数据,并将原始数据转化成自己处理的数据对象
B.缓存数据,根据不同的可靠性策略,将数据保存在内存或文件上
C.输出数据到目的地,支持多种输出协议
D.拆分数据,根据数据的特性,将数据发送到不同的目的地

判断题

向HBase集群中增加RegionServer主机时,必须先停止原集群,原因是HBase不支持动态扩容。()

参考答案:

单项选择题

A.分区字段要在创建表时定义
B.分区字段只能有一个,不可以创建多级分区
C.使用分区,可以减少某些查询的数据扫᧿范围,进而ᨀ高查询效率
D.分区字段可以作为where字句的条件

判断题

在Spark中,因为DataFrame是比RDD更上层的接口,调用层次会更多。因此,所有基于DataFrame开发的程序的性能会比基于RDD开发的程序的性能差。()

参考答案:

判断题

在Fusionlnsight HD中,Spark默认采用YARN作为集群资源管理系统。()

参考答案:

多项选择题

A.优先从最近的DataNode下载数据
B.文件数据先从DataNode返回至NameNode,然后从NameNode下致到客户端
C.如果客户端和所连接的DataNode在读取时出现故障,那么客户端会放弃这其他副本所在的节点
D.支持多个客户端同时从DataNode上读取同一个文件数据

判断题

Spark Streaming作为微批处理的流处理引擎,是将每个时间分片的数据转换为一个RDD中的一个分区进行计算。()

参考答案:

判断题

对于N〈N>1〉副本存储的文件,HDFS客户端发起读取文件请求,如果所读副本节点故障,直接返回失败,不会转到其他副本节点进行读取。()

参考答案:
赞题库

赞题库-搜题找答案

(已有500万+用户使用)


  • 历年真题

  • 章节练习

  • 每日一练

  • 高频考题

  • 错题收藏

  • 在线模考

  • 提分密卷

  • 模拟试题

无需下载 立即使用

版权所有©考试资料网(ppkao.com)All Rights Reserved