问答题X 纠错

参考答案:

流数据具有如下特征:
1、数据快速持续到达,潜在大小也许是无穷无尽的数
2、据来源众多,格式复杂
3、数据量大,但是不十分关注存储,一旦经过处理,要么被丢弃,要么被归档存储
4、注重数据的整体价值,不过分关注个别数据
5、数据顺序颠倒,或者不完整,系统无法控制将要处理的新到达的数据元素的顺序

查答案就用赞题库小程序 还有拍照搜题 语音搜题 快来试试吧
无需下载 立即使用

你可能喜欢

问答题

试述流数据的概念

参考答案:流数据,即数据以大量、快速、时变的流形式持续到达

问答题

Spark对RDD的操作主要分为行动(Action)和转换(Transformation)两种类型,两种类型操作的区别是什么?

参考答案:行动(Action):在数据集上进行运算,返回计算值。转换(Transformation):基于现有的数据集创建一个新的...

问答题

试述如下Spark的几个主要概念:RDD、DAG、阶段、分区、窄依赖、宽依赖。

参考答案:①RDD:是弹性分布式数据集(Resilient Distributed Dataset)的英文缩写...

问答题

试述“Spark on YARN”的概念。

参考答案:Spark可以运行与YARN之上,与Hadoop进行统一部署,即“Spark on YA...

问答题

从Hadoop+Storm架构转向Spark架构可带来哪些好处?

参考答案:(1)实现一键式安装和配置、线程级别的任务监控和告警;(2)降低硬件集群、软件维护、任务监控和应用开发的难度;(3)便于...

问答题

Spark已打造出结构一体化,功能多样化的大数据生态系统,试述Spark的生态系统。

参考答案:Spark的设计遵循“一个软件栈满足不同应用场景”的理念,逐渐形成一套完整生态系统,既能够提供内存计算框架,也可以支持S...

问答题

美国加州大学伯克利分校提出的数据分析的软件栈BDAS认为目前的大数据处理可以分为哪三个类型?

参考答案:①复杂的批量数据处理:时间跨度通常在数十分钟到数小时之间;②基于历史数据的交互式查询:时间跨度通常在数十秒到数分钟之间;...

问答题

Spark的出现是为了解决Hadoop MapReduce的不足,试列举Hadoop MapReduce的几个缺陷,并说明Spark具备哪些优点。

参考答案:(1)Hadoop存在以下缺点:①表达能力有限;②磁盘IO开销大;③延迟高(2)Spark主要有如下优点:①Spark的...

问答题

Spark是基于内存计算的大数据计算平台,试述Spark的主要特点。

参考答案:

S.park具有如下4个主要特点:
①运行速度快;②容易使用;③通用性;④运行模式多样。

问答题

请分别描述Pig、Tez和Kafka的功能。

参考答案:①Pig是Hadoop生态系统的一个组件,提供了类似SQL的Pig Latin语言(包含Filter、Grou...
赞题库

赞题库-搜题找答案

(已有500万+用户使用)


  • 历年真题

  • 章节练习

  • 每日一练

  • 高频考题

  • 错题收藏

  • 在线模考

  • 提分密卷

  • 模拟试题

无需下载 立即使用

版权所有©考试资料网(ppkao.com)All Rights Reserved