Spark处理框架中的内存计算与MapReduce相同。（）

第1题

下列选项中，哪项是 Spark 性能比 Hadoop 较为领先的原因（）

A.Spark 是一个分布式数据基础设施

B.Spark 通过内存中的 DAG 有向无环图，减少落盘计算

C.Spark 是一个批处理框架

D.Spark 是一个流处理框架

点击查看答案

第2题

关于spark描述正确的是？（)

A.基于内存计算

B.高可伸缩性

C.低容错

D.分布式并行数据处理框架

点击查看答案

第3题

下面哪些是spark比Mapreduce计算快的原因（）。

A.基于内存的计算；

B.基于DAG的调度框架；

C.基于Lineage的容错机制；

D.基于分布式计算的框架；

点击查看答案

第4题

下面哪些不是spark比Mapreduce计算快的原因（）。

A.基于内存的计算

B.基于D A G 的调度框架

C.基于Lineage的容错机制

D.基于分布式计算的框架

点击查看答案

第5题

关于Spark的描述，以下哪项是错误的？（)

A.Spark是一个基于内存迭代的框架

B.Spark是一个数据分析技术栈，包含了大数据的多种计算模式

C.Spark可以采用多种编程语言进行开发，比如Scal

D.Java

E.Spark计算过程中，数据不会落地到磁盘

点击查看答案

第6题

大数据挖掘选用Spark框架的原因有（)

A.MR框架过多的磁盘操作,缺乏对分布式内存的支持

B.MR框架无法高效地支持迭代式计算

C.MR框架无法高效地支持交互式数据挖掘任务

D.MR框架无法进行分析性计算任务

点击查看答案

第7题

Spark产生的原因包括（)。

A.Spark不适合交互式处理

B.现有的各种计算框架各自为战

C.MapReduce具有很多的局限性

D.Spark只能进行交互式计算

点击查看答案

第8题

Spark比mapreduce快的原因不包括（）。

A.park基于内存迭代，而MapReduce基于磁盘迭代

B.AG计算模型相比MapReduce更有效率

C.park是粗粒度的资源调度，而MR是细粒度的资源调度。

D.park支持交互式处理，MapReduce善于处理流计算。

点击查看答案

第9题

在Spark一站式解决方案中用于图计算的框架是哪个（）

A.SparkCore

B.SparkStreaming

C.MLlib

D.GraphX

点击查看答案

第10题

Spark架构的组件包括哪些（）

A.Spark SQL在HDFS文件上可根据自定义方式进行文件与表的映射关系

B.Spark Streaming准实时流计算框架，数据可以消费MQ，Kafka等

C.Spark MLlib机器机器学习算法库，封装了主流的机器学习算法

D.Spark GraphX进行基于图计算的服务支持

点击查看答案

第11题

关于大数据及应用的描述，不正确的是（）

A.ume属于Apache的顶级项目，他是一款高性能、高可用的分布式日志收集系统

B.MapRaduce模式的主要思想是自动将一个大的计算（如程序）拆解成Map（映射）和Raduce（化简）

C.Kafka架构分为两层，即生产者（ Producer）和消费者（ Consumer），他们之间可以直接发送消息

D.与HaDoop相比，Spark的中间数据存放在内存中，对于迭代运算而言，效率更高

点击查看答案