下列有关大数据处理框架Hadoop的说法错误的是()
A.Hadoop通过并行处理加快处理速度
B.Hadoop的集群往往需要昂贵的机器来构建
C.Hadoop是可靠的,维护多个数据副本
D.Hadoop支持分布式计算
A.Hadoop通过并行处理加快处理速度
B.Hadoop的集群往往需要昂贵的机器来构建
C.Hadoop是可靠的,维护多个数据副本
D.Hadoop支持分布式计算
第3题
A.Spark是用于大规模数据存储的NoSQL数据库
B.Spark的计算模式也属于MapReduce
C.Spark可以完全代替Hadoop
D.Spark可以进行实时数据流的数据处理
第8题
A.Pig:处理大规模数据的脚本语言
B.Tez:支持DAG作业的计算框架
C.Oozie:工作流和协作服务引擎
D.Kafka:分布式发布订阅消息系统
第9题
A.大数据平台中,B域、M域、O域及DPI信令等各类数据集中存储,一旦发生安全事件则可涉及海量客户敏感信息及公司数据资产。
B.大数据多部署在云环境中,由于存储、计算的多层面虚拟化,带来了数据管理权与所有权分离,网络边界模糊等新问题
C.大数据平台多使用Hadoop、Hive、第三方组件等开源软件,这些软件设计初衷是为了高效数据处理,系统性安全功能相对缺乏,安全防护能力远远滞后业务发展,存在安全漏洞
D.敏感数据跨部门、跨系统留存,任一单位或系统安全防护措施不当,均可能发生敏感数据泄漏,造成“一点突破、全网皆失”的严重后果。
第10题
A.分为映射,映射为Map阶段
B.分为减速,减速为Reduce阶段
C.分为映射,映射为Reduce阶段
D.分为减速,减速为Map阶段
第11题
A.计算资源标签调度是yarm的特征,存储资源调度是HDFS的特征
B.通过存储资源标签,可以将在线应用数据存储在SAS盘节点的HDFS目录下,而离线应用数据存储在SATA盘节点对应的HDFS目录下
C.通过计算资源标签,可以将spark作业调度到大内存节点上运行,而MR作业调度在标配内存节点上运行
D.计算资源和存储资源的标签通常配合使用,是为了将指定的应用跨节点访问计算和数据资源