联大学堂河南财经政法大学Hadoop基础与实践网上考试答案
LSM的读操作和写操作是独立的? |
A.是。 B.否。 C.LSM并不区分读和写 D.LSM中读写是同一种操作 |
|
配置Hadoop时,JAVA_HOME包含在哪一个配置文件中 |
A.hadoop-default.xml B.hadoop-env.sh C.hadoop-site.xml D.configuration.xsl |
|
HBase依赖______提供强大的计算能力。 |
A.Zookeeper B.Chubby C.RPC D.MapReduce |
|
LSM结构的数据首先存储在()。 |
A.硬盘上 B.内存中 C.磁盘阵列中 D.闪存中 |
|
HBase分布式模式最好需要()个节点? |
A.1 B.2 C.3 D.最少 |
|
Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是 |
A.Hadoop B.Nutch C.Lucene D.Solr |
|
HDFS默认的当前工作目录是/user/$USER,fs.default.name的值需要在哪个配置文件内说明 |
A.mapred-site.xml B.core-site.xml C.hdfs-site.xml D.以上均不是 |
|
HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件: |
A.日志 B.命名空间镜像 C.两者都是 D. |
|
下列哪个程序通常与NameNode 在同一个节点启动_____。 |
A.TaskTracker B.DataNode C.SecondaryNameNode D.Jobtracker |
|
HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是______。 |
A.一次写入,少次读 B.多次写入,少次读 C.多次写入,多次读 D.一次写入,多次读 |
|
HBase依赖()提供强大的计算能力 |
A.Zookeeper B.Chubby C.RPC D.MapReduce |
|
HDFS 默认Block Size的大小是______。 |
A.32MB B.64MB C.128MB D.256M |
|
Hadoop配置文件中,hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中,hadoop-site.xml被分离成三个XML文件,不包括 |
A.conf-site.xml B.mapred-site.xml C.core-site.xml D.hdfs-site.xml |
|
关于HDFS的文件写入,正确的是 |
A.支持多用户对同一个文件的写操作 B.用户可以在文件的任意位置进行修改 C.默认将文件复制成三份存放 D.复制的文件默认都存在同一机架上 |
|
LSM更能保证哪种操作的性能? |
A.读 B.写 C.随机读 D.合并 |
|
下面与HDFS类似的框架是()? |
A.NTFS B.FAT32 C.GFS D.EXT3 |
|
HBase中的批量加载底层使用()实现。 |
A.MapReduce B.Hive C.Coprocessor D.Bloom Filter |
|
HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括 |
A.利用SequenceFile、MapFile、Har等方式归档小文件 B.多Master设计 C.Block大小适当调小 D.调大namenode内存或将文件系统元数据存到硬盘里 |
|
关于SecondaryNameNode 下面哪项是正确的() |
A.它是NameNode 的热备 B.它对内存没有要求 C.它的目的是帮助NameNode 合并编辑日志,减少NameNode 启动时间 D.SecondaryNameNode 应与NameNode 部署到一个节点 |
|
下面与Zookeeper类似的框架是? |
A.Protobuf B.Java C.Kafka D.Chubby |
|
为销售报表展示开发一个MapReduce作业,Mapper输入数据的Key是年份(IntWritable),Value表示商品标识(Text)。下列哪一项决定该Mapper的数据类型? |
A.JobConf.setMapInputKeyClass与JobConf.setMapInputValuesClass B.HADOOP_MAP_DATATYPES环境变量 C.随作业一起提交的mapper-specification.xml文件 D.InputFormat格式类 |
|
HBase虚拟分布式模式需要()个节点? |
A.1 B.2 C.3 D.最少3个 |
|
出现在datanode的VERSION文件格式中但不出现在nomenode的VERSION文件格式中的是 |
A.namenodeID B.storageID C.storageType D.layoutVersion |
|
关于Hadoop单机模式和伪分布式模式的说法,正确的是 |
A.两者都起守护进程,且守护进程运行在一台机器上 B.单机模式不使用HDFS,但加载守护进程 C.两者都不与守护进程交互,避免复杂性 D.后者比前者增加了HDFS输入输出以及可检查内存使用情况 |
|
HFile数据格式中的MetaIndex字段用于()。 |
A.Meta块的长度 B.Meta块的结束点 C.Meta块数据内容 D.Meta块的起始点 |
|
HBase依赖()提供消息通信机制 |
A.Zookeeper B.Chubby C.RPC D.Socket |
|
HDFS是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高扩展性、高吞吐率等特征,适合的读写任务是 |
A.一次写入,少次读写 B.多次写入,少次读写 C.一次写入,多次读写 D.多次写入,多次读写 |
|
HBase依靠()存储底层数据 |
A.HDFS B.Hadoop C.Memory D.MapReduce |
|
下列关于Hadoop API的说法错误的是 |
A.Hadoop的文件API不是通用的,只用于HDFS文件系统 B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的 C.FileStatus对象存储文件和目录的元数据 D.FSDataInputStream是java.io.DataInputStream的子类 |
|
以下哪一项不属于Hadoop可以运行的模式() |
A.单机(本地)模式 B.伪分布式模式 C.互联模式 D.分布式模式 |
|
NameNode在启动时自动进入安全模式,在安全模式阶段,说法错误的是 |
A.安全模式目的是在系统启动时检查各个DataNode上数据块的有效性 B.根据策略对数据块进行必要的复制或删除 C.当数据块最小百分比数满足最小副本数条件时,会自动退出安全模式 D.文件系统允许有修改 |
|
HBase依赖______提供消息通信机制 |
A.Zookeeper B.Chubby C.RPC D.Socket |
|
HBase依靠______存储底层数据。 |
A.HDFS B.Hadoop C.Memory D.MapReduce |
|
大数据的特点不包括下面哪一项______。 |
A.巨大的数据量 B.多结构化数据 C.增长速度快 D.价值密度高 |
|
HBase来源于哪一项? |
A.The Google File System B.MapReduce C.BigTable D.Chubby |
|
下面与HDFS类似的框架是? |
A.NTFS B.FAT32 C.GFS D.EXT3 |
|
Clinet在HDFS上进行文件写入时,namenode根据文大小和配置情况,返回部分DataNode信息,谁负责将文件划分为多个block,根据DataNode的地址信息按顺序写入到每一个DataNode块 |
A.Clinte B.NameNode C.DataNode D.Secondary namenode |
|
HFile数据格式中的KeyValue数据格式中Value部分是()。 |
A.拥有复杂结构的字符串 B.字符串 C.二进制数据 D.压缩数据 |
|
HFile数据格式中的Data字段用于()。 |
A.存储实际的KeyValue数据 B.存储数据的起点 C.指定字段的长度 D.存储数据块的起点 |
|
Hadoop的作者是下面哪一位______。 |
A.Martin Fowler B.Doug cutting C.Kent Beck D.Grace Hopper |
|
HFile数据格式中的Magic字段用于()。 |
A.存储随机数,防止数据损坏 B.存储数据的起点 C.存储数据块的起点 D.指定字段的长度 |
|
LSM含义是? |
A.日志结构合并树 B.二叉树 C.平衡二叉树 D.基于日志结构的合并树 |
|
下列关于MapReduce说法不正确的是______。 |
A.MapReduce是一种计算框架 B.MapReduce来源于google的学术论文 C.MapReduce程序只能用java语言编写 D.MapReduce隐藏了并行计算的细节,方便使用 |
|
下列哪项通常是集群的最主要瓶颈______。 |
A.CPU B.网络 C.磁盘IO D.内存 |
|
MapReduce与HBase的关系,哪些描述是正确的? |
A.两者不可或缺,MapReduce是HBase可以正常运行的保证 B.两者不是强关联关系,没有MapReduce,HBase可以正常运行 C.MapReduce可以直接访问HBase D.它们之间没有任何关系 |
|
下面对LSM结构描述正确的是? |
A.顺序存储 B.直接写硬盘 C.需要将数据Flush到磁盘 D.是一种搜索平衡树 |
|
关于HBase二级索引的描述,哪些是正确的? |
A.核心是倒排表 B.二级索引概念是对应Rowkey这个“一级”索引 C.二级索引使用平衡二叉树 D.二级索引使用LSM结构 |
|
Rowkey设计的原则,下列哪些选项的描述是正确的? |
A.尽量保证越短越好 B.可以使用汉字 C.可以使用字符串 D.本身是无序的 |
|
下列关于Bloom Filter的描述正确的是? |
A.是一个很长的二进制向量和一系列随机映射函数 B. C.有一定的误算率 D.可以在Bloom Filter中删除元素 |
|
下面对HBase的描述哪些是正确的? () |
A.不是开源的 B.是面向列的 C.是分布式的 D.是一种NoSQL数据库 |
|
HBase官方版本可以安装在什么操作系统上? |
A.CentOS B.Ubuntu C.RedHat D.Windows |
|
下面哪些概念是HBase框架中使用的? |
A.HDFS B.GridFS C.Zookeeper D.EXT3 |
|
HBase构建二级索引的实现方式有哪些? |
A.MapReduce B.Coprocessor C.Bloom Filter D.Filter |
|
下面对HBase的描述哪些是正确的? |
A.不是开源的 B.是面向列的 C.是分布式的 D.是一种NoSQL数据库 |
|
HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。 |
A.是byte[]数组 B.没有固定的结构 C.数据的大小是定长的 D.有固定的结构 |
|
下面哪些选项正确描述了HBase的特性? |
A.高可靠性 B.高性能 C.面向列 D.可伸缩 |
|
简单描述MapReduce不适合对哪些场景的使??其实问的就是它的缺点。 |
|
|
简单描述Shuffle过程环形缓冲区的作?? |
|
|
简单描述?下TextInputFormat怎么进??件切分? |
|
|
如何实现服务器之间的免密登录(便捷版)?SSH采?的是什么加密? |
|
|
简单描述?下hive中的分区表? |
|
|
hdfs-site.xml的3个主要属性? |
|
|
Hadoop包含哪些优势? |
|
|
Hadoop有哪些应用领域? |
|
|
Hadoop有几种运行模式? |
|
|
简要描述如何安装配置apache的一个开源Hadoop,只描述即可,无需列出具体步骤,列出具体步骤更好? |
|
|
什么样的计算不能用mr来提速,举5个例子。 |
|
|
列举几个hadoop生态圈的组件并做简要描述? |
|
|
谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化? |
|
|
有可能使 Hadoop 任务输出到多个目录中么?如果可以,怎么做? |
|
|
HAnamenode 是如何工作的? |
|
|
如果没有定义partitioner,那数据在被送达reducer前是如何被分区的? |
|
|
集群内每个节点都应该配 RAID,这样避免单磁盘损坏,影响整个节点运行。() |
A.正确 B.错误 |
|
Block Size是不可以修改的。() |
A.正确 B.错误 |
|
Hadoop是 Java开发的,所以 MapReduce 只支持Java语言编写。() |
A.正确 B.错误 |
|
NameNode 的 Web UI端口是50030,它通过jetty 启动的 web 服务。() |
A.正确 B.错误 |
|
NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读学取或则会写人metadata 信息并反馈client端。() |
A.正确 B.错误 |
|
slave节点要存储数据,所以它的磁盘越大越好。() |
A.正确 B.错误 |
|
Nagios不可以监控Hadoop 集群,因为它不提供Hadoop支持。() |
A.正确 B.错误 |
|
hadoop dfsadmin - report命合用于检测HDFS损坏块。() |
A.正确 B.错误 |
|
因为HDFS有多个副本,所以NameNode 是不存在单点问题的。() |
A.正确 B.错误 |
|
Slave节点要存储数据,所以它的磁盘越大越好。() |
A.正确 B.错误 |
|
如果 NameNode意外终止,SecondaryNameNode会接替它使集群继续工作。() |
A.正确 B.错误 |
|
hadoop dfsadmin - report命令用于检测HDFS 损坏块。() |
A.正确 B.错误 |
|
Hadoop支持数据的随机读写。() |
A.正确 B.错误 |
|
如果NameNode意外终止, SecondaryNameNode 会接替它使集群继续工作。() |
A.正确 B.错误 |
|
Hadoop 默认调度器策略为FIFO() |
A.正确 B.错误 |
|
Hadoop 默认调度器策略为FIFO() |
A.正确 B.错误 |
|
假如NameNode中没有数据会怎么样? |
|
|
MapReduce的基本数据类型包括哪些? |
|
|
Hadoop伪分布集群包含哪些守护进程? |
|
|
NameNode与SecondaryNameNode 的区别与联系? |
|
|
Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。() |
A.正确 B.错误 |
|
Hadoop支持数据的随机读写。() |
A.正确 B.错误 |
|
Hadoop 是 Java开发的,所以 MapReduce 只支持Java 语言编写。() |
A.正确 B.错误 |
|
Mapreduce 的 input split 就是一个block。() |
A.正确 B.错误 |
|
Hadoop 自身具有严格的权限管理和安全措施保障集群正常运行。() |
A.正确 B.错误 |
|
yarn有哪?部分组成,作?分别是什么?调度器主要有哪三种?hadoop默认的是哪?种? |
|
|
Mapreduce执?过程中,在执?Reduce Task之前主要做哪些?作? |
|
|
如何决定一个job的map和reduce的数量? |
|
|
Nagios不可以监控Hadoop 集群,因为它不提供 Hadoop支持。() |
A.正确 B.错误 |
|
Ganglia 不仅可以进行监控,也可以进行告警。() |
A.正确 B.错误 |
|
是否可以在Windows上运?Hadoop? |
|
|
Hive内部表和外部表的区别? |
|
|
HDFS Federation方案的优势? |
|
|
Ganglia不仅可以进行监控,也可以进行告警。() |
A.正确 B.错误 |
|
NameNode负责管理metadata,client端每次读写请求,它都会从磁盘中读取或则会写入metadata信息并反馈client端。() |
A.正确 B.错误 |
|