覆盖超星/学习通/尔雅等10+学习平台 | 历年真题+答案解析+模拟试卷 | 免费下载 实时更新 精准检索
超星学习通无数据仓库Hive上机作业答案
超新学习通 2025-04-06 12:45:11 12 0
广告示例

想要快速找到正确答案?

立即关注 九八五题库微信公众号,轻松解决学习难题!

随机漂浮广告
超星学习通无数据仓库Hive上机作业答案

作业论文指导

扫码关注
作业论文指导,轻松解决学习难题!

超星学习通无数据仓库Hive上机作业答案

数据仓库Hive上机

学校: 无

问题 1: 1. 关于大数据的主要特征理解和描述错误的是

选项:

A. 来源多, 格式多

B. 增长速度快, 处理速度快

C. 存储量大 计算量大

D. 数据价值密度很高

答案: 数据价值密度很高

问题 2: 2. 以下哪个不属于大数据主要解决的问题

选项:

A. 海量数据存储

B. 日常业务数据处理

C. 海量数据计算

D. 通过数据分析以提供决策支持

答案: 日常业务数据处理

问题 3: 3. 关于大数据的价值密度描述正确的是以下哪个?

选项:

A. 大数据由于其数据量大,所以其价值密度低。

B. 大数据由于其数据量大,所以其价值也大。

C. 大数据的价值密度是指其数据类型多且复杂。

D. 大数据由于其数据量大,所以其价值密度高

答案: 大数据由于其数据量大,所以其价值密度低。

问题 4: 4. 以下关于大数据特点的描述中,不正确的是()。

选项:

A. 巨大的数据量

B. 多结构化数据

C. 增长速度快

D. 价值密度高

答案: 巨大的数据量

问题 5: 1. 下面哪项是Hadoop的作者

选项:

A. Martin Fowler

B. Doug cutting

C. Mark Elliot Zuckerberg

D. Kent Beck

答案: Doug cutting

问题 6: 2. Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是

选项:

A. Hadoop

B. Nutch

C. Lucene

D. Solr

答案: Solr

问题 7: 3. 目前,Apache Hadoop发布的版本主要有()、()、()

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 8: 4. 使用Hadoop的原因是()。

选项:

A. 方便:Hadoop运行在由一般商用机器构成的大型集群上或者云计算服务上

B. 稳健:Hadoop致力于在一般商用硬件上运行,其架构假设硬件会频繁失效,Hadoop可以从容地处理大多数此类故障

C. 可扩展:Hadoop通过增加集群节点,可以线性地扩展以处理更大的数据集

D. 简单:Hadoop允许用户快速编写高效的并行代码

答案: 请关注公众号【九八五题库】查看答案

问题 9: 5. Hadoop是Apache顶级的开源项目

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 10: 1. 启动网络服务的命令是( )。

选项:

A. ifconfig eth0 noshut

B. ifconfig eth0 down

C. service networtk stop

D. service network start

答案: 请关注公众号【九八五题库】查看答案

问题 11: 2. 下面关于文件 "/etc/sysconfig/network-scripts/ifcfg-ens33"的描述哪个是正确的? ( )

选项:

A. 它是一个系统脚本文件

B. 它是可执行文件

C. 它存放本机的名字

D. 它指定本机eth0的IP地址

答案: 请关注公众号【九八五题库】查看答案

问题 12: 3. 以下哪个命令能够查看Linux的ip( )

选项:

A. ipconfig

B. ifconfig

C. ip

D. ping

答案: 请关注公众号【九八五题库】查看答案

问题 13: 4. 在配置Linux网络参数时,固定IP地址是将路由协议配置为

选项:

A. static

B. dynamic

C. dhcp

D. variable

答案: 请关注公众号【九八五题库】查看答案

问题 14: 5. 在Linux系统中,用于关闭防火墙开机自启动的指令是

选项:

A. chkconfig iptables off

B. service iptables stop

C. stop-all.sh

D. stop-dfs.sh

答案: 请关注公众号【九八五题库】查看答案

问题 15: 6. 设置免密登录需要先用ssh-keygen生成一对密钥

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 16: 7. 当我们配置好虚拟机的主机名和IP映射,就可以正常使用虚拟机。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 17: 8. 执行“vi /etc/sysconfig/network”命令,可以配置主机名。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 18: 1. 安装JDK的命令正确的是()

选项:

A. tar -zxvf jdk安装包

B. tar jdk安装包

C. zip -zxvf jdk安装包

D. gzip zxvf jdk安装包

答案: 请关注公众号【九八五题库】查看答案

问题 19: 2. 配置文件生效的命令是()

选项:

A. source

B. vi

C. tar

D. mv

答案: 请关注公众号【九八五题库】查看答案

问题 20: 3. 重命名文件的命令是( )

选项:

A. cp

B. copy

C. mv

D. ls

答案: 请关注公众号【九八五题库】查看答案

问题 21: 1. 目前,Apache Hadoop发布的版本主要有()、()、()

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 22: 2. Hadoop发行版本分为______、______

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 23: 3. Hadoop集群部署方式分别是______、______和______

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 24: 4. Hadoop是由Java语言开发的

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 25: 1. Hadoop配置文件所在目录是哪个

选项:

A. /etc/hosts

B. /etc/hadoop

C. $HADOOP_HOME/conf

D. $HADOOP_HOME/etc/hadoop

答案: 请关注公众号【九八五题库】查看答案

问题 26: 2. 下面哪个配置是在mapred-site.xml中配置的

选项:

A. block块的副本数

B. Java环境变量

C. 存储hdfs文件的目录名

D. 运行MapReduce作业的主机和端口

答案: 请关注公众号【九八五题库】查看答案

问题 27: 3. 安装Hadoop时,配置项”dfs.replication”是配置在文件core-site.xml

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 28: 4. 修改~/.bashrc文件保存后,修改的内容能立即生效

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 29: 1. 脚本一键启动Hadoop集群服务命令是_______

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 30: 2. 格式化HDFS集群命令是______

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 31: 3. Hadoop默认开设HDFS文件系统端口号_______和监控Yarn集群端口号______

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 32: 4. 启动yarn集群的命令()

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 33: 5. Hadoop存在多个副本,且默认备份数量是3。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 34: 6. 配置Hadoop集群只需要修改core-site.xml配置文件就可以。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 35: 1. Hadoop集群启动成功后,用于监控HDFS集群的端口是

选项:

A. 50010

B. 50075

C. 8485

D. 50070

答案: 请关注公众号【九八五题库】查看答案

问题 36: 2. Hadoop集群启动成功后,用于监控yarn集群的端口是

选项:

A. 50010

B. 50070

C. 8088

D. 8080

答案: 请关注公众号【九八五题库】查看答案

问题 37: 3. 下列选项中,哪个配置文件可以配置HDFS地址、端口号以及临时文件目录

选项:

A. core-site.xml

B. hdfs-site.xml

C. mapred-site.xml

D. yarn-site.xml

答案: 请关注公众号【九八五题库】查看答案

问题 38: 1. 下列哪个shell命令可以用于HDFS系统之间文件的复制

选项:

A. hadoop fs cp

B. hadoop fs -copy

C. hadoop fs -copyFile

D. hdfs fs -cp

答案: 请关注公众号【九八五题库】查看答案

问题 39: 2. hdfs上传文件的命令正确的是( )

选项:

A. hadoop fs -put

B. hadoop -fs -put

C. hdfs fs put

D. hadoop -put

答案: 请关注公众号【九八五题库】查看答案

问题 40: 3. 在HDFS中,通过执行()命令查看HDFS根目录下的所有文件及文件夹。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 41: 1. Java抽象类org.apache.hadoop.fs.FileSystem定义了hadoop的一个文件系统接口。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 42: 1. hdfs下载文件到本地的javaAPI方法是CopyToLocalFile()

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 43: 1. MapReduce适用于()

选项:

A. 任意应用程序

B. 任意可以在Windows Server 2008上的应用程序

C. 可以串行处理的应用程序

D. 可以并行处理的应用程序

答案: 请关注公众号【九八五题库】查看答案

问题 44: 1. 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()

选项:

A. 一个Map函数就是对一部分原始数据进行指定的操作。

B. 一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。

C. Map与Map之间不是相互独立的。

D. Reducee与Reduce之间不是相互独立的。

答案: 请关注公众号【九八五题库】查看答案

问题 45: 2. 下列说法中,关于InputFormat接口定义的getSplits()方法说法正确的是

选项:

A. 用来从分片中读取数据

B. 负责创建RecordReader对象

C. 实现了逻辑切片机制

D. getSplits()方法的切片大小splitSize是由minSize、maxSize和blockSize的值确定的

答案: 请关注公众号【九八五题库】查看答案

问题 46: 3. 在Reduce阶段,设置map和reduce共存,当map运行到一定程度后,reduce也开始运行,减少reduce的等待时间,可以提高MapReduce的性能。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 47: 4. reduce()函数会将map()函数输出的键值对作为输入,把相同key值的value进行汇总,输出新的键值对

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 48: 5. 在MapReduce程序中,只有Map阶段涉及到Shuffle机制。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 49: 1. 下列关于zookeeper描述正确的是:()

选项:

A. 无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的

B. 从同一个客户端发起的事务请求,最终将会严格按照其发起顺序被应用到zookeeper中

C. 在一个5个节点组成的Zookeeper集群中,如果同时有3台机器宕机,服务不受影响

D. 如果客户端连接到Zookeeper集群中的那台机器突然宕机,客户端会自动切换连接到集群其他机器

答案: 请关注公众号【九八五题库】查看答案

问题 50: 2. 以下关于Zookeeper描述错误的是

选项:

A. Zookeeper是一款分布式协调服务框架

B. Zookeeper集群在第一次启动时需要选举Leader

C. Zookeeper一般用于存储海量数据

D. Zookeeper可以通过Watcher机制对节点状态进行监控

答案: 请关注公众号【九八五题库】查看答案

问题 51: 3. Zookeeper能够确保

选项:

A. 所有namenode都是活动的,为客户端请求提供服务

B. 当任何一个datanode失效时,触发故障转移

C. 仅有一个namenode是活动的,为客户端请求提供服务

D. Hadoop超级管理员不能启动故障转移

答案: 请关注公众号【九八五题库】查看答案

问题 52: 4. 下列说法中,关于Zookeeper说法错误的是

选项:

A. Apache Zookeeper旨在减轻构建健壮的分布式系统的服务

B. Zookeeper最早起源于雅虎研究院的一个研究小组

C. Zookeeper是一个分布式协调服务的收费框架

D. Zookeeper本质上是一个分布式的小文件存储系统

答案: 请关注公众号【九八五题库】查看答案

问题 53: 5. 在Zookeeper选举过程中,一共有四种状态,分别是

选项:

A. 竞选状态

B. 随从状态

C. 观察状态

D. 领导者状态

答案: 请关注公众号【九八五题库】查看答案

问题 54: 6. Zookeeper具有全局数据一致性、高容错性、无序性、原子性以及实时性

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 55: 1. 下列选项中,属于Zookeeper集群的角色有

选项:

A. Follower

B. Worker

C. Observer

D. Leader

答案: 请关注公众号【九八五题库】查看答案

问题 56: 2. 下列说法中,关于zoo.cfg配置文件中的参数server.1=hadoop01:2888:3888说法正确的是

选项:

A. 1表示服务器的编号

B. hadoop01表示这个服务器的IP地址

C. 2888表示表示Zookeeper服务器之间的通信心跳号

D. 3888表示Leader选举的端口号

答案: 请关注公众号【九八五题库】查看答案

问题 57: 3. 由于Zookeeper集群的运行不需要Java环境支持,所以不需要提前安装JDK。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 58: 4. 启动Zookeeper服务的命令是“zkServer.sh start”

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 59: 1. Hive是建立在()之上的一个数据仓库

选项:

A. HDFS

B. MapReduce

C. Hadoop

D. HBase

答案: 请关注公众号【九八五题库】查看答案

问题 60: 2. 数据仓库是面向_____、______、______和时变的数据集合,用于支持管理决策。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 61: 3. Hive是一款独立的数据仓库工具,因此在启动前无需启动任何服务。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 62: 4. 数据仓库可以作为实时查询系统的数据库使用,为决策分析提供数据。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 63: 5. 星型模型是以一个事实表和一组维度表组合而成,并且以事实表为中心,所有的维度表直接与事实表相连。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 64: 1. 按粒度大小的顺序,Hive数据被分为:数据库、数据表、()、桶?

选项:

A. 元祖

B. 栏

C. 分区

D. 行

答案: 请关注公众号【九八五题库】查看答案

问题 65: 2. Hive默认元数据存储在_____数据库中。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 66: 1. 在远程服务中,hive和元数据服务不在同一个进程中。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 67: 1. drop 内部表时,会删除 hdfs 上的文件夹和元数据。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 68: 2. 内部表的默认存储路径是/user/warehouse/hive/数据库名.db/表名

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 69: 1. Hive默认不支持动态分区功能,需要手动设置动态分区参数开启功能。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 70: 2. 分区表时Hive数据模型的最小单元,在Hive存储上的体现就是在表的主目录下的一个子文件夹。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 71: 1. 网络爬虫又称为网页蜘蛛或( )

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 72: 2. 在Scrapy框架中,( )文件用于定义项目的目标实体。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 73: 3. Scrapy爬虫文件中,需要使用start_urls属性确定爬取的起始url元组或列表。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 74: 4. Item Pipeline主要用于处理从Spiders中获取的Item数据。

选项:

答案: 请关注公众号【九八五题库】查看答案

问题 75: 5. 一个scrapy爬虫项目中,只能存在一个爬虫文件。

选项:

答案: 请关注公众号【九八五题库】查看答案



收藏
文章说明
©版权声明
本站提供的一切试卷均来自网上;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络收集,版权争议与本站无关。您必须在下载后的24个小时之内从您的设备中彻底删除。如有侵权请邮件与我们联系处理。敬请谅解!
评论留言

昵称

试卷网
试卷网
本站专注整合全网学习平台试卷资源,涵盖超星、学习通、尔雅、学起Plus、安徽继续教育、云上河开等平台的海量试题与答案,提供免费下载及在线查询服务。包含期末考试、模拟试题、章节练习等类型,覆盖大学、职业考试、继续教育等多领域,同步更新各平台最新试卷,助力高效备考与学习
  • 文章44524
  • 评论0
  • 微语1
最新评论