帮你提升成绩,规划学习路径,设计职业方向,解决作业难题,指导论文写作。
想要快速找到正确答案?
立即关注 九八五题库微信公众号,轻松解决学习难题!
作业论文指导
扫码关注
作业论文指导,轻松解决学习难题!
超星学习通无数据仓库Hive上机作业答案
数据仓库Hive上机
学校: 无
问题 1: 1. 关于大数据的主要特征理解和描述错误的是
选项:
A. 来源多, 格式多
B. 增长速度快, 处理速度快
C. 存储量大 计算量大
D. 数据价值密度很高
答案: 数据价值密度很高
问题 2: 2. 以下哪个不属于大数据主要解决的问题
选项:
A. 海量数据存储
B. 日常业务数据处理
C. 海量数据计算
D. 通过数据分析以提供决策支持
答案: 日常业务数据处理
问题 3: 3. 关于大数据的价值密度描述正确的是以下哪个?
选项:
A. 大数据由于其数据量大,所以其价值密度低。
B. 大数据由于其数据量大,所以其价值也大。
C. 大数据的价值密度是指其数据类型多且复杂。
D. 大数据由于其数据量大,所以其价值密度高
答案: 大数据由于其数据量大,所以其价值密度低。
问题 4: 4. 以下关于大数据特点的描述中,不正确的是()。
选项:
A. 巨大的数据量
B. 多结构化数据
C. 增长速度快
D. 价值密度高
答案: 巨大的数据量
问题 5: 1. 下面哪项是Hadoop的作者
选项:
A. Martin Fowler
B. Doug cutting
C. Mark Elliot Zuckerberg
D. Kent Beck
答案: Doug cutting
问题 6: 2. Doug Cutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是
选项:
A. Hadoop
B. Nutch
C. Lucene
D. Solr
答案: Solr
问题 7: 3. 目前,Apache Hadoop发布的版本主要有()、()、()
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 8: 4. 使用Hadoop的原因是()。
选项:
A. 方便:Hadoop运行在由一般商用机器构成的大型集群上或者云计算服务上
B. 稳健:Hadoop致力于在一般商用硬件上运行,其架构假设硬件会频繁失效,Hadoop可以从容地处理大多数此类故障
C. 可扩展:Hadoop通过增加集群节点,可以线性地扩展以处理更大的数据集
D. 简单:Hadoop允许用户快速编写高效的并行代码
答案: 请关注公众号【九八五题库】查看答案
问题 9: 5. Hadoop是Apache顶级的开源项目
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 10: 1. 启动网络服务的命令是( )。
选项:
A. ifconfig eth0 noshut
B. ifconfig eth0 down
C. service networtk stop
D. service network start
答案: 请关注公众号【九八五题库】查看答案
问题 11: 2. 下面关于文件 "/etc/sysconfig/network-scripts/ifcfg-ens33"的描述哪个是正确的? ( )
选项:
A. 它是一个系统脚本文件
B. 它是可执行文件
C. 它存放本机的名字
D. 它指定本机eth0的IP地址
答案: 请关注公众号【九八五题库】查看答案
问题 12: 3. 以下哪个命令能够查看Linux的ip( )
选项:
A. ipconfig
B. ifconfig
C. ip
D. ping
答案: 请关注公众号【九八五题库】查看答案
问题 13: 4. 在配置Linux网络参数时,固定IP地址是将路由协议配置为
选项:
A. static
B. dynamic
C. dhcp
D. variable
答案: 请关注公众号【九八五题库】查看答案
问题 14: 5. 在Linux系统中,用于关闭防火墙开机自启动的指令是
选项:
A. chkconfig iptables off
B. service iptables stop
C. stop-all.sh
D. stop-dfs.sh
答案: 请关注公众号【九八五题库】查看答案
问题 15: 6. 设置免密登录需要先用ssh-keygen生成一对密钥
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 16: 7. 当我们配置好虚拟机的主机名和IP映射,就可以正常使用虚拟机。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 17: 8. 执行“vi /etc/sysconfig/network”命令,可以配置主机名。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 18: 1. 安装JDK的命令正确的是()
选项:
A. tar -zxvf jdk安装包
B. tar jdk安装包
C. zip -zxvf jdk安装包
D. gzip zxvf jdk安装包
答案: 请关注公众号【九八五题库】查看答案
问题 19: 2. 配置文件生效的命令是()
选项:
A. source
B. vi
C. tar
D. mv
答案: 请关注公众号【九八五题库】查看答案
问题 20: 3. 重命名文件的命令是( )
选项:
A. cp
B. copy
C. mv
D. ls
答案: 请关注公众号【九八五题库】查看答案
问题 21: 1. 目前,Apache Hadoop发布的版本主要有()、()、()
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 22: 2. Hadoop发行版本分为______、______
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 23: 3. Hadoop集群部署方式分别是______、______和______
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 24: 4. Hadoop是由Java语言开发的
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 25: 1. Hadoop配置文件所在目录是哪个
选项:
A. /etc/hosts
B. /etc/hadoop
C. $HADOOP_HOME/conf
D. $HADOOP_HOME/etc/hadoop
答案: 请关注公众号【九八五题库】查看答案
问题 26: 2. 下面哪个配置是在mapred-site.xml中配置的
选项:
A. block块的副本数
B. Java环境变量
C. 存储hdfs文件的目录名
D. 运行MapReduce作业的主机和端口
答案: 请关注公众号【九八五题库】查看答案
问题 27: 3. 安装Hadoop时,配置项”dfs.replication”是配置在文件core-site.xml
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 28: 4. 修改~/.bashrc文件保存后,修改的内容能立即生效
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 29: 1. 脚本一键启动Hadoop集群服务命令是_______
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 30: 2. 格式化HDFS集群命令是______
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 31: 3. Hadoop默认开设HDFS文件系统端口号_______和监控Yarn集群端口号______
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 32: 4. 启动yarn集群的命令()
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 33: 5. Hadoop存在多个副本,且默认备份数量是3。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 34: 6. 配置Hadoop集群只需要修改core-site.xml配置文件就可以。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 35: 1. Hadoop集群启动成功后,用于监控HDFS集群的端口是
选项:
A. 50010
B. 50075
C. 8485
D. 50070
答案: 请关注公众号【九八五题库】查看答案
问题 36: 2. Hadoop集群启动成功后,用于监控yarn集群的端口是
选项:
A. 50010
B. 50070
C. 8088
D. 8080
答案: 请关注公众号【九八五题库】查看答案
问题 37: 3. 下列选项中,哪个配置文件可以配置HDFS地址、端口号以及临时文件目录
选项:
A. core-site.xml
B. hdfs-site.xml
C. mapred-site.xml
D. yarn-site.xml
答案: 请关注公众号【九八五题库】查看答案
问题 38: 1. 下列哪个shell命令可以用于HDFS系统之间文件的复制
选项:
A. hadoop fs cp
B. hadoop fs -copy
C. hadoop fs -copyFile
D. hdfs fs -cp
答案: 请关注公众号【九八五题库】查看答案
问题 39: 2. hdfs上传文件的命令正确的是( )
选项:
A. hadoop fs -put
B. hadoop -fs -put
C. hdfs fs put
D. hadoop -put
答案: 请关注公众号【九八五题库】查看答案
问题 40: 3. 在HDFS中,通过执行()命令查看HDFS根目录下的所有文件及文件夹。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 41: 1. Java抽象类org.apache.hadoop.fs.FileSystem定义了hadoop的一个文件系统接口。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 42: 1. hdfs下载文件到本地的javaAPI方法是CopyToLocalFile()
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 43: 1. MapReduce适用于()
选项:
A. 任意应用程序
B. 任意可以在Windows Server 2008上的应用程序
C. 可以串行处理的应用程序
D. 可以并行处理的应用程序
答案: 请关注公众号【九八五题库】查看答案
问题 44: 1. 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是()
选项:
A. 一个Map函数就是对一部分原始数据进行指定的操作。
B. 一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。
C. Map与Map之间不是相互独立的。
D. Reducee与Reduce之间不是相互独立的。
答案: 请关注公众号【九八五题库】查看答案
问题 45: 2. 下列说法中,关于InputFormat接口定义的getSplits()方法说法正确的是
选项:
A. 用来从分片中读取数据
B. 负责创建RecordReader对象
C. 实现了逻辑切片机制
D. getSplits()方法的切片大小splitSize是由minSize、maxSize和blockSize的值确定的
答案: 请关注公众号【九八五题库】查看答案
问题 46: 3. 在Reduce阶段,设置map和reduce共存,当map运行到一定程度后,reduce也开始运行,减少reduce的等待时间,可以提高MapReduce的性能。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 47: 4. reduce()函数会将map()函数输出的键值对作为输入,把相同key值的value进行汇总,输出新的键值对
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 48: 5. 在MapReduce程序中,只有Map阶段涉及到Shuffle机制。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 49: 1. 下列关于zookeeper描述正确的是:()
选项:
A. 无论客户端连接的是哪个Zookeeper服务器,其看到的服务端数据模型都是一致的
B. 从同一个客户端发起的事务请求,最终将会严格按照其发起顺序被应用到zookeeper中
C. 在一个5个节点组成的Zookeeper集群中,如果同时有3台机器宕机,服务不受影响
D. 如果客户端连接到Zookeeper集群中的那台机器突然宕机,客户端会自动切换连接到集群其他机器
答案: 请关注公众号【九八五题库】查看答案
问题 50: 2. 以下关于Zookeeper描述错误的是
选项:
A. Zookeeper是一款分布式协调服务框架
B. Zookeeper集群在第一次启动时需要选举Leader
C. Zookeeper一般用于存储海量数据
D. Zookeeper可以通过Watcher机制对节点状态进行监控
答案: 请关注公众号【九八五题库】查看答案
问题 51: 3. Zookeeper能够确保
选项:
A. 所有namenode都是活动的,为客户端请求提供服务
B. 当任何一个datanode失效时,触发故障转移
C. 仅有一个namenode是活动的,为客户端请求提供服务
D. Hadoop超级管理员不能启动故障转移
答案: 请关注公众号【九八五题库】查看答案
问题 52: 4. 下列说法中,关于Zookeeper说法错误的是
选项:
A. Apache Zookeeper旨在减轻构建健壮的分布式系统的服务
B. Zookeeper最早起源于雅虎研究院的一个研究小组
C. Zookeeper是一个分布式协调服务的收费框架
D. Zookeeper本质上是一个分布式的小文件存储系统
答案: 请关注公众号【九八五题库】查看答案
问题 53: 5. 在Zookeeper选举过程中,一共有四种状态,分别是
选项:
A. 竞选状态
B. 随从状态
C. 观察状态
D. 领导者状态
答案: 请关注公众号【九八五题库】查看答案
问题 54: 6. Zookeeper具有全局数据一致性、高容错性、无序性、原子性以及实时性
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 55: 1. 下列选项中,属于Zookeeper集群的角色有
选项:
A. Follower
B. Worker
C. Observer
D. Leader
答案: 请关注公众号【九八五题库】查看答案
问题 56: 2. 下列说法中,关于zoo.cfg配置文件中的参数server.1=hadoop01:2888:3888说法正确的是
选项:
A. 1表示服务器的编号
B. hadoop01表示这个服务器的IP地址
C. 2888表示表示Zookeeper服务器之间的通信心跳号
D. 3888表示Leader选举的端口号
答案: 请关注公众号【九八五题库】查看答案
问题 57: 3. 由于Zookeeper集群的运行不需要Java环境支持,所以不需要提前安装JDK。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 58: 4. 启动Zookeeper服务的命令是“zkServer.sh start”
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 59: 1. Hive是建立在()之上的一个数据仓库
选项:
A. HDFS
B. MapReduce
C. Hadoop
D. HBase
答案: 请关注公众号【九八五题库】查看答案
问题 60: 2. 数据仓库是面向_____、______、______和时变的数据集合,用于支持管理决策。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 61: 3. Hive是一款独立的数据仓库工具,因此在启动前无需启动任何服务。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 62: 4. 数据仓库可以作为实时查询系统的数据库使用,为决策分析提供数据。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 63: 5. 星型模型是以一个事实表和一组维度表组合而成,并且以事实表为中心,所有的维度表直接与事实表相连。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 64: 1. 按粒度大小的顺序,Hive数据被分为:数据库、数据表、()、桶?
选项:
A. 元祖
B. 栏
C. 分区
D. 行
答案: 请关注公众号【九八五题库】查看答案
问题 65: 2. Hive默认元数据存储在_____数据库中。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 66: 1. 在远程服务中,hive和元数据服务不在同一个进程中。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 67: 1. drop 内部表时,会删除 hdfs 上的文件夹和元数据。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 68: 2. 内部表的默认存储路径是/user/warehouse/hive/数据库名.db/表名
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 69: 1. Hive默认不支持动态分区功能,需要手动设置动态分区参数开启功能。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 70: 2. 分区表时Hive数据模型的最小单元,在Hive存储上的体现就是在表的主目录下的一个子文件夹。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 71: 1. 网络爬虫又称为网页蜘蛛或( )
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 72: 2. 在Scrapy框架中,( )文件用于定义项目的目标实体。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 73: 3. Scrapy爬虫文件中,需要使用start_urls属性确定爬取的起始url元组或列表。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 74: 4. Item Pipeline主要用于处理从Spiders中获取的Item数据。
选项:
答案: 请关注公众号【九八五题库】查看答案
问题 75: 5. 一个scrapy爬虫项目中,只能存在一个爬虫文件。
选项:
答案: 请关注公众号【九八五题库】查看答案