Hive应用开发中,如下操作引起数据倾斜的概率最小的是哪个()。
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
A.大小表进行join关联,小表key集中
B.大表join大表,关联字段null值过多
C.两表关联条件的字段为string类型,长度至少为1
D.进行CountDistinct计算时某些特殊值过多
第4题
【题目描述】
第 62 题Excel表格处理操作(6分)
考试要求:
(1)计算产品和地区的合计数。
(2)将所有数值型数据水平右对齐,并设置成倾斜显示。
(3)将销售数量最多的产品和地区的合计数显示为红色。
销售统计表
地区 | A产品 | B产晶 | C产品 | 合计 |
东部 | 900 | 1000 | 1100 | |
南部 | 820 | 700 | 1200 | |
西部 | 830 | 400 | 1400 | |
北部 | 720 | 420 | 1200 | |
合计 |
【我提交的答案】:
【参考答案分析】:
答案略
【我的疑问】(如下,请求专家帮助解答)
第6题
A.Hive最终将数据存储在HDFS中
B.HiveSQL其本质是执行的MapReduce任务
C.Hive是Hadoop平台的数据仓库工具
D.Hive对HBase有强依赖
第8题
A.REST服务比SOAP和XML-RPC更为简洁,可以完全通过HTTP协议实现,还可以利用缓存Cache来提高响应速度,性能、效率和易用性上都优于SOAP协议。
B.REST服务中的资源所指的不是数据,而是数据和表现形式的组合,可以是图片,Word、文件,甚至可以是一种虚拟的服务,所有的服务资源都可以通过URL进行唯一标识。
C.REST服务要求所有的操作都是无状态的,因此服务器端不需要记录客户端的一系列访问,减轻了服务器端的性能开销。
D.REST服务要求开发人员显式地使用HTTP方法,并且使用方式与协议定义一致,因此需要特殊的服务引擎对数据包进行处理。
第9题
A.1
B.2
C.3
D.4