2.4 课后练习
目标任务
在第1章习题中你已经站在鹏辉的角度考虑过,如何从三百多家酒店中挑选出三家,为销售部经理提供了一份易于选择的短名单,现在请换一个角度思考问题。假如香港酒店行业协会需要出具一份评估报告,报告中可以考虑的问题很多。例如:
(1)各区的酒店存在显著的价格差异吗?
(2)近期的价格波动了吗?对比往年的参考均价如何?
(3)各区的评论人数存在显著的差异吗?
(4)是否高价酒店的住客没时间或不喜欢发表评论,而平价酒店的住客更有空或更喜欢发表评论……
考核知识点
☑ 熟练应用多表关联
☑ 创建计算字段来对比差异
☑ 构建视图,观察相关与因果关系
操作概要
a. 已经下载全部数据文件的读者,请打开“课后习题”文件夹中的“习题数据源”,连接“酒店数据”中的酒店数据表。将Excel格式的酒店数据表导入Tableau。连接后数据源页面将显示Excel中的两张工作表,请将“酒店数据”拖入后观察数据,查看数据质量。
b. 在数据源页面将“各区参考均价”拖入数据窗格,与“酒店数据”通过“地区”字段进行关联。
c. 将“各区参考均价”拖入后观察数据,通过“地区”字段与“酒店数据”建立多表关联,关联方式选择完全外部关联。
d. 创建计算字段,实现对酒店均价的计算,随后对不同地区酒店的实际均价与各区的参考均价进行比较,了解各地区酒店价格与参考均价之间的差异,采用不同颜色标识高于预期值(正值)或低于预期值(负值);该步骤完成后,可以得出结论——各区的酒店存在显著价格差异吗?近期的价格波动了吗?无论你的答案是什么,请列出理由。
e. 使用聚合,实现对当期各区酒店评论人数的统计;将酒店名称和价格等级拖动至“行”功能区,以评分人数作为标签和颜色依据,制作各酒店评论人数与价格等级之间的突出显示表;再次以地区、地点和酒店名称作为“行”功能区字段,制作各酒店评论人数与酒店所在地区之间的突出显示表。
f. 拓展题:观察练习(4)的制作成果,请直觉判断,酒店价格和评论人数之间是否存在相关性?酒店所在地区与评论人数之间呢?随后请构思如何使用Tableau探查酒店价格和评论人数之间是否存在相关性,以及酒店所在地区与评论人数之间是否存在相关性,向你的学习小伙伴解释你的构思(本题无参考答案,深入学习将帮助你了解如何使用Tableau分析相关与因果关系,并且解读Tableau给出的P值等统计量)。