Python数据科学应用从入门到精通
上QQ阅读APP看书,第一时间看更新

1.5.2 数据可视化的应用场景

数据可视化的应用场景是多方面的,常用的应用场景主要包括直观展示、识别频率、观察变化、寻找关联等。

1.直观展示

数据可视化将数据内部结构或数据分析结果以图形化的形式直观地表达出来,让使用者一目了然地观察到数据的基本情况。目前很多企事业单位都开展了数字化大屏建设,即将单位的主要经营管理指标以大屏的形式展现出来,实时观察经营管理现状。以商业银行为例,在数字化大屏中可以展示全行公司存款、机构存款、同业存款、零售存款、对公贷款、零售贷款、信用卡客户数、手机银行客户数、对公客户规模、零售客户规模等一系列信息,银行的高级管理人员可以一目了然地看到全行的经营管理情况,从而节约信息与沟通成本,更加方便快捷地做出经营管理决策。

2.识别频率

变量之所以被称为“变量”,是因为其中存在着变化,针对变量进行数据统计分析或开展机器学习,也是为了识别变量本身的变化规律或多个变量之间的联动变化规律,然后充分利用这种变化规律做出有针对性的对策安排,其中一个很重要的应用场景就是识别频率。比如在商业银行个人信贷风险防控领域,如果某种类型的客户发生逾期风险的频率特别高,则意味着该类客户可能是高风险客户群体,商业银行需要针对该类客户实施更加严苛的准入门槛,增加额外的调查审查,需要客户提供更多的风险缓释措施(追加担保人、提供抵质押品等);又比如在商业银行个人理财产品营销领域,如果某种类型的客户发生新产品购买行为的频率特别高,推介成果特别有效,则意味着该类客户可能是优质客户群体,商业银行需要针对该类客户实施必要的促销措施,在营销资源投放与支持方面给予更多的倾斜等。

3.观察变化

很多变量会随着时间走势呈现出一定的规律性特点,通过绘制时间序列趋势图等数据可视化方法,可以很好地让使用者感受、洞察并利用这些规律。比如某些产品的销量可能会呈现出一定的季节性变化,保暖性产品在深秋时节最为畅销,空调产品在四五月份时最为畅销等,此时以月度数据作为时间变量,绘制产品销量的时间序列趋势图可以很好地观察到这一规律,厂家就可以据此做出有针对性的生产、存货、促销安排;又比如某些产品的销量可能会呈现出一定的日期性变化,比如靠近写字楼的一些奶茶店在周一时销量较少,而在周五时销量较大等,此时以每日销售数据作为时间变量绘制产品销量的时间序列趋势图,便可以很好地观察到这一规律,商家就可以据此有针对性地安排服务人员的工作时间与休息时间,有前瞻性地做好原材料库存与外卖配送安排等。

4.寻找关联

多个变量之间可能存在一定的关联。在很多情况下,单纯使用计算相关性系数等数据统计分析指标的方法,可能难以发现其中的具体规律,而使用数据可视化的方法可能就能够很好地捕捉到这一点。如图1.3所示,如果单纯计算X与Y之间的相关系数,那么X与Y的相关关系是很不明确的,而如果绘制成X与Y的散点图的方式去观察,则可以非常直观地看出两者之间的关系。在图中,横轴为X的数值,纵轴为Y的数值,当X小于一定临界值时,X与Y之间呈现的是一种完全线性正相关关系;而当X大于一定临界值时,X与Y之间呈现的是一种完全线性负相关关系。

图1.3 X与Y的数值及散点图

通过绘制变量的散点图,我们可以非常直观地看出变量之间的关系。