1.8 数据分析人才培养的难题
数据分析行业可附加至其他行业中,为各行各业提供技术支持,所以这方面的人才需求缺口很大,只要具有一定的数据分析能力,薪资待遇普遍较高,但是岗位要求不低,需要的是复合型人才,具有发现问题、分析问题、解决问题的能力,能够结合商业、数据、问题等形成解决方案。
具体来看,数据分析人员需要掌握数据挖掘、统计学、数学等基本的数理原理和常识,需要掌握并熟练运用某一数据挖掘软件,如SPSS、SAS、R等,除此之外,还需要熟悉各类模型算法的特点,以及在各种场景中如何进行选择和应用,相应的人才标准较高,培养难度较大,需要经过实战案例训练逐步提高数据挖掘水平。
1.8.1 数理要求高
鉴于数学相关专业的学习曲线较为陡峭,大多数人对于数学相关的理论望而生畏,越发难以深入学习,目前对从事数据分析行业的人才这方面的要求较高,在数据分析过程中需要应用高等数学、线性代数、概率论、离散数学、统计学等,对数理理论缺乏原理上的研究,在模型建模过程中很难做到创新,只能照猫画虎进行模仿。
1.8.2 跨学科综合能力
如果是开发人员,可以通过编程实现,可以使用Python等语言应用相关模型,或者使用Weka框架来实现,这就需要有一定的软件工程师的背景,或者具有较快的跨学科学习和应用能力,可以快速使用现有框架进行模型建模和应用。
在目前的软件从业人员中,大部分开发人员对数理知识并不精通,特别是统计学等理论,而数学、统计学等专业人员往往更精通理论,而缺少编程经验,对于快速实现模型的应用又具有局限,特别是在数据提取、预处理、分析结论可视化等方面,需要与软件开发进行配合。
数据分析过程中需要掌握的技术除了SPSS等建模软件和分类、聚类、回归等算法外,还需要对Hadoop、Spark、Storm、MapReduce等平台具有应用经验,对编程语言的要求是至少熟练运用C++、Java、Python、R等语言中的一种,同时还要求熟悉数据库、存储等知识,具有一定的数据优化能力。综合能力要求较高,而上述技术或框架近几年刚开始流行且更新很快,每个分支达到熟练应用均需花费较长时间进行学习与实践,对从业者能力和能否持续学习都需要考验。
1.8.3 国内技术资料少
由于数据分析属于IT行业新兴行业分支,国内的技术资料较少,如果要与时俱进,须直接阅读国外资料,这就要求具有一定的英文水平,能够流畅阅读国外技术资料和书籍,同时要具有较强的信息检索和查找能力,遇到问题时,可快速定位问题的原因,并获取其他人的解决方案。
1.8.4 实践机会少
目前数据分析行业的实践机会较少,一方面是企业对数据分析的投入相较信息化建设较少,数据分析项目虽然越来越多,但总体数量上仍然具有更大的潜力;另一方面,软件开发和数学专业的从业人员更愿意停留于当前专业领域中,对于主动从事跨专业研究的动力不足,随着数据分析人员的需求增多,待遇随之水涨船高,必将吸引更多的人才进入数据分析行业。
数据分析行业虽然前景好、待遇高、人才需求大,与其他行业一样,并非所有人都适合从事此行业,入行前首先要对岗位和自身进行评估,好好思考这些问题:What,Why,How,即:数据分析行业是干什么的?有哪些知识要求?我为什么要加入这一行业?是因为兴趣吗?我自身有哪些优势条件?要想达到较高的水平,要如何干?可从以下几个方面进行评估。
职业爱好:数据分析行业仍然属于IT行业,这一行业普遍要求务实、严谨、少说多做的风格,属于在后台默默工作付出的那一层级,需要思考能否与枯燥的代码为伴,并乐在其中。
思维能力:数据分析人员要求具有较强的逻辑思维和推理能力,需要从数字中探寻出业务的核心规律,最好能有见微知著和创新的能力,如果经过培训之后仍然对数据无感觉或不敏感,可能说明不适合与数据打交道。
学习能力:技术发展很快,需要不断学习新的技术、新的处理过程等,这是与其他行业差别较多的地方。在IT行业中,某一项技术从流行到消失一般只有几年的时间,所以要求从业人员不断学习,不断提高。当然,IT行业的原理性知识,如数理知识、数据结构、操作系统等技术理论变化很少,主要的变化还是理论的具体应用,但万变不离其宗。
沟通能力:数据分析行业需要跨部门沟通,与业务部门、研发部门进行合作,特别是项目经理等领导岗位,既要有合作意识,又要有推动能力,在协调过程中争取更多的支持,减少摩擦,使最终分析结果能够给各企业带来正向收益。
业务知识:理解业务知识可以快速选择合适的模型和算法,少走很多弯路,不需要对模型结果反复评估,就可以确认此模型是否符合业务需要。理解数据与业务流程、组织架构对企业的影响,对业务具有敏感度可以更好地推动数据分析为产品服务,不至于闭门造车,最终帮业务部门提供快速决策支持。