企业级数据与AI项目成功之道
上QQ阅读APP看书,第一时间看更新

2.2 使数据与数据科学民主化

尽管人们对数据收集和存储的兴趣激增,许多组织还是有意识地将数据科学知识分配给少数分散的员工。虽然组织必须促进专业化领域的发展,但将数据科学家标签指定给一小部分员工似乎源于一种误导性的信念,即人工智能在某种程度上是具有魔力的。

从长远来看,数据科学和人工智能都不应该是数据科学家的专利。数据科学的民主化包括向更多员工开放数据科学的基础知识,为建立包括公民数据科学家在内的新角色铺平道路。

例如,公民数据科学家将“创建或生成使用高级诊断分析或预测和规定功能的(人工智能)模型,其主要工作职能在统计和分析领域之外”。公民数据科学家将扩展与组织提供的自助服务范式相关的分析类型。

公民数据科学家仍然能够使用高级分析,且无须具备传统数据科学家的所有技能。与传统数据科学家相关的技能,包括熟练掌握诸如Python或R之类的编程语言,以及高级数学和统计学的应用知识。相比之下,公民数据科学家可能拥有数据科学家所不具备的内在和专业领域知识。当数据科学家确实拥有额外领域知识时,他们被戏称为“独角兽”。

试图将与人工智能相关的数据处理委托给公司内部的小型专业团队,可能会面临诸多挑战。一些数据科学家可能会发现,与缺乏特定数据素养技能(例如具有读取和处理数字化数据的能力)的其他员工交流洞见和细微差别,是一件令人厌烦的事情。业务涉众可能会感到沮丧,因为数据请求无法快速处理,并且可能无法解决他们的问题。

许多专为数据科学家群体设计的软件工具,最终仅存在于每个数据科学家团队之中。然而尽管这合乎逻辑,但创建数据软件工具的筒仓并将工具访问限制在例如数据科学家团队的小型群体中,可能会造成自己的困境。组织中的所有部门都会产生分析需求。每个需求都可能涉及从极其简单到异常棘手的一系列复杂性。但实际上,并非所有需求都将建立在分析需求范围中异常棘手的末端。许多需求可以由受过基本分析训练的人来解决或处理。通过引入公民数据科学家,组织可以更好地定制适合数据科学家深厚专业知识的计划。

数据科学民主化使得尽可能多的人有权做出数据驱动的决策。赋权始于教育,并通过持续的教育得以维持。如果人工智能要对未来所有工作产生100%的影响,则人工智能和数据素养教育(数据素养将在第7章中讨论,统计素养将在第6章中提及)应被视为从小学开始就必须提供的服务,并且必须成为新领工人在工作场所中持续学习的一部分。

建立组织的集体技能必须包括使用协作软件工具和社交导向的沟通工具的教育。通过建立联系,员工可以看到谁需要帮助、谁可以提供帮助、需要解决的问题有哪些,以及问题是如何解决的。在使数据民主化的过程中,组织应该注意到速度和价值正朝着积极的方向发展,因为共享技能和知识可以增进相互理解和提高业务表现。

数据和人工智能民主化的影响将回过头来完善现有的工作角色和职责。数据科学家和公民数据科学家都应能够访问和了解与支持其工作职能最为相关的优质数据集。在建立能够通过民主化实现数据驱动的员工队伍过程中,一支新领工人队伍出现了。组织不得不面临这一个未知因素,因为这构成了一种新的工作方式,但尚未建立最佳的组织结构。变革取决于组织,但这种变革如何体现并不会提前自行显现出来。需要频繁地调整企业的新组织结构。

无论数据科学是由数据科学家还是由公民数据科学家应用,都必须进行充分的监督以确保结果不会偏向组织的目标。通过赋予员工必要技能,组织可以扩大创新机会,并找到下一个杠杆点。充分监督是一个与充分洞察不同的概念。充分洞察将有助于解释或阐明某个单一结果的内容、方式、地点、人员、时间和原因,而充分监督将是解决一系列结果之间因果关系的手段。

图2-4显示了数据和人工智能民主化与数据素养、自助服务能力之间的关系。交叉点应促进组织协作、增强个人和团队能力。总体结果是基于结果的,因为组织实现时间-价值主张应该是循序渐进的,并且最终对所有成员都是公平的。

图2-4 数据和人工智能民主化

民主化

员工或机器有权查看的数据实现民主化的四个关键要素为:

·易获取

·可理解

·能使用

·质量佳

在大多数情况下,易获取意味着你需要单方面对企业内部存在的所有数据以及企业外部存在的所有可使用数据进行编目或存储。其他要素可能是非单方面的,因为数据可理解、能使用和质量佳是相互关联的,并且可能因不同的人或机器而有所不同。例如,Kneel Fischman和Coal Striker的这两个名字对薪资管理部门来说可能信息质量不足,但是对内部欺诈部门来说却足够了。