公司的数据素养有多高?
我们都读过这样的故事:人脸识别软件无法识别深肤色面孔,或者机器人信贷员拒绝向某些群体提供抵押贷款。越来越多的研究表明,由不具代表性群体创建的算法导致了人工智能(AI)将我们社会中已普遍存在的不平等固化。随着越来越多的企业愈加严重依赖数据和AI,这些算法歧视问题可能只会加剧。
多数企业现在都知道这一点。他们试图弄明白的是:如何才能避免成为又一个坏榜样?
答案很简单:人人都需要批判性地思考正在收集的数据以及使用这些数据的方式。扩大在房间里帮助质询、构建和监控算法的圈子是我们开发可信赖AI的唯一途径。做这项工作需要数据素养——解析和组织复杂数据、解释和总结信息、进行预测或者理解算法道德含义的能力。像数学一样,它可以在入门级和高级模式下学习,跨越多个学科,而且通常更具实用性,而非学术性。
在企业中培养数据素养也有助于数据团队的多元化,他们在如何收集、处理和部署数据方面身处制定关键决策的最前沿。多元化数据团队的重要性是我在担任量化基金经理的十多年里亲身体会到的。人们普遍认为,更多样化的投资组合之所以表现出众,是因为它们降低了风险。但同样有道理的是,多元化团队之所以表现出众,是因为他们降低了趋同思维的风险。通过对整个企业的数据素养进行投资,企业可以在降低算法偏差风险——以及识别数据经常可以揭示的其他效率和机会方面带来更多差异化和创造性的视角。
然而,对数据进行的审视告诉我们,多数企业仍难以培养数据素养。90%的企业领导者认为数据素养是公司成功的关键,但只有 25%的员工对自己的数据技能充满信心。不仅如此,还有一些估计表明,近九成的数据科学专业人士是白人,只有18%是女性。来自联合国大会的研究表明,就多元化而论,数据科学甚至落后于数字营销和用户体验设计等其他技术型学科。
尽管需求明显、紧迫性加剧,为何我们还没有系统性地大规模教授数据素养?这一问题在过去几年里激励着我的工作。在Correlation One(我在 2018 年离开我的基金后与人共同创建的),我的团队与金融服务公司和《财富》500 强企业合作,建立更具包容性的数据科学人才梯队。从Target到强生公司再到哥伦比亚政府,通过帮助雇主评估其现有员工队伍的能力,并为有追求的数据科学家提供免费培训(比如我们与软银和迈阿密市的合作),我们获得了清晰的视野,更好地认识到我们迫切需要拥有更具数据素养的员工队伍,并帮助企业制定具体的做法,以使这一目标成真。
以下是我们使用的部分策略。
1.让数据素养成为全企业的头等大事,而不仅限于技术部门员工。
数据素养不是一项技术能力,它是一项专业技能。鼓励你的全体员工——营销人员、销售专业人员、运营人员、产品经理等——通过每季度参与你主持的会议来培养他们的数据素养,你在会议上的话题涵盖数据驱动决策、AI的可能艺术、数据如何与你的业务和道德及AI关联,以及如何使用数据沟通等。这种全企业范围内的重视是向数据优先文化转型的基础。
开发一种内部通用语言来谈论数据、它如何与你的业务和行业交叉,以及它在如何改变你公司的特定岗位。
人人都需要批判性地思考正在收集的数据以及使用这些数据的方式。
数据世界之大,充斥着流行术语和误解。要以企业的身份树立眼光,看看数据素养中的哪些要素对你的企业最为重要——如果你是一家金融服务公司,重要元素可能是概率和风险衡量;如果你是一家技术公司,重要元素可能是实验和可视化。在你的学习与发展(L&D)培训中,要开发使用这种语言的学习内容,并演示它如何与你多个部门的业务相关联,这样员工就能够将数据素养和他们的工作流程之间的所有点关联起来。
2.在企业内创建空间,让员工可以将业务概念和数据概念相关联。
我们向Correlation One的所有客户的建议之一是,让员工能够运用数据素养产生新的业务想法。比如,假设你的公司属于音乐行业。作为你L&D计划的一部分,让员工利用他们新获得的对数据素养的认识来制定项目提案——结合他们对这一行业的认知,会提出意想不到的节约成本或创收的新想法。同样重要的是,你要授权他们自下而上推动一种新的数据优先文化。
3.创建激励机制,奖励数据驱动的决策。
采用你当前审批创意或制定预算的流程。然后增加奖励数据驱动思维的机制。比如,要求管理者在他们的提案中包含清晰的可视化效果,或者构建能够量化和实时跟踪他们关键业绩指标(KPI)的仪表盘。如果你能够为使用数据驱动思维提案提供更快的项目审批或更大的预算,从而将经理的决策从直觉转向数据,那么你很快就可以通过激励机制的调整从管理者那里得到你想要的行为。
4.部署L&D计划,在业务问题背景下教授数据素养——而这可以真正吸引员工。
在寻求持久转型的企业中,在Cours era这样的教育培训平台订阅服务通常达不到预想效果。这是因为当学习具有社会性(与他人一起完成)、个性化(完成过程中有专家反馈)和情境性(与你正在解决的业务问题直接相关)时,学习效果会好得多。开发这些个性化、社会化、情境化的学习计划需要更密集的资源,但从员工对材料的投入度、员工对材料的保留以及赋予员工权力的角度来看,其好处是值得的。
也许最重要的是,我在Correlation One之前和期间的经验帮助我认识到数据不是垂直的——它不仅仅是类似数据科学家或数据工程师这样的工作类别。相反,数据是水平的——它是一组技能,贯穿每一领域中越来越多的工作。具有数据技能的营销人员是更好的营销人员。具有数据技能的产品经理是更好的产品经理。运营、工程、销售,甚至人力资源部门都是如此。不是每个人都需要懂得如何编码,但不久每个人都需要数据素养。
归根结底,数据素养远不止是机器学习和数据科学,它关乎的不仅仅是人工智能。数据素养不过是涉及人类在一个充满数据的世界中更好地应对——这就是我们现在比以往任何时候都更需要它的原因。
拉希德·萨巴尔是CorreIation One的共同创始人和联合CEO,这是一家专注于企业数据技能培训的技术公司。该公司正在打造一个更具包容性的数据生态系统,其中包括一些让更多女性和代表性不足的群体参与数据工作的项目。