第二节 贵州交通大数据人才类别建设
大数据是个综合性新生事物,包含了大数据技术、应用、安全、管理等诸多内容。大数据涉及诸多理论知识和实践技能,独立个体想要掌握全部知识显得尤其困难,不同类别的人才掌握着专业的知识和技能,具备不同的能力要素,他们分工合作可以产生“1+1>2”的效果。因此,大数据人才按照不同类别进行建设显得十分必要。贵州交通大数据人才类别建设内容包括贵州交通大数据专业技术人才建设、贵州交通大数据应用人才建设、贵州交通大数据安全人才建设、贵州交通大数据管理人才建设和贵州交通大数据领军人才建设五个方面。本节将介绍不同类别人才素质建设的内容,重点介绍不同类别人才特有的素质建设内容。
一、贵州交通大数据专业技术人才建设
贵州交通大数据专业技术人才是指利用各种大数据技术、计算机技术、统计分析技术实现大数据架构、数据分析等重要工作的专业技术人才。交通大数据专业技术人才是大数据人才的技术工匠,是用各种技术实现业务架构和要求的技术人才,必须具备技术精湛、业务精通以及经验丰富等特征。交通大数据专业技术人才具备的知识、技能、能力、经验、思想、品格六大要素所占的比重有所不同,其中技能素质占比最高,知识素质次之,能力素质、经验素质紧随其后,思想素质和品格素质占比相对较低。交通大数据专业技术人才素质内容构成如图2-2所示。
图2-2 交通大数据专业技术人才各项素质占比
交通大数据专业技术人才包括交通大数据规划师、交通大数据工程师、交通大数据架构师、交通大数据分析师、交通大数据科学家五类。每类技术人才需要具备的技术技能各有不同,具体如下:
交通大数据规划师是在交通运输领域内对大数据业务中涉及大数据技术的有关问题进行规划的专业技术人才,是发现、认识、研究交通业务中涉及大数据问题本质并针对性地制订大数据实施方案的技术性人才。大数据规划师要能够利用大数据知识、技能、经验从宏观层面和总体层面把传统业务技术手段转变为大数据实现方法,形成大数据手段化、方法化、技能化的实施方案。交通大数据规划师需要熟悉Hadoop及其生态圈技术、分布式存储技术、数据挖掘技术、流计算、图计算、机器学习(Machine Learning)、主流数据库产品如Oracle的管理和应用,并精通SQL语言等。
交通大数据工程师是实现和完成交通大数据方案的专业技术人员,是从事大数据方案操作、测试、运维、调整、管理、评估的人员。大数据工程师需要在大数据方案实施的过程中,分析行业业务需求,改进方案中不合理、不符合业务需求之处,确保大数据方案顺利实施。大数据工程师需要掌握云计算基础,云基础架构与虚拟化,Java、Python、R语言、Ruby、Scala等编程语言中的一种或几种,Hadoop与分布式系统。
交通大数据架构师则是设计、组合、搭建各种平台架构的技术人员,即对大数据文件系统层、数据存储层、资源管理器和资源协调器层、计算框架层、数据分析层、数据集成层、操作框架层等大数据平台进行设计、组合、搭建,以确保大数据方案可以实施。大数据架构师要能够把数据和业务进行对接;能够搭建大数据数据存储、数据管理及数据处理平台;掌握Spark、Flink等提供数据管理和服务并支持模型和算法的平台;掌握Tachyon、HDFS、GFS等分布式文件系统,Scribe、Flume等数据收集技术,以及数据质量管理技术、数据需求分析技术、数据标准化技术、数据库设计及应用技术等。
交通大数据分析师是基于各种分析手段对交通大数据进行科学分析、挖掘、展现并用于决策支持的技术人员,包括对数据统计结果的甄别与分析、对数据分析结果的评估与展示、对用户数据需求的判断与反馈。数据分析和数据挖掘相互依存、相辅相成,大数据分析师不仅要具备数据分析技术,更要具备数据挖掘技术。大数据分析师需要熟练使用常见的Excel、SPSS、SAS数据分析工具,而且至少精通一种数据分析软件,精通R语言、Python、语义分析(自然语言处理)等技术,熟悉Hadoop、Mapreduce等大数据分析技术平台,掌握分类、预测、聚类、关联规则、时序数据挖掘、文本挖掘等大规模数据挖掘方法,掌握决策树、随机森林、贝叶斯网络、SVM等机器学习的各种模型,掌握Pig、Hive、kylin、Spark SQL、Spark Data Frame、Impala、Phoenix、ELK、Elastic Search、Logstash、Kibana等数据分析、数据仓库(SQL类)工具。
交通大数据科学家是能够利用数据作为资源、具有数据分析能力、精通各类算法、能够直接处理数据并创造附加价值的人才,具备从交通大数据里掘金的能力,是能对交通运输行业大数据进行科学决策和预测的高级技术人才。大数据科学家的作用不仅在于使大数据项目落地,更要发掘数据的最佳商业价值。大数据科学家需要具备高等数学、运筹学、统计分析(包括R、SAS和Stata等工具)、编程(包括C语言、C++、Python、Java等语言)、SQL数据库、Hadoop、Spark、Mahout等大规模并行处理技术,以及数据分析挖掘及建模(分类/预测、聚类、关联规则、时序数据挖掘、文本挖掘)、机器学习、数据可视化、创造力、沟通技能和业务理解能力。大数据科学家需要承担起数据分析各个环节的不同责任,而大数据工程师或大数据分析师只需承担数据科学家的部分责任,而不是全部。大数据科学家更侧重于数据的战略方面,即引导、捕捉、发现、创新方式,并利用数据提高商业价值。大数据科学家需要对数学模型进行业务解释,并利用该模型指导业务流程优化,辅助企业决策,这也是大数据科学家的价值所在。
二、贵州交通大数据应用人才建设
贵州交通大数据应用人才是指能够把科学规律和大数据知识、技能、经验等应用于社会生产实践,在交通运输行业或者跨行业(指与交通运输行业相关领域)直接或间接创造经济价值和社会价值的应用型人才。交通大数据应用人才应具备的素质不再是单纯的知识、技能、能力、经验、思想、品格六大要素的组合。不同于交通大数据技术人才建设,交通大数据应用人才建设更强调跨行业或与实体领域相结合的知识、技能和能力。交通大数据应用人才的素质建设应以掌握大数据重点知识、了解大数据核心技术为基础,结合跨行业知识和行业经验,依托管理能力和特定品格,实现跨行业或与实体领域相结合的交通大数据应用,发挥交通大数据的价值。交通大数据应用人才素质内容构成如图2-3所示。
图2-3 交通大数据应用人才各项素质占比
贵州交通大数据应用人才以社会、交通运输行业的需要为取向,以应用知识为主,将科学知识应用于工作实践,对已有的科学知识与技术进行创新并直接应用于社会生产活动以创造经济价值。主要体现在提供交通运输大数据服务、交通大数据产品等。交通大数据应用人才主要包括数据标准化建设人才、城市规划人才、城市建设人才、智慧出行建设人才、城市应急处置人才、交通大数据可视化平台建设人才,还包括城市交通综合管控、高速公路运行监控、智能公交应急指挥、轨道交通运行监控、智慧航空运维监控、智慧港口运维监控等人才,以及无人驾驶应用人才等。
交通大数据应用人才属于新型的复合型人才,主要进行利用数据价值创造经济价值的工作,其个人需具备的素质要求中能力素质占比最高,主要是指跨行业知识、跨行业经验和管理能力。作为一个合格的交通大数据应用人才,应该主要具备以下几点能力:
第一,跨界思维能力。大数据应用往往需要将不同来源、不同类型、不同领域的数据进行融合与分析,才能发现前所未有的价值。因此,大数据应用人才不能将自己的思维模式局限于某个或几个固定的领域,要具有跨专业、跨领域的跨界思维模式。
第二,对数据的敏感性与好奇心。从庞大的数据中发现商业价值不是一件容易的事情。只有对数据具有高度敏感性并对发现数据背后的隐藏秘密具有强烈好奇心的人才能成功找出答案。
第三,创新欲望。贵州交通大数据应用人才是跨行业进行应用创新创造经济价值的特殊人才,需要善于创新,敢于创新,具有强烈的创新欲望与创新精神。
第四,综合应用知识的能力。通常来讲,一个大数据应用项目涉及多方面的知识,要求大数据人才有较强的综合能力来融会贯通各种知识。
第五,团队合作与领导能力。一个大数据团队通常会聚集各方面的人才,因此相互合作非常重要,良好的团队合作精神将形成合力。另外,较强的领导能力是协调团队和凝聚团队的重要保证。
第六,工程能力。大数据应用项目本质上是工程项目,因此,要按照工程项目的规律开展,团队人员要具备工程开发与管理的能力。
第七,沟通交流能力。大数据应用人才必须具备与他人进行良好沟通的能力,才能深入挖掘企业的数据特征与处理需要,并将数据分析的结果有效地传达给他人,否则,大数据的价值就得不到充分发挥。
三、贵州交通大数据安全人才建设
交通大数据安全人才是负责交通运输行业大数据安全和隐私保护的专业技术人员,即负责大数据使用生命周期的全部安全问题,包括数据采集、数据整合、数据提炼、数据挖掘、数据可视化、数据隐私、防止数据盗用和滥用、保护加密数据、阻止黑客攻击、安全态势判断、安全检测等诸多过程的安全问题。大数据安全人才要用各种安全技术去解决问题,交通大数据安全人才具备的知识、技能、能力、经验、思想、品格六大要素中,技能即大数据安全技术要素占比最高,知识要素占比次之,经验要素占比位于第三位,思想素质占比紧随其后,能力素质和品格素质占比相对较低。交通大数据安全人才素质内容构成如图2-4所示。
图2-4 交通大数据安全人才各项素质占比
数据安全和隐私保护成为大数据时代的一个重要议题。大数据技术使之前无法聚合的大量数据聚集起来,海量数据的汇集加大了隐私信息暴露的可能性,同时对大数据的无序使用也增加了信息泄露的风险,进而引发对敏感数据隐私保护的担忧。因此,大数据安全人才应运而生。目前大数据在收集、存储和使用过程中面临着诸多安全风险,大数据所导致的隐私泄露为用户带来严重困扰,而虚假信息将导致错误或无效的分析结果。
大数据面临的特有安全问题主要表现为:第一,节点交互引发的安全问题,包括数据源可信问题。第二,分布式存储架构和协同计算引发的安全问题,如完整性验证、密钥管理难,存储的可靠性也难保证。此外,还存在数据难销毁等问题、分布协同的计算模式引发的安全问题,即纷繁杂乱的计算环境、安全需求不同、安全强度不同将引发更多的安全漏洞。第三,大数据分析及应用引发的安全问题:隐私泄露、非授权访问等。
交通大数据安全人才主要从政策科学、计算机科学、社会学、伦理学领域产生,主要负责对数据安全(包括数据本身和数据防护安全)的维护和保障,包括维护数据隐私、防止数据盗用和滥用、保护加密数据、阻止黑客攻击、建立数据安全防护体系等。交通大数据安全人才对业务大数据生命周期的全过程负责。交通安全人才需要具备的主要素质是大数据安全技术能力,主要包括数据传输安全技术、数据加解密技术、数据备份与恢复技术、身份认证技术、访问控制技术、数据脱敏技术、数据发布匿名保护技术、社交网络匿名保护技术、数字水印技术、安全审计、数据溯源技术、角色挖掘技术、大数据防火墙技术、防范APT(高级持续性威胁)攻击技术等。按照大数据使用生命周期,可以把大数据安全人才分为大数据采集安全员、大数据存储安全员、大数据分析安全员以及大数据应用安全员。按照大数据安全人才服务的范围不同,可以把大数据安全人才划分为大数据存储安全员、大数据网络安全员、大数据基础设施安全员、大数据平台安全员、大数据管理安全员、大数据隐私安全员等。
在大数据的深入研究和应用过程中,传统的数据安全机制不能满足大数据的安全需求,大数据安全和隐私保护在安全架构、数据隐私、数据管理及完整性和主动性的安全防护等方面都面临着严峻的挑战。交通大数据安全人才需要重点关注上述几方面的安全问题,着重掌握以下几个技术问题:分布式编程框架的安全计算、非关系数据存储安全、数据存储和交易日志、终点输入验证技术、实时安全监控、可扩展和可组合的隐私保护数据挖掘和分析、加密强制数据中心的安全、细粒度访问控制、细粒度审计以及数据溯源问题。
四、贵州交通大数据管理人才建设
贵州交通大数据管理人才是对交通运输相关大数据业务进行计划与决策、组织、领导、控制,保障大数据业务实现的复合型人才。交通大数据管理人才具备的知识、技能、能力、经验、思想、品格六大要素所占的比重有所不同,其中能力素质(管理能力)占比最高,知识(管理知识)占比次之,经验素质位居第三位,思想素质、品格素质紧随其后,技能素质占比相对较低。交通大数据管理人才素质内容构成如图2-5所示。
图2-5 交通大数据管理人才各项素质占比
交通大数据管理人才不是简单的数据管理员,而是涉及大数据业务各环节的管理者。按照目前贵州交通运输大数据业务,交通大数据管理人才包括大数据系统规划管理人才、大数据系统开发管理人才、大数据系统运维管理人才、大数据平台管理人才、交通行政监管管理人才、交通企业运营管理人才、交通市民服务管理人才、交通应急指挥管理人才等。
大数据管理人才既属于创新型科技人才,又是当下经济社会发展重点领域紧缺的专门人才。大数据管理人才是管理类人才的一种,其具备的素质更偏向于管理者该具备的素质,其中管理者综合能力和管理知识是管理人才首先应该具备的重要素质。管理人员应该具备思维决策、团队规划、判断能力、创造能力、洞察力、谈判能力、同理心、解决问题的能力、培训能力、影响力、积极性、信息识别能力、团队责任感、领导能力、关心下属、自信心构建、独立学习能力、人际交往能力等。
交通大数据管理人才主要会从交通运输、计算机科学、管理学、经济学领域产生,主要负责对大数据系统、平台以及大数据的保存、管理、维护和运营。各个行业都有管理人员,大数据也不例外,只不过大数据时代的管理人员所面临的更多是“数据”这个特殊的管理对象,而能够适应这个特殊性的管理人员,才可能成为大数据管理人才。交通大数据管理人才需要掌握的理论知识分为三个层次:基础层的知识内容是管理学相关知识和交通运输业知识;中间层是计算机基础知识,主要有计算机操作能力知识、数据库知识、计算机软/硬件知识和编程知识;最高层是数据分析知识,主要有统计分析、数据挖掘和数学/统计学知识。基础层的知识是大数据管理人才必须掌握的,交通大数据管理人才是服务于交通运输业的管理者,管理学知识和交通运输行业知识是该类人才具备的基础性知识,也是进行管理工作的首要保障要素。中间层的知识是大数据管理人才应该掌握的,交通大数据管理人才是对大数据业务以及各类业务流程进行规划、控制,掌握计算机基础知识是为了进一步掌握大数据相关知识,确保大数据业务符合需求。最高的知识内容属于大数据相关知识中的重点内容,大数据管理人才着重掌握数据分析知识,能够把握大数据业务的核心。
大数据管理人才不仅要能实现对数据需求管理、元数据管理、数据质量管理等方面的传统或面向应用的数据管理,还必须具备数据维护和运营的能力,即面向业务的数据管理。优秀的数据管理人才,应该能够敏锐地捕捉所管理数据的核心价值,能够通过业务流程发现数据增值的空间,能够在“数据”与“价值效益”之间找到契合点,能够及时、准确地判断数据的折旧值,能够合理利用数据废气实现再增值。
大数据管理人才仅仅具备上述专业知识显然是远远不够的,只有具备丰富的经验和较高的综合素质,才能满足大数据环境下管理人才的需求。交通大数据管理人才属于复合型人才,一专多能才是抢手、最有价值的人才。
五、贵州交通大数据领军人才建设
交通大数据领军人才是在交通大数据领域取得重要成就,同时因个人人格魅力在该领域具有普遍影响力、感召力、领导力的高层次人才。交通大数据领军人才常常起着决定性作用,他可以把分力转为合力,贯彻和执行团队目标,使团队成员保持对外部的反应灵敏度,能迅速做出反应,同时,为团队运作寻找好的方式、方法。交通大数据领军人才具备的知识、技能、能力、经验、思想、品格六大要素中,思想素质、品格素质分别是位居第一、第二位的重要素质,其次是能力素质,然后是知识素质,经验素质、技能素质占比相对较低。交通大数据领军人才素质内容构成如图2-6所示。
图2-6 交通大数据领军人才各项素质占比
领军人才,通常具有崇高的价值追求、独特的人格魅力、坚韧的拼搏毅力、卓越的领导能力、出类拔萃的科学素养、强大的团队凝聚力和广泛的影响力。交通大数据领军人才是类特殊人才,该类人才的素质建设内容包括人格魅力、思想力、意志力、领导力、影响力和专业技术能力几个方面。其中人格魅力和思想力是大数据领军人才要具备的首要层次要素,感召力、意志力、领导力、影响力这“四力”是大数据领军人才要具备的第二层次要素组合,专业技术能力则是大数据领军人才要具备的第三层次要素。
人格魅力和思想力是大数据领军人才要具备的主要要素。人格魅力则是一个人在性格、气质、能力、道德等方面所具有的能吸引他人、潜移默化地影响他人的力量。它所散发的内在的、隐性的影响力会通过各种途径、方式直接或间接地渗透、融合到沟通的过程中,去感染、影响他人的心理活动和行为方式,在无形中产生巨大号召力和感染力。交通大数据领军人才的人格魅力应该是宽厚的知识素养、高尚的道德情操、坚定的理想信念和良好的行为品格的完美结合。思想力是思想主体以现实的社会实践为基础,借用一定的物质载体和精神载体去实现思想理念的升华与创新的能力。交通大数据领军人才具备的思想力具有正确性、核心性、创新性和批判性。没有正确、核心的思想力作为基础,人们对自然及整个世界的理解不可能超越经验层面;没有正确思想的引导,人们对科学与知识的运用就会出现偏差。有创新性的思想才能接受大数据这类新事物、新技术,才能更好地指导大数据业务实践。批判性的思想力要求用辩证法的观点看问题,这样才能客观、全面、正确地认识大数据人才、大数据技术、大数据业务等。
成熟、优秀的领军人才体现在“四力”方面:其一,感召力;其二,意志力;其三,领导力;其四,影响力。领军人才需要有感召力,要能激励队员的士气,传授经验给队员,解决队员的问题,能令队员折服,必要时要亲自解决困难问题。要激励有能力、没意愿的成员,提升有意愿、没能力的成员。领军人才不是遴选出来的,而更多地需要发挥其自身主观能动性,并经过长期的社会实践才能培养出来。而在长期的、艰苦的社会实践中,在困难面前敢于攻坚,除了具备把握机遇和判断风险的高超能力,坚韧不拔的意志力更是领军人才十分必要的素质。大数据领军人才还需有较强的领导力,领军人才通过领导力,通过团队能力实现领军人才的作用。表面上他是一个代表人物,其实背后是一个团队的力量在起作用,大数据领军人才需要具备的领导力包含管理但不只限于管理,还要求大数据领军人才具有团队建设、人才培育、洞察力等要素。领军人才还需具备影响力,其最大的作用就是培育或传播一种文化或精神,让整个团队或部门的人都有一个共同的理念、共同的目标、共同的行为准则。
是否具备深厚的专业造诣是衡量一个人是不是领军人才的关键指标。绝大多数的领军人才自身都具备某一领域系统的、高水平的专业素质。交通大数据领军人才是交通运输领域的顶尖人才,领军人才的专业技术能力是其具备的第三层次要素,包括交通运输行业基础知识和技术、大数据相关知识和技能。此外,还要求领军人才对交通运输领域的未来发展有准确的预知能力、较强的创新意识和创新能力。领军人才需要具备的专业技能、知识结构是开放和动态的体系,不仅能够易于接受新知识,还可以发挥知识的相关性作用。