1.2.1 数据感知
数据感知是指企业利用信息通信技术建立数据连接方式、构建连接机制,从观测对象中获取数据,以供企业进行数据分析的过程。
1.数据感知的数据源
观测数据是通过观测工具获取的数据。数据源(观测对象)主要存在于三个领域:消费领域、工业领域和公共领域。
(1)消费领域数据源。在消费领域中,先后形成了“货”的时代、“场”的时代、“人”的时代和“人货场”融合的时代。“货”的时代是指货物短缺、供不应求的时代,此时渠道为王,品牌方无法越过经销商直接与消费者取得联系;“场”的时代是指以争夺线下卖场为主要竞争方式的时代,此时百货商场火爆,铺位为王,顾客在线下聚集,从而形成转化;“人”的时代是指流量为王的时代,通过社交、电商、平台聚集流量,将线上线下融合达成销售。
当前,消费领域的数据进入了“人货场”融合的时代(见图1-10)。数据为王,零售进入“全触点”时代。“人货场”融合的时代的数据主要来源于店员导购、社交广告、搜索、支付后关注等“人”的行为,销售、被选择、被定制等“货”的数据和互动大屏、扫码或刷脸等“场”的数据。这些数据并不是分割的,往往同时存在于一个消费者的同一购物过程中。相比于消费领域中“货”的时代、“场”的时代和“人”的时代,“人货场”融合的时代数据获取更加智能化、个性化。
图1-10 消费领域的数据进入“人货场”融合的时代
资料来源:腾讯研究院.2020数字中国指数报告:未来经济,数字优先[R/OL].(2020-09)[2021-05-19].https://pdf.dfcfw.com/pdf/H3_AP202009251417322588_1.pdf?1601061080000.pdf.
(2)工业领域数据源。在工业领域中,工业数据的总和被称为“工业大数据”,主要分为三类,即企业信息化数据、工业物联网数据以及外部跨界数据。其中,企业信息化和工业物联网中产生的海量时序数据是工业数据规模变大的主要来源[1]。
企业信息化数据主要是指企业在运行制造执行系统(MES)、企业资源计划(ERP)系统、产品生命周期管理(product lifecycle management,PLM)系统等自动化与信息化系统中产生的数据。
工业物联网数据是指工厂中工业物联网系统通过传感器、仪器仪表和智能终端等自动采集的物料、设备、产品、环境的数据。这些数据主要用于智能生产和智能服务,为智能工厂生产调度、质量控制和绩效管理提供实时数据基础;通过传感器感知产品运行状态信息,帮助用户降低装备维修成本、提高运行效率、提供安全保障。
外部跨界数据主要包含企业供应链、价值链和跨产业链上的数据,如企业产品供应链和价值链中来自原材料、生产设备、供应商、用户和运维合作商的数据。
(3)公共领域数据源。在公共领域中,政府数据对企业的经营发展有着重大影响。公开的政府数据通常被定义为使用公共资源生成的,能在创新应用程序中重复使用和重新打包的数据,也被称为政务数据或公共数据,一般包含政府政策、法律法规、政府统计数据和政府研报数据等。例如,《中国制造2025》属于政府政策,《中华人民共和国数据安全法》属于法律法规,《广东统计年鉴(2020)》属于政府统计数据,《2020中国地方政府数据开放报告》属于政府研报数据。目前,我国正在积极推进政府数据共享。复旦大学联合国家信息中心数字中国研究院发布的《2020中国地方政府数据开放报告》显示,截至2020年4月底,我国已有130个省级、副省级和地级政府上线了数据开放平台,其中省级平台17个,副省级和地级平台113个。全国政府数据开放数据集总量增长速度较快[2]。
2.数据感知方式
数据感知方式分为软感知和硬感知两种,如图1-11所示。软感知指的是在“软件”层面的感知,使用软件或各种程序进行数据收集,通常不依赖于物理设备。例如,网页或App中的“埋点”、消费者的点击、购买数据、电子产品系统上的系统日志(system log)、通过爬虫获取的网络数据等。这些收集对象存在于数字世界中,收集者通过自动运行的程序或脚本获取。硬感知指的是“硬件”层面的感知,是使用设备和装置进行的数据收集,收集对象为物理世界中的物理实体(人、设备、产品、环境)或以物理实体为载体的信息、时间、流程、状态等。例如,语音、视频、OCR(图像识别)、RFID、条形码或二维码、人脸识别、传感器等。硬感知过程是数据从现实世界向数字世界的转化过程,大部分可以由既定的程序自动感知和传导,有些需要人来操作。
图1-11 数据感知方式
资料来源:华为公司数据管理部.华为数据之道[M].北京:机械工业出版社,2020.
例如,广州赛意信息科技股份有限公司(以下简称“赛意信息”)和百丽集团通过合作,进行门店现场数据采集,将原本高密度的线下门店由劣势转为优势。通过在鞋子内部注入RFID芯片,并在店铺安装可以识别和感应RFID的电子地毯,客户在试穿的同时可以采集门店内每款鞋的试穿率、时长及销售转化率等数据,然后通过大数据分析,精准掌握哪些款式受欢迎,哪些不受欢迎,顾客的需求和偏好在后台被动态监测,而后反馈到上游的生产环节。对试穿率高但销售转化率低的款式及时进行调研,反过来指导生产过程改进,这样既提升了线下零售效率,又降低了库存。
[1] 工业互联网产业联盟 . 中国工业大数据技术与应用白皮书 [R/OL]. (2017-07)[2021-05-27].http://www.cac.gov.cn/fi les/pdf/baipishu/gongyedashuju2017.pdf.
[2] 复旦大学,国家信息中心数字中国研究院. 2020 中国地方政府数据开放报告[R/OL]. (2020-07-30)[2021-06-28].http://www.echinagov.com/info/285077.