大数据隐私保护技术与治理机制研究
上QQ阅读APP看书,第一时间看更新

1.3 大数据时代隐私安全问题的表现形式

大数据时代下的隐私以个人数据为载体的形式存在于网络之中,是隐私在新时期的表现形式。基于个人数据带来的巨大经济效益,部分组织机构或者利益相关者就可能倾向于以各种各样的方法去搜集、存储以及处理个人数据。如果个人数据在不涉及公共利益的前提下,同时在未经本人同意或知悉的情况下被组织机构或他人私下搜集、储存与处理,那么就意味着这个人已经失去了对自我信息的控制能力,从而就会引发隐私安全问题。据《2018网民网络安全感满意度调查报告》显示,当前近五成网民认为我国网络个人信息的保护状况不好,四分之一的网民认为非常不好(见图1-1);过半数的网民表示进行网络购物、社交聊天时个人信息泄露的风险更大(见图1-2)。

图1-1 2018年我国网民网络个人信息保护评价情况

图1-2 2018年我国网民网络应用个人信息保护认知情况

从大数据隐私安全问题的表现形式上看,可以划分为技术层面、社会层面以及个人层面等三个层面的表现形式。

1.3.1 技术层面的表现形式

大数据的管理形式决定了大数据技术在技术层面上就易造成隐私安全问题。从技术层面的表现形式上看,大数据技术过程中的搜集、传输、储存以及处理四个环节都存在隐私安全问题。

1.数据搜集过程存在隐私安全隐患

目前常用的数据搜集手段有传感器收取、数据检索分类工具,如百度和谷歌等搜索引擎,以及条形码技术等。大数据时代下,智能设备成为人们生活中必不可少的生活用品,人们在使用智能设备的时候,智能设备会将人们输入的数据随时传输到数据终端中。同时,智能设备也能够自动搜集与记录个人数据,并通过后台自动将这些数据发送出去,这样的过程是个人无法察觉或是察觉到也无法阻止的。个人数据通过智能设备的传输最终到了某些组织机构与个人的手中,如果数据流通到了别有用心的组织机构或个人手中,个人隐私安全就岌岌可危了。这一系列的数据运作方式都是在人们完全不知情的状况下进行的,即使人们的隐私遭到了侵犯,人们也只会知晓结果,而不会知道具体的过程是怎么样的。如用户在淘宝或京东之类的购物网站对特定的商品进行浏览,几分钟后浏览其他网站时,发现网站的投放广告中会出现刚才浏览过的商品以及其他类似商品的推送信息。在短短几分钟内,用户的个人数据便被搜集分析了出来,并且出现在了其他毫不相关的网页上,用户无法确定自己的数据是如何被搜集到,又是如何被处理的,最终造成用户在完全不知情的状况下遭受到隐私侵犯。

2.数据传输过程中造成的隐私泄露

在大数据环境下,高速发展的网络技术为海量数据的传输提供了可能性,海量的数据中包含了大量的个人隐私,那么数据传输的安全性就显得尤为重要。目前,数据的传输方式主要包括有线网络传输与无线网络传输两种。

(1)有线网络传输是数据传输的传统方式,是指通过金属导线、光纤等有形媒质传送信息的方式。在这种传输方式下,数据的可靠性与保密性较强,不易被他人轻易窃取。但是,有线传输需要较大的建设成本,比如建设基站提供数据远程的传输,并且在使用中不具备移动性,所以现阶段人们更倾向于使用方便快捷的无线传输方式。

(2)无线传输是指利用无线技术进行数据传输的一种方式。随着无线技术的日益发展,无线传输技术越来越被各行各业所接受,其安装方便、灵活性强、性价比高等特点使得更多人采用这种传输方式。同时,移动智能设备的出现使得数据的传输方式逐渐从传统的有线传输转变为了无线传输方式。但无线网络的开放性与移动性使得安全管理难度更大,无线网络终端不仅可以在较大范围内移动,而且还可以跨区域漫游,增大了管理的难度。“无线网络通过无线电波进行数据传输,在数据终端覆盖区域内几乎任何一个无线网络用户都能接触到这些数据,任何人在该范围内都可以截获和插入数据,肆意盗取或破坏数据。”此外,在面对海量的数据时,通常无法做到每一个碎片化的数据都采取加密的方式进行保护。在这样的情况下,无线数据传输就凸显出了一定的不稳定性与脆弱性。基于此,数据在无线传输过程中就容易受到不法分子的网络攻击,如黑客入侵、口令破解、恶意篡改等,从而造成数据的遗失与隐私的泄露。

3.数据存储过程存在隐私风险

大数据环境下,数据的存储系统不仅需要储存海量的数据,更需要为数据的分析提供安全的环境。在数据存储的方式与过程中往往存在隐私风险,以下将从数据存储系统与个人数据存储两个方面进行讨论。

(1)数据存储系统。在大数据时代下,数据规模呈爆发式增长态势。人们每天都在产生着大量的数据,数据的规模往往可以达到PB量级,并且数据的来源多种多样,其中包含了大量的结构化与非结构化数据,因此数据存储系统就必须具备管理大规模数据的能力。此外,数据存储系统不仅需要管理海量的数据,还需要为数据处理技术提供基础支撑,保证数据在有效利用之前的安全性。“当前数据存储系统向着分布式和开放式的方向发展,现代存储已成为无数系统共享的一种资源,存储硬件设备连接着许多系统,要保证数据的安全性就必须同时保护分布在各个系统中的数据。”而现有的数据保护技术,如登录访问控制、访问权限控制等均不能完全达到保护数据的目的,这就使得数据在存储过程中更易受到数据窃取、篡改或破坏等恶意攻击,最终造成个人隐私的泄露。如2018年6月,总部位于美国佛罗里达州的市场营销和数据聚合公司Exactis已将一个数据库暴露在可公开访问的服务器上。该数据库包含2TB的信息,其中包括数亿美国人和企业的详细信息。

(2)个人数据存储。目前人们经常使用的手机、平板电脑、电子阅读器等智能设备均具备了数据存储的功能,这些设备将人们日常生活中的消费记录、聊天记录、搜索记录、信用卡等个人信息全部保存了下来,并通过自动发送的方式与网络终端产生数据交互。大量又繁杂的数据往往使得人们很难通过简单的方式彻底删除,因为人们不仅需要删除保存在智能设备中的数据,也需要删除通过智能设备上传至数据存储系统中的数据,其中就会涉及各方各面的问题,使得数据几乎不能够彻底地删除,最终导致数据永远保存在了服务商的数据存储系统中。于是服务商就可以在人们未知的情况下随意使用这些无法删除的数据,从而造成人们彻底失去了对自我信息的控制能力,个人隐私也随时面临着被侵犯与泄露的风险。

4.数据处理过程中对隐私的侵犯

数据处理过程之所以会对隐私造成侵犯,原因在于数据挖掘技术。“数据挖掘指通过对数据的二次乃至多次分析发现其潜藏的价值,为组织所用。这种二次利用涉及的隐私问题,不仅仅是对传统隐私问题的放大,而且是一种颠覆。”

数据挖掘有多种用途,也对人们的生活产生了不同的影响,积极的影响是网络服务商通过对个人数据的分析处理,提高服务的针对性与质量,为用户提供个性化服务。消极的影响则是部分网络服务商对数据无限制的使用,从而造成的数据滥用,进而导致用户隐私遭到了无数次侵犯。例如人们在使用某些社交软件或网站会员时,需要提供自己的基本信息进行注册。在注册的过程中通常会出现隐私声明条款需要人们确认与同意,在条款中服务商会明确承诺人们提供的信息只用于软件或网站提供的服务范围内,绝不会有第三方用途。然而,这种承诺也只是由于当前网络规范管理的要求,因缺乏外界的监管并不能产生任何实际效果的约束力。在人们提供了个人信息后,往往就会出现信息被用于第三方甚至是许多方的情况,无论用途是否有益于个人,都会导致个人失去对自身信息的控制,最终引发隐私安全问题。

1.3.2 社会层面的表现形式

大数据可以理解为是个人将包含或者不包含隐私的数据交付给政府、企业或其他组织机构,通过政府管理以及网络服务商提供的服务换取个人生活、工作以及学习的便利。同时,大数据不恰当的使用也导致了个人数据被泄露、交易以及窃取的风险性大大提高。本节将依据政府、网络服务商、数据技术服务商三方面对大数据隐私安全问题的表现形式进行梳理。

1.政府管理个人信息引发的隐私顾虑

政府作为国家的管理机构、行政机关承担着极其重要的职能,维护着社会公共秩序与保障着公共利益不受损害。政府凭借国家政治权力,以社会管理者的身份依法对公民的个人信息进行搜集,同时也有义务保护公民的个人隐私不受侵犯。政府作为掌握数据资源最丰富的部门,数据的泄露不仅会对公共利益造成严重损害,也会危及国家安全。如何保障公民个人隐私不受侵犯,是当下亟待解决的问题。

2.网络服务商追踪个人数据导致的隐私风险

在大数据背景下,个人数据受到了前所未有的关注,无论是政府还是企业,都将个人数据上升到了战略资源的高度。大数据环境下,网络服务商通过对个人数据进行分析处理,可以实现针对性较强的营销与发现潜在的客户,从而实现较好的经济效益。在商业利益的驱使下,许多服务商为了尽可能多地搜集到用户的个人数据,往往采取了不当的措施。服务商通常会采取追踪用户cookie的方式来进行个人数据的搜集。网络服务商可以利用cookie追踪统计用户访问该网站的习惯,比如什么时间访问,访问了哪些页面,在每个网页的停留时间等。网络服务商利用这些信息,一方面可以为用户提供个性化的服务;另一方面,也可以作为了解所有用户行为的工具。每当用户访问一个网站,都会产生一个对应的cookie,用户的上网习惯、行为、言论等数据就可能会被服务商追踪、搜集甚至遭到窃取,从而导致个人隐私安全存在较大的风险。

3.商业公司贩卖个人数据导致的隐私泄露

大数据环境下,个人数据具有极高的经济价值,因此也催生出一批以贩卖个人信息牟利的商业公司。此类商业公司通常具备了数据搜集技术,往往在未征得个人许可的情况下擅自对包含有特定个人信息的数据进行搜集。这类信息具有明显的符号化特征,比如个人手机号码、身份证号码、房屋信息、工作单位甚至是有无购买商品意向、汽车车牌号等信息。商业公司将搜集的个人信息进行简单打包处理,以较低价格出售给有需求的第三方企业或个人,第三方就可能利用这些信息对个人进行电话骚扰、短信轰炸甚至是电信诈骗等。使得个人生活遭受到了严重的干扰,部分人还因警惕性不高上当受骗致使经济损失惨重。这类“数据交易黑市”的存在对个人信息安全造成巨大的威胁,严重影响到了个人的生活与工作,侵犯了个人的隐私,扰乱了大数据产业的正常发展秩序。

1.3.3 个人层面的表现形式

大数据时代下,个人不仅是数据的生产者,同时也是数据的使用者。个人在使用方式上的不同选择会产生好或坏的结果,隐私安全问题正是由于人们在行为过程中选择了不当的方式而造成的。本节将通过三个方面梳理隐私安全问题在个人层面的表现形式。

1.基于网络平台的信息共享所产生的隐私风险

在大数据时代下,信息的共享已逐渐成为人们生活中主要的交流活动方式。信息共享是指“在一定范围内的特定群体中交流、分享或传播的个人信息,甚至包括传统上不受任何获取限制的个人信息”。信息共享有利于不同层次人际关系的发展,对于多数人际关系来说,人际关系发展的基础需要依靠某些方面或程度的共享信息,特别是对于信息社会来说,共享信息就显得尤为重要。当前伴随移动智能终端的大量普及,出现了各式各样的信息共享应用,信息共享的方式也呈现出多样化的面貌,人们可以通过社交应用、云储存、网站等以视频、图片、语音或是文字的形式实现信息共享。同时,在信息共享的过程中也存在隐私泄露的风险。以下分两种情况进行分析。

(1)主动共享信息。在大数据时代,人们会用自己的隐私去换取个性化的生活,比如在社交应用中人们热衷于向外界展示自己的日常生活,不仅上传日常生活的图片与视频还会发送自己的位置信息。这类信息的共享直接将自己的私人生活曝光在了网络中,一旦此类信息被非法的团体或个人掌握,通过对这些信息的分析处理就很容易确定人们的个人基本信息,如姓名、家庭住址、手机号码等,从而导致个人隐私的泄露甚至是人身安全受到威胁。

(2)被动共享信息。所谓被动共享信息是指为了使用某些应用时,不得不在注册或登录时向服务商提供部分个人信息或者选择提供不真实的个人信息。通过这样的方式可以让服务商尽可能少地获取个人信息,在一定程度上确实能够避免隐私的泄露。但是在大数据时代下,个人的隐私极易就能被触及,我们在网络中的一举一动时刻以数据的形式发送给数据服务商,服务商通过对这类数据的分析很容易就能够获得我们的其他个人信息。

2.黑客窃取个人数据造成的隐私侵犯

随着大数据的快速发展,数据化的生活已成为人们日常生活的主要方式。在人机的互动下逐渐积累起来的庞杂数据,让数据保护工作变得异常艰难,导致个人数据的安全受到了极大的考验。这样的数据环境给黑客提供了便捷的窃取通道,让黑客盗取个人数据变得更为容易。“以计算机网络为工具,利用网络安全漏洞,窃取用户数据的犯罪组织,已经发展成为一个有组织、分工明确的黑色产业链。”黑客通过种植木马病毒的方式,在未经授权的情况下非法进入系统实施攻击,窃取电子邮件、通信录、照片、账户与密码信息等。甚至还能够监听手机通话内容,待通话完毕后,木马病毒就启动上传程序,将通话内容上传至黑客的服务器中,使用户在完全不知情的情况下遭到数据的泄露。这些个人数据包含了个人生活的各方面内容,并且高度敏感,盗取价值非常大,一旦遭到泄露并流通到第三方使用者,不仅会严重损害个人的利益,也会对个人生活造成极其不良的影响。

黑客一般通过两种方式种植木马病毒。一是将木马病毒生成短信、微信或电子邮件的形式,伴以诱人的标题骗取用户点击打开,一旦用户不小心打开了这类消息,设备立刻会感染木马病毒,让黑客实现无授权登录。二是将木马病毒种植在应用软件当中,如游戏、社交应用、电子书以及免费资料等。黑客将这些应用软件上传至某些缺乏安全验证的软件论坛中骗取用户下载安装,从而达到窃取信息的目的。

3.个人不当的网络行为造成的隐私侵犯

随着移动智能终端的发展,智能应用软件的普及,信息的获取与传播变得越来越便捷,人们通过各式各样的应用软件与他人进行信息的交流。比如在微博分享自己或他人的信息、在贴吧论坛发帖回复、用电子邮件收发信息等。人们在进行这些网络活动时,就可能有意或无意地触及到他人的隐私,从而产生侵犯他人隐私的行为。

当前人们习惯于在社交应用上发表自己拍摄的照片或视频,这些照片或视频通常就包含了他人的信息,如个人形象、个人证件号码以及汽车牌照号码等。因为社交网络是一个开放式的环境,导致任何人都可以看见这些照片或视频,某些对这类信息感兴趣的人会将其保存并发布在其他社交平台上供他人观看、评论或传播,这样就极其容易导致他人更多的个人信息被曝光出来,从而严重侵犯到了他人的隐私。这种私自散布他人信息的行为不仅侵犯了他人的隐私,而且此种行为的后果往往会给当事人的日常生活造成不同程度的骚扰,甚至是生命财产安全受到严重威胁。