第一章
大数据时代的个人信息安全危机

第一节
大数据的形成、特点与发展趋势

互联网使我们进入一个信息爆炸式增长的时代,使我们能够快速获取海量信息,并使得以海量信息数据为基础进行科学研究与企业决策等成为可能。然而,值得警惕的是,大数据时代的到来在为我们带来便利的同时,也可能使以往小范围内危害他人合法权益(包括但不限于公民的个人信息)的行为影响范围扩大、影响程度加深,同时还可能产生一些过去无法想象的新型危害公众合法权益的行为。因此,我们首先需要对大数据的形成过程、特点、未来发展趋势予以回顾,以便为后文探究大数据时代个人信息盗窃相关法律问题及规制路径奠定基础。

一、大数据的形成

对于“大数据”这一概念,无论是学界还是实务界目前均未形成明确统一的认识与界定。1980年,美国著名未来学家阿尔温·托夫勒(Alvin Toffler)首次在《第三次浪潮》一书中提出“大数据”这一名词,但受限于当时信息资源并不丰富的时代特点,他仅提出了与大数据有关的概念性理论,且并未引起较大的关注。2001年,美国信息技术研究和分析公司加特纳(Gartner)在其发布的一份研究报告中使用了“大数据”(Big Data)这一概念。2011年5月,美国麦肯锡环球研究院在其发布的研究报告《大数据:创新、竞争和生产力的下一个前沿》中指出,大数据本质上即为一种在获取、存储、管理、分析方面远超传统数据库软件工具能力范围的大规模的数据集合。2011年5月,英国维克托·迈尔-舍恩伯格(Viktor Mayer-Schönberger)教授等明确肯定了大数据的重要性以及其对社会的深远影响,并认为大数据时代已经到来。[2]2012年3月29日,美国奥巴马政府对外公布《大数据研究与发展倡议》(Big Data Research and Development Initiative),拉开了大数据时代的序幕,自此,人们普遍认为大数据时代已然到来。[3]随后,商业机构乃至社会各界开始逐渐意识到大数据的价值并开始对其进行大量的研究。其中,商业机构对大数据给予了极高的关注。商业机构逐渐认识到,个人信息可为企业发展战略制定提供直接且重要的参考,具有很高的应用价值。之后,众多商业机构开始重视大数据分析技术的应用,将海量的个人信息收集并存储于数据库中,用来分析消费者的市场需求和消费水平并绘制用户的现实形象,以推断何种产品或服务更契合消费者的现实需求。

从国家层面看,众多国家把大数据提升到国家战略的高度,美国政府更是把大数据看作“未来的石油”。奥巴马政府于2009年1月签署了《透明与开放政府备忘录》,提出要建立透明、开放、合作的政府,要求各联邦机构尽量公布所有数据,加强政府工作的透明度。这是美国政府将大数据提升到国家层面的第一步,之后几乎每年美国联邦政府都会采取一系列的措施不断深入研究大数据,将大数据作为一项极其重要的资源进行开发利用。2013年年初,英国政府也逐渐开始颁布一系列的政策支持大数据的采集与研究,并为其提供雄厚的资金支持。中国政府对大数据的研究与应用开发也予以了足够重视。2014年3月,“大数据”首次被写入《政府工作报告》,与新一代移动通信、集成电路、新能源等处于同一水平层次,表明大数据对于设立新兴产业创新创业平台、引领未来产业发展的支撑作用。2015年10月,党的十八届五中全会正式提出要实施“国家大数据战略”,这表明中国已将大数据视作战略资源并上升为国家战略,将运用大数据推动经济发展、完善国家治理和社会治理,将提升政府服务和监管能力视为大数据发展的战略目标。2018年5月,习近平总书记在致中国国际大数据产业博览会的贺信中强调,“中国高度重视大数据发展”,“全面实施国家大数据战略”。[4]中国是世界上最大的互联网市场,大数据产业的发展日新月异,为深入了解大数据发展所带来的积极效应与消极效应,需进一步对大数据所具有的典型特征予以归纳与梳理。

二、大数据的特征

对于大数据的特征,目前学界主要有“3V”“4V”以及“5V”等说法,“3V”即指数据量大(volume)、数据种类多(variety)、数据处理快(velocity),[5]“4V”在“3V”的基础上增加了价值密度低(value)这一特征,[6]“5V”又添加了数据真实性(veracity)这一特征。[7]大数据为政府政策制定、企业商业决策提供了参考依据,随着时代的发展进步,大数据逐步显露出以下几个特征:第一,国家、企业、个人的数据处理能力显著提升。在未进入大数据时代之前,数据处理者对于数据的处理能力与处理效率均不高,而自进入大数据时代以来,无论是国家、企业还是个人的数据处理能力均有了显著提升,这是时代发展、技术发展的特征所在。第二,政府、企业、社会的数据整合的趋势愈发显著。在我国,政府是公共数据持有量最多的主体,同时以百度、阿里巴巴、腾讯为主的互联网企业收集和持有的用户个人信息量亦持续上升。但是,无论是政府数据还是企业数据抑或是社会数据,均日益呈现数据整合的趋势。第三,大数据技术的应用领域日趋广泛。随着大数据技术的不断升级完善,其应用领域亦不断扩散,大数据在智慧城市建设、医疗保健与公共卫生、体育赛事、安全执法、金融交易等领域均具有广阔的应用前景。第四,大数据应用相关领域的创新持续活跃。随着大数据时代的到来,新兴产业形态、新商业模式、新规则制度不断涌现,围绕大数据应用的相关市场不断释放出活力,个体创新性、创造性也被大大地激活。[8]

三、大数据的发展趋势

近年来,大数据的应用领域不断扩张,围绕大数据应用的创新活动持续活跃,大数据的发展已是社会发展进步之必然。通过对大数据时代近年来的发展及其现状的考察,笔者认为未来大数据将呈现出如下发展趋势:

(一)从数据资源化向数据资产化的转变

数据首先是作为一种资源而使用的,“数据资源化”是指,数据作为一种资源集合体,其巨大的价值被应用到企业发展的各个阶段,以帮助企业获取更大的经济收益。但是,随着大数据应用的不断扩张,以及相关公众对大数据认识的不断加深,数据已经从“资源”变成一种可以计量的“资产”。“数据资产”这一概念是由“信息资源”和“数据资源”概念逐渐演变而来的。[9]中国信通院在2017年发布了《数据资产管理实践白皮书》,其中将“数据资产”定义为“由企业拥有或者控制的,能够为企业带来未来经济利益的,以一定方式记录的数据资源”。这一概念强调了数据具备的“预期给会计主体带来经济利益”的资产特征。[10]从“数据资产”的定义可见,随着人们对数据价值认识的不断深化,数据所具有的资产属性日益突出,数据已不仅仅是一种资源、一种工具,而且更多是一种新的资产承载方式。然而,由于数据流动性强、数据价值因使用场景而异、数据交易市场不成熟以及监管措施不到位,数据资产化面临着数据确权难、估值难、变现难、风险高等困境。

(二)与云计算、人工智能技术深度融合

随着云计算和人工智能技术的发展,大数据作为云计算和人工智能技术的基础资源和资产,其价值将有更大的发挥空间。大数据与云计算、人工智能技术的紧密结合是时代发展的必然趋势,未来大数据与其余两种技术的融合度将会更高。自计算机诞生以来,信息技术潜移默化地影响着人类生活的方方面面。尤其是近十余年来,大数据、人工智能、云计算等技术蓬勃发展,人们的生活方式每隔几年就产生天翻地覆的改变。从大数据的汇聚、分布式技术释放计算能力开始,随着技术的不断延伸发展,大数据、人工智能与云计算技术不断交叉融合,三类技术的互相影响与交融推动着大数据2.0时代向大数据3.0时代的变革,为更多行业、产业发展赋能。[11]由此可见,与云计算、人工智能技术的深度融合是大数据时代发展的趋势所在,亦是当今社会科技发展的新态势、新方向。

(三)有待突破科学理论以形成数据科学

所谓“数据科学”是指,对数据本身的特征、规律等进行研究,以及利用数据方法对自然科学和社会科学进行研究的一门科学。[12]随着社会上各种主体对大数据的研究愈发深入,大数据在技术层面上的价值会日益凸显,而这种价值可能引起科学理论的突破。而随着大数据技术的日益成熟,它不断被应用于自然科学与社会科学的研究中。近年来,有学者开展了大数据领域的多学科交叉及其应用研究。[13]例如,通过将社会科学与大数据结合,对大数据发展过程中产生的社会问题展开研究。李国杰、程学旗对大数据的研究现状与意义、大数据应用与研究所面临的挑战与问题进行了综述性的研究与讨论,并就大数据的发展战略提出了建议。[14]孟小峰、慈祥通过对大数据基本概念、基本框架、关键技术等方面的分析,总结出大数据发展可能带来大数据隐私、大数据能耗、大数据管理易用性等问题。[15]目前,学界除了针对数据收集、传输、存储与处理技术以及其基础设施建设进行研究之外,也有一些学者开始研究各个领域的应用大数据科学理论。同时,随着大数据理论研究的不断深入,未来将很大可能出现理论的创新和突破。同时,当数据与社会相互影响、相互作用达到一定程度时,数据将可能如数学、物理学一样在可预计的未来形成完整的体系,成为独立而又与其他学科相互联系的科学,可以称为“数据科学”。

(四)应用场景持续扩大

大数据技术随着通信基础设施的提升而持续发展,围绕大数据的应用场景也随之不断增加。在技术方面,我们目前仍然处在“数据大爆发”的初期,5G、工业互联网的深入发展将会带来更大的“数据洪流”,会给大数据的存储、分析、管理带来更多挑战,但与此同时也会推动大数据技术登上新的台阶。硬件与软件的融合、数据与智能的融合将带动大数据技术向异构多模、超大容量、超低时延等方向拓展。在应用方面,大数据行业应用正在从消费端向生产端延伸,从感知型应用向预测型、决策型应用发展。当前,互联网行业已经全面进入“数据技术时代”。未来几年,随着各地政务大数据平台和大型企业数据中心的建成,将促进政务、民生与实体经济领域的大数据应用再上新的台阶。[16]

(五)数据安全合规要求不断提升

大数据技术给违法和犯罪提供了便利。近年来,大数据安全事件频发。比如,2016年9月雅虎遭黑客攻击10亿用户账户信息泄露事件,2017年5月全球范围遭受勒索软件攻击事件,2020年2月员工因个人原因破坏数据库致微盟“宕机”36小时事件[17]等。屡见不鲜的大数据安全事件给公众人身、财产造成了难以估量的损失。为了保障数据安全性,需要国家有关部门更加严格地对相关数据进行法律监管,并不断完善数据安全标准规范体系。近年来,我国陆续发布一系列聚焦数据安全的国家标准,包括《大数据服务安全能力要求》(GB/T 35274-2017)、《大数据安全管理指南》(GB/T 37973-2019)、《数据安全能力成熟度模型》(GB/T 37988-2019)、《数据交易服务安全要求》(GB/T 37932-2019)等,这些标准对于我国数据安全的合规审查起到了重要的指导作用。