星期五 , 11月 15 2024
首页 / 人工智能 / AI / 数据治理:自动驾驶汽车上路必备

数据治理:自动驾驶汽车上路必备

万物互联时代,随着智能技术的广泛应用,驾驶私家车出行在带给我们享受与便利的同时,似乎也更多地剥夺了我们的“私密”:车子的行程被追踪,车里的私聊被“偷听”,车上的一举一动被“监视”。开车的时候如何保护个人信息,成为大多数消费者的关注点。

不过,在《互联网法律评论》特约专家、上海交通大学凯原法学院郑戈教授看来,自动驾驶汽车为实现其功能,采集处理的大量数据并不属于个人敏感信息,甚至不属于个人信息。自动驾驶汽车要实现安全性、可靠性和高性能,不仅需要获取大量数据,而且需要数据的开放共享。因此,数据法治是自动驾驶汽车上路的先决条件。

一、问题的提出:自动驾驶中的个人隐私与数据共享

在我们身处的这个万物联网的“智能化时代”,政府和平台企业通过各种传感器收集着与个人相关的信息,大多数搜集个人信息的传感器都以丝毫不引人注目的形态镶嵌在我们日常生活的纹理中。

但自动驾驶汽车不同,每一部自动驾驶汽车都装备着许多非常醒目的传感器。一部肉眼可见长满“眼睛”的汽车,必然引起人们对隐私和个人信息保护问题的担忧。

完善自动驾驶汽车相关的隐私和个人信息保护立法是更多人愿意接受这一新事物的前提条件之一。另外,自动驾驶汽车的安全性、可靠性和高性能的实现不仅需要获取大量数据,而且需要数据的开放共享。数据法治是自动驾驶汽车上路的先决条件。

本文试图提议一种国家战略化、过程化、功能化和层次化的车辆数据治理方案,以平衡鼓励创新、推进交通强国事业与保护公民隐私权和个人信息权益之间的关系。

二、国家战略化的未来交通数据法治建设思路

所谓“国家战略化”,就是从本国在全球市场中的比较优势出发,制定相应的产业政策和法律,用法律来引领技术发展的方向,并强化这种比较优势。

1. 中国的比较优势——网络通信基础设施及网约车的普及

我国发展自动驾驶汽车技术和相关产业方面的比较优势在于网络通信基础设施(包括5G通信网络)或者更广泛意义上的数字基础设施,以及网约车出行模式的普及等,因此选择网联化发展道路是必然的。

实际上,我国现有的涉及自动驾驶汽车的规范性文件在标题中用到的概念都是“智能网联汽车”,如《智能网联汽车道路测试与示范应用管理规范(试行)》(以下简称《测试规范》)和《深圳经济特区智能网联汽车管理条例(征求意见稿)》。但在具体的规范内容上,它们却未能针对“智能网联”这一特征而确立相对完善的数据处理相关规则。

2. 德国及英国经验——交通立法顶层设计

虽然我国已经有比较完备的网络安全、数据安全和个人信息保护方面的法律规范体系,而且其中有专门针对车辆数据的《汽车数据安全管理若干规定(试行)》(以下简称《汽车数据规定》),但这些规范显然没有将自动驾驶汽车考虑在内,主要原因恐怕是缺乏国家战略层面的交通立法顶层设计。在这个方面,德国经验颇有参考价值。

2017年8月,德国议会通过《设立机动车道路和其他联邦公路基础设施公司的法律》,创设了一家基础设施公司,联邦交通和数字基础设施部将自己承担的对联邦道路进行规划、建设、运营、维护、出资和资产管理的联邦任务委托给这家私法上的公司(即公司化运营的国有企业)

2021年7月,德国联邦议会通过《修订道路交通法和强制保险法的法律——自动驾驶法》(以下简称《德国自动驾驶法》),其中有专节规范数据处理(§1g),而这个部分的第一条就要求,具备自动驾驶功能的汽车的所有权人保存汽车的状态数据和行驶数据,并传送给交通基础设施公司。

相较之下,我国的自动驾驶相关立法缺乏以数字基础设施为着力点的通盘设计。

《深圳条例》虽然是一部正在起草中的地方性法规,但其中第6条规定的多头监管格局反映出全国的普遍情况,即主管机关的多元化。该条规定中虽然有众多的管理部门,却没有哪个部门负责智能网联汽车和智慧交通数字基础设施的建设。

考虑到我国交通运输、网络基础设施、网络安全、道路交通秩序等分属不同部门管理的现实,即便无法参考德国模式,由一个部门和一家基础设施公司来搭建自动驾驶汽车公共数据平台,至少可以参考英国模式:英国交通部和商务、能源与产业战略部于2015年合作成立跨部门的网联与自动驾驶汽车中心,负责统筹实施英国的“未来交通战略”,包括统筹和协调相关数据共享安排。

三、过程化的自动驾驶汽车数据法治道路

所谓“过程化”,就是分步走,循序渐进地推进自动驾驶汽车从驾驶辅助到完全自动驾驶的产业化进程,在道路测试和试运行阶段,要求更全面的数据采集和更高程度的数据开放共享,而在正式运行阶段,则逐渐限缩数据采集范围和开放共享程度,逐渐厘清自动驾驶汽车的安全运行所需要的数据类型和数据范围,从而将其有效控制在“最小必要”原则所要求的程度之内。

实际上,这也是我国目前正在采取的方案,只是由于思路没有理清,所以把很多自动驾驶汽车全面正式上路后才需要落实的规则搬到了道路测试和试运行阶段,混淆了“试验”鼓励创新的目的与日常状态下维护秩序和保护个人权益的目的

当我们适用《个人信息保护法》中的最小必要原则时,假定我们知道提供某种产品或服务时哪些数据是必要的。但对于采用新技术的产品和服务,整个社会其实并不具备这方面的知识或共识。在自动驾驶的试运行阶段,数据冗余是实现安全驾驶的前提条件,从技术上讲,我们很难判断获取多少数据是“必要的”。

当然,在这个阶段也不能绕开《个人信息保护法》规定的“知情—同意”规则,运营商可以在一份提供给用户的手册或知情同意书中列明所要采集的个人信息,让人们在知情的前提下选择进入(opt-in),而不是让人们自己发现问题并选择退出(opt-out)。不过,在手册或知情同意书中应当解释,车辆采集的大部分数据与个人信息无关,例如,车辆标识、车辆控制模式、位置信息、路况信息等,避免造成不必要的担忧。

为了在不牺牲车辆安全性能的情况下,避免个人信息被不合理的利用,可以考虑数据的传输方式和使用方式等数据流管理方案,而不是目前《个人信息保护法》框架下的采集端管理方式。

对数据采集方式的控制适合身份信息保护,但不适合行为数据保护,自动驾驶汽车涉及的数据大部分是行为数据,目前我国的数据治理相关立法采取的却是身份数据保护的思路,因此难以适应自动驾驶汽车的应用场景。

四、功能主义的数据治理

所谓“功能化”,就是区分自动驾驶技术所实现的不同功能,例如,公共交通、共享出行和私家车,根据使用不同功能的用户的隐私预期和安全需要,确定数据获取和数据处理的范围。

例如,对私家车而言,每天的乘客比较固定,为避免每次上车都调整座椅位置,使整个车内空间实现为车内每一个乘客“量身定制”,这显然是大多数人都想具备的功能。为实现这一功能,获取体型数据并关联于特定个人显然是必需的。

对自动驾驶的公交车而言,一方面,大概率不会有采集乘客体型信息的传感器;另一方面,每一位乘客的体型都是其他乘客肉眼可见的,算不得什么隐私或个人敏感信息。

表1  自动驾驶汽车采集和处理的数据类型

从表1可以看出,为实现自动驾驶功能而采集的数据大多数是与个人信息无关的车辆状态和行为数据以及环境数据。涉及个人信息的数据是为了实现与基本自动驾驶功能无关的特定功能,如电子召唤(在发生事故或突发疾病的情况下召唤医生或救护车)、远程云代驾(系统自动送乘客到特定地址)或车上娱乐功能,为实现这些功能而采集个人信息需要单独征得乘客同意。

目前,无论是用人格权保护模式(《民法典》和《个人信息保护法》均采用这种模式)还是财产权保护模式(《上海市数据条例》和《深圳经济特区数据条例》有这方面的尝试)都只涉及数据处理中的纵向关系,即数据处理者与数据主体之间的关系

但数字技术最广泛的使用方式是,通过从无数个数据主体那里获取数据,得出适用于一定范围人口的行为规律或模式。换句话说,数据处理者从乘客甲乙丙丁那里获取数据,并不是为了针对甲乙丙丁做些什么,而是为了找出他们的行为规律,从而针对与他们属于同一群体的一群人提供服务,这个群体中包括其个人信息未被采集的张三、李四(见图1)

图1 自动驾驶汽车中的数据法律关系

数据处理者从特定车辆获得传感器采集到的数据,进而训练算法、优化程序,从而使自动驾驶系统能够在更复杂的环境和路况下安全高效地行驶。这种横向关系是一种无法被吸收进现有法律关系的外部性,需要公权力介入来加以规制,以避免有损公共利益、个人权利和平等、正义等社会基础价值的事情发生。

因此,从功能主义的视角出发,我们应当考虑自动驾驶汽车采集和处理数据所要实现的功能。对于专门针对个人的功能,例如,调整座椅舒适度,如果实现这种功能需要采集个人信息,则需要满足知情同意、最少必要等《个人信息保护法》中的规则。对于不专门针对个人的功能,例如,优化算法、找出路况规律等,一般情况下无须采集个人信息,而需要采集大量车辆、路况和环境信息,这时主要适用的是公法规则,包括网络安全和数据安全规则,也包括确保智能交通系统公平、普惠地造福于全体国民的宪法原则。

五、分层次的数据治理

所谓“层次化”,是一种规则多元主义的体现,便民、环保、高效、安全的智能交通不能仅靠国家正式制定的法律法规来维护,还需要产品标准、行业标准和社会规范的合力支撑。尤其是在“算力即权力”的即成社会事实之中,政府对算法主导的产品、服务和商业模式已经无法独自实现有效监管和执法,因此更要依靠行业和社会的配合。

自动驾驶汽车涉及网络安全和数据安全问题,受《网络安全法》和《数据安全法》的约束。其处理的数据如果涉及个人信息,也受《个人信息保护法》的约束。

我国在这两个领域已经有较为完备的法律、法规体系。需要加强的是促进交通数据基础设施建设和推动数据共享的立法工作。同时,行业标准的制定虽然已经取得阶段性成果,但仍需进一步推进。

(一)车辆数据安全保障法治

网络数据安全立法是我国数字时代立法中最成熟、最完备、最系统的门类,从《网络安全法》和《数据安全法》等法律,到《关键信息基础设施保护条例》等行政法规,再到《网络安全审查办法》等部门规章,以及正在制定的《数据出境安全评估办法》等,已经形成完整的网络数据安全保障法律体系。

法律文本中虽然未对“关键信息基础设施”作出明确定义,但《关键信息基础设施确定指南(试行)》(以下简称《指南》)填补了这个空白。按照《指南》的定义,以及提出的按关键行业、关键业务、关键设备来界定范围的方法,自动驾驶汽车涉及的数据处理中心、车路协同系统、智能交通系统等显然属于关键信息基础设施,受到最严格的安全监管,相关运营者承担着维护网络和数据安全的严格法定义务。

对个人权益的损害往往是系统漏洞和数据泄露造成的,而不是正常使用造成的,属于技术安全问题,很难用个人权利保护的方式来解决。在这种环境中,对个人信息的最有效保护不是在采集端,而是在使用端,因此安全与权利已经变得密不可分,维护数据安全已经不单是为了维护国家的管理秩序和公共利益,而且也是为了保护个人权益。

正因如此,我们看到我国的个人信息保护条款最早出现在《网络安全法》中。在我国的网络和数据安全法体系中,“大量个人信息”在我国的数据分级分类体系中属于“重要数据”,与涉及国家安全的核心数据和重要数据同样受到严格保护,例如,2022年2月15日起实施的修订后的《网络安全审查办法》第7条规定:“掌握超过100万用户个人信息的网络平台运营者赴国外上市,必须向网络安全审查办公室申报网络安全审查。”

(二)车辆数据处理中的个人信息保护法治

《民法典》中的隐私权和个人信息保护条款,以及《个人信息保护法》显然适用于自动驾驶汽车数据问题。《汽车数据规定》中的很多条款是将《个人信息保护法》的基本原则适用于汽车数据处理。

但自动驾驶汽车为实现其功能而需要收集和处理的个人敏感信息非常有限而且可控,其所处理的大量数据不属于个人敏感信息,甚至不属于个人信息。虽然这些信息如果被算法加以关联和整合,或许可以指向已识别或可识别的个人,但这种操作需要有接入权的人或黑客才能实现,属于极小概率事件。对于小概率事件,适合采用损害救济而非预先防控的法律手段来应对。

然而,《汽车数据规定》恰恰采取了预先防控的方式,使得相关规定很难适用于自动驾驶汽车,尤其是智能网联汽车(但从规范意义上讲,又不得不适用)。例如,第6条规定的车内处理原则(除非确有必要,不向车外提供)和默认不收集原则(除非驾驶人自主设定,每次驾驶时默认设定为不收集状态)

我国自动驾驶汽车技术发展的主导方向是智能网联汽车,前述《测试规范》和《深圳条例》等已经出台或正在制定的部门规章和地方性法规都以“智能网联汽车”为标题,而智能网联汽车的基本特征就是车联网,数据在车外处理。《汽车数据规定》第6条的内容显然无法与国家政策和智能网联汽车相关法规有效衔接。

(三)交通数据基础设施建设与数据开放共享法治

如前所述,促进数据开放共享的法律制度是我国自动驾驶汽车和智能交通相关法治建设的短板。在数字经济的其他领域,私人企业出于追求利润的目的,打造了巨型数据平台,而后政府依托这些平台来提供公共服务,例如,对防疫起到关键作用的健康码和行程码就分别依托阿里的支付宝平台和腾讯的微信平台。这种模式虽然是既定事实,但并不合理,而且会给政府履行对公民的保护义务,以及对平台企业进行规制和监管造成困难。

在自动驾驶领域,类似的趋势正在形成,但通过法治化手段来扭转这一趋势的契机尚未消失,因为自动驾驶汽车毕竟还没有大规模量产和普及。

在自动驾驶领域,百度目前是数据基础设施的主要营造者。如果百度的整个未来交通布局在未来都变成现实,就像阿里和腾讯对网购、在线支付和社交媒体的垄断已经变成事实那样,作为国有资产的道路和作为公共事业的交通就不复存在。

作为基本公共服务,交通事业可以借助私人企业的力量,但政府必须保持作为主要服务提供者和监管者的角色和相应的能力。在“算力即权力”的数字社会现实中,打造政府主导的车辆和交通数据平台是保持这种角色和能力的前提条件。只有这样,政府才能成为车辆和交通数据的“看门人”,解决私人企业作为数据看门人很难解决的不正当竞争、交互可操作性缺失、创新激励递减等难题。

(四)行业标准

如前所述,自动驾驶汽车实现其功能所需的数据类型和数据量是一个专业判断的问题,而体现行业共识的行业标准是未来交通法治轨道的枕木和基石。

《深圳条例》第15条和第16条分别规定了地方标准和“团体标准”的制定机制,确定工信部门作为制定地方标准的部门,市场监管部门作为批准、发布地方标准的部门。部门标准则由企业、机构、院校的专业人员制定,报工信部门备案,并向社会发布。

在全国范围内,中国汽车工业协会制定的《智能网联汽车数据格式与定义》、中国汽车工程学会制定的《智能网联汽车场景数据图像标注要求与方法》和《智能网联汽车激光雷达点云数据标注要求及方法》等已先后发布。

六、结论

对自动驾驶汽车来说,前方的道路是用数据铺成的。智能网联汽车是我国自动驾驶技术研发和应用的主要方向,这种汽车形成的车联网将成为物联网的重要组成部分。

在未来交通图景中,物理空间的交通信息与数字化信息变得密不可分,数据法治也应当成为交通法治的重要组成部分。

我国目前虽然已经形成日渐完备的数据相关立法和交通相关立法,但两者之间的关联性较弱,缺乏有针对性的、兼顾创新需求和权利保护的交通数据立法,尤其缺乏促进车辆、道路和交通运营数据开放共享的立法。只有数据法治和交通法治双管齐下和水乳交融,才能为未来交通铺平法治化的道路。

关于 吉运好熊

吉运好熊
清华计算机系

检查

Scaling Law终结,量化也不管用,AI大佬都在审视这篇论文

几十万人关注,一发表即被行业大 …

发表评论

邮箱地址不会被公开。 必填项已用*标注