人脸识别60年︱法律能保护人们的“脸”吗？

Amba Kak 相欣奕译

2020-12-03 13:15

来源：澎湃新闻

人们对“脸”的焦虑或许来自近些年，随着技术应用的不断扩张，人们担心隐秘处藏着的摄像头，也担心另一端不知名的数据处理者——谁有权获取我的脸部信息？系统的识别准确率高吗？“它”对“我”的判断是否公允？

早在1973年，瑞典就推出了首个《数据法》，如今全球约有130多个国家出台了数据保护相关的法律。但它们的效力如何？能够保护我们的“脸”吗？

今年9月，纽约大学AI Now研究中心发布了一份报告“Regulating Biometrics: Global Approaches and Urgent Questions”（生物识别技术监管：全球举措及关键问题），评估了各国法律的效力。

经授权，澎湃新闻市政厅将翻译该报告的部分章节，呈现来自全球的不同思考、疑虑与行动。本文来自该报告的第一章的前半部分，不久前我们采访了本章的作者安巴·卡克（Amba Kak）。

脸识别技术也被应用于校园，2019年瑞典对一所高中开出罚单，认为学校使用人脸识别技术进行考勤，违反了欧盟通用数据保护条例GDPR。图片来源：Getty

对生物识别系统的监管很大程度上是通过数据保护法实现的。生物识别数据通常被认定为高度敏感类别的个人数据，此类数据的收集、存储和公开需要受控于一系列限制条件。2016年通过的《欧盟通用数据保护条例》（General Data Protection law，GDPR)正是其中代表。现今已有140多个国家出台了数据保护法，覆盖了公私部门的数据使用。与欧盟不同，美国缺乏类似GDPR的综合性联邦数据隐私法规，但一些州法律沿用类似的方式对生物识别数据进行监管，如2018年出台的《伊利诺伊州生物识别信息隐私法》（Illinois Biometric Information Privacy Act，BIPA）。

一些国家正在将生物识别数据纳入公民身份系统建设，也沿用了类似的数据保护方法。例如印度2016年通过的《阿德哈尔法案》（Aadhaar Act），澳大利亚2019年通过的《身份服务匹配法案》（Identity Services Matching Bill），肯尼亚2019通过的《服务编号法案》（Huduma Namba bill）。报告第一章的第1部分审视了这些监管生物识别信息的法律法规，它们在实施过程中已经暴露出一些关键问题。

数据保护法的出台，促使政府和企业在个人数据的收集、保存和使用方式上有了根本性改变，但它们在应对新形式的数据驱动技术时存在局限性，比如生物识别和分析技术。

现有的数据保护法聚焦于对个人的危害（而非群体），未能有效解决数据歧视和算法画像等问题。此外，将数据作为监管对象，往往掩盖了这些系统和平台在实际运行时对全社会带来的更为深广的挑战，技术不透明，削弱了已有的权责关系、异见表达和民主决策方式。

一些国家出台了一系列法案（主要是在美国），禁止在特定领域、特定用途或特定时段使用某些系统，直到更具参与性和协商性的决策方式出现。此外，还出现了若干专门针对特定部门的法规，关注刑事司法、雇佣或教育领域中生物识别数据滥用的危害。报告第一章的第2和第3部分追溯了这些新显现的问题及法律手段和方法。

以下是本辑汇编所提出问题的摘要，列明了所需开展的研究、实施的监管和组织的社区参与，希望为政策制定者和行动者提供借鉴：

1. 数据保护法的效力

• 法规如何定义“生物特征数据”?

• 为何数据保护法无法阻挡公共部门推进生物识别监控的基础设施建设？

• 面对生物识别系统，“告知”和“同意”有效吗？现有的数据保护法大多基于用户同意，它存在哪些局限性？还有哪些补充或替代方式？

2. 隐私之外：准确性、数据歧视、人为审查和正当程序

• 监管应如何确保生物识别技术的准确性和非歧视性？

• 技术标准制定机构给出的准入指标在多大程度上具有参考性？

• 对生物识别系统进行“人工审查”有效吗？如何才能为监督和问责提供保障？

• 从使用目的上看，生物识别技术应用于“识别”（identification）和“验证”（verification）具有不同风险，监管法规是否应该做出区分？

• 对于用于身份验证的人脸识别技术，监管较为宽松，这存在哪些潜在风险？

• 执法部门使用生物识别技术，需要哪些正当程序？

• 除了验证身份，生物识别数据还会被用于哪些其他目的，例如识别或推测人的情绪状态、人格特质或人口统计学特征？现有的生物识别信息法规如何涵盖这些使用场景和使用方式？

• 越来越多证据表明其危害，是否应允许技术的无限扩张？

3. 新兴的监管工具和执行机制

• 近些年，美国通过了哪些不同类型的“禁令”和暂停令？

• 如何对暂停条件加以强化，以确保最终的立法或审议程序稳定可靠？

• 现有的禁令主要针对公共部门，这会对生物识别系统的私人开发与生产造成哪些影响？

• 哪些监管工具可以提高生物识别的技术开发、采购和使用等方面的公众透明度？

• 社区（community-led advocacy）可以如何参与监管法规的制定？

欧盟的《通用数据保护条例》GDPR被称为“史上最严数据保护法”，但一些批评认为，它仍存在一定局限性。图片来源：Wikimedia Commons

法规如何定义“生物特征数据”?

在定义生物特征数据和系统时，法律还反映出人们对生物特征识别技术稳定性和准确性的认知。例如，GDPR定义的生物特征数据是“允许或确认自然人唯一身份的”身体、生理和行为数据，而伊利诺伊州BIPA则给出了一整套可算作生物特征数据的标识符列表，它们可以“用于识别个人身份”。

这些法律基于一种假定，即生物特征数据可作为个人身份的唯一识别方式，但近些年这一假定本身面临巨大争议。

研究表明，面对老年人、有色人种、体力劳动者、非英语母语者或其他人口统计学上的少数派，生物识别的准确率较低。但法规未能触及这些问题，仍然假定识别的准确性和平等性无误。

在数据保护法中，符合“生物特征数据”或“生物特征信息”的定义，这是启用法律保护的前提条件，它还决定了在哪个阶段（比如信息采集、处理、存储和使用阶段）实施保护。诸如GDPR等更宽泛意义上的个人数据保护法会将生物识别数据与其他类型的个人数据区分开，以提供特殊或更严格的保护。此外还有专门针对生物识别数据的法律，比如BIPA。

一些政府正在将生物特征信息纳入数字公民身份ID，相较于常见的数据保护法，这些数字ID计划的相关法律还对生物特征数据的定义有所扩展，允许机构扩展其采集的生物识别信息的种类。肯尼亚法律草案和印度Aadhaar 法规都列出了在当前项目之下允许采集的一系列标识符，同时也允许政府在必要时采集其他类型的个人数据。

超越了传统对数据隐私和安全的讨论，法规开始关注更多问题，是否使用这些系统、如何使用，以及当系统出现故障时谁应承担责任，因而法律法规的关注焦点由“数据”转向了“系统”。比如，美国最近出台了一些限制性法令，管控对象是“人脸识别系统及服务”或“监控系统”，却未对生物识别做出任何界定。对这些术语的界定也暗含了其使用目的（例如监控、标识、验证或跟踪）。

人脸识别技术已被大规模应用于机场。图片来源：Wikimedia Commons

生物特征数据通常被定义为经技术界定的对身体特征的数字化表达，经处理可用于机器或算法分析。你可能听过一些术语，诸如“模板”（templates）、“几何图形”（geometry）等，在GDPR中，数据是指那些已经过“特定的技术处理”的信息。“模板”（templates）是算法处理的初级阶段，从图像或录音中提取出数据。现代机器学习系统不需要所有的数据，而是从声音或图像中提取有意义的部分，并与数据库中已有的“模板”进行比较。因而人脸照片并不属于BIPA和GDPR中所定义的生物特征数据（编者注：因为人脸照片是未经处理过的“原始”数据）。

然而，对生物识别数据的狭隘定义留下了一系列漏洞。Els Kindt在她所撰写的章节中解释了GDPR的局限性——将照片、录音或其他形式的所谓“原始”生物数据排除在外。她指出，尽管要求用户“同意”，但在数据收集和存储的最初阶段，“同意”已经形同虚设（比如，当你讲照片上传到社交网站上），执法机关在使用这部分数据时，同样享有“豁免权”，可以未经用户许可使用。

考虑到当前商业性和政府的生物识别系统已被大规模应用，把（原始的）人脸照片和录音排除在外也会造成麻烦。从网络上获取与人脸照片，并与姓名匹配，这是创建人脸-姓名数据库的常用方法。而这些数据库是私人公司所开发的先进的秘密监控工具的基础，这些开发计划往往秘密进行，缺少监管。类似的秘密监控活动也在针对录音信息展开。

2018年《加州消费者保护法》（California Consumer Protection Act，CCPA）对生物识别数据做出了不同的定义，或许可以弥补上述漏洞。CCPA的定义是，可从模板中提取标识符进行算法处理的“能力”（ability to extract an identifier template）。

制图：白浪

责任编辑：李麑

校对：丁晓