人脸识别60年︱沈茂祯:新加坡“刷脸时代”背后的隐忧

澎湃新闻记者 李麑
2020-11-24 15:59
来源:澎湃新闻

制图:冯婧

作为“智慧城市”和“智慧国家”理念的推动者,新加坡已经提前进入“刷脸时代”。

2017年10月投入使用的樟宜机场第四航站楼,从托运、通关到登机均使用了人脸识别技术。

2018年,新加坡政府科技局GovTech推出了一个名为“智慧路灯”(Lamppost-as-a-Platform)的计划,力图将境内9.5万根传统灯柱改造为复合型平台,配备传感器、人脸识别摄像头,希望推动城市规划和交通规划革新。

2020年7月,新加坡政府宣布,将人脸信息纳入电子国民身份系统SingPass,新加坡居民可以“刷脸”使用400多种数字服务,包括申报税收和申请公屋。

但“刷脸时代”仍存在隐忧,新加坡国立大学计算机学院副教授沈茂祯(Terence Sim)在接受澎湃新闻(www.thepaper.cn)专访时表示,人脸识别技术有被滥用的趋势,而相关法律保护仍待健全。

一位用户刷脸登录电子国民身份系统SingPass。图片来源:新加坡政府科技局GovTech官网

澎湃新闻:您曾经提及,自己是在1998年入行的,二十多年前,人脸识别技术的开发者们关注的是什么?

沈茂祯:上世纪末,技术没有成熟,也尚未被应用。学界聚焦在技术问题本身,怎么才能提高人脸识别的准确性。

回过头看很难想象,当时的电脑功能不够强大,不同于今天,机器学习也没有足够多的数据去训练。1998年我刚进入卡内基梅隆大学读博士,大约2000年,我参与了一个名为CMU-PIE的数据集计划(编者注:CMU为卡内基梅隆大学简称,PIE的全称为Pose Illumination and Expression,意为姿势、照明和表情。该数据集为68个人拍摄了4万多张人脸照片,每个人包括13种不同姿势、43种不同光线和4种不同表情),最终形成了一个45GB的数据集,那已经是当时世界上最大的人脸数据集了。

卡内基梅隆大学的3D室,测试者坐在椅子上,13台Sony DXC9000摄像头将从不同角度拍摄测试者的面部。通过这套装置,收集了4万多张人脸照片,形成了CMU-PIE数据集。图片来源:沈茂祯等人于2003年发表的论文。

当时大家的“终极梦想”是,这项技术能够成立,最终能实现商业化。从技术开发者的角度,我很高兴看到今天人脸识别技术有了多样化的应用。

澎湃新闻:最初有人关注技术应用的伦理问题吗?

沈茂祯:最初并没有,人们更多聚焦在技术本身。学界开始讨论隐私问题比较晚,大约在2005至2006年左右。

2008年,我专门写了一篇论文,讨论生物识别技术应用中的隐私问题,之后被收录在《生物特征识别百科全书》(Encyclopedia of Biometrics)中。当时我总结了几种数据隐私可能被侵犯的方式:非必要的数据收集、未授权的信息收集、数据泄露,以及违反“目的限定原则”的数据挪用。

比如,保护隐私不能靠“事后补救”,而应该在最初设计人脸识别系统时就考虑好。数据的存储是否安全?用完后,能否做到“限期删除”?出于A目的收集来的信息,会不会在未告知相关个人的情况下挪用于B目的上?

很遗憾,十多年后,很多问题仍未得到解决,而一些担忧却成真了。

2009年出版的Encyclopedia of Biometrics,图为2015年出版的第二版。图片来源:Springer

澎湃新闻:作为“智慧城市”及“智慧国家”的推动者,新加坡不断推广着新技术的应用。先是2018年的“智慧路灯”(Lamppost-as-a-Platform,LaaP)计划,今年又宣布将人脸信息纳入电子国民身份证SingPass。对于“刷脸时代”,新加坡民众有哪些讨论?

沈茂祯:在新加坡,对于隐私等问题的讨论也出现得比较晚。2008年后开始有讨论,经过数轮的意见征询,新加坡政府于2012年通过了《个人资料保护法例》(Personal Data Protection Act,PDPA),保护个人数据安全。

智慧路灯(LaaP)计划是在路灯柱上安装传感器、摄像头等设备,它可以监测空气质量及交通流量,了解停车位余量,收集行人数据,该计划希望为城市规划和交通规划提供参考(编者注:LaaP计划于2022年前更新新加坡境内的9.5万个路灯。新加坡政府科技局GovTech发言人曾在给路透社的电子邮件中表示,发生恐怖袭击事件时,智慧路灯也可以对人群进行分析并支持后续调查 )。类似的智慧路灯计划也出现在欧美,人们对此评价不一。

奇怪的是,2018年新加坡启动试点后,几乎没听到什么后续讨论,大家似乎并不关心自己的脸被路灯拍到。实际上,新加坡人关注数据隐私,比如自己的医疗信息、金融数据,但尚未关注人脸信息的重要性。我能想到的原因有二,一是人们渐渐习惯了摄像头的存在,商场门口、楼宇的出入口,到处都有,二是有了PDPA的保护,人们觉得“没什么好担心的”。

但果真如此吗?

智慧路灯计划。图片来源:新加坡政府科技局GovTech官网

澎湃新闻:为了确保数据隐私及安全,新加坡官方做出了哪些努力?比如新冠疫情期间,新加坡推出的接触者追踪应用程序TraceTogether,为鼓励更多人使用这款应用程序,它特别强调,蓝牙数据会在25天后自动删除。 

沈茂祯:没错。TraceTogether之外,为了覆盖那些没有智能设备或不熟悉使用智能设备的人群(比如老年人),新加坡政府推出了Token,一个类似Airpods的小型设备。

新加坡政府于2020年3月推出了接触者追踪应用程序TraceTogether,6月又推出了一款内置蓝牙的微型设备,首批发放对象为65岁以上老年人。图片来源 TraceTogether官网

2020年6月19日,新加坡政府科技局举办了一场“破解”Token的大会,邀请四位业界专家拆解Token设备,受邀者包括硬件黑客、固件开发者、隐私专家及开源软件开发者。图片来源:新加坡政府科技局官网

为了验证Token的安全性,政府专门邀请了一批“黑客”,尝试去破解Token,看它是否如其所言,只使用了蓝牙技术,而没有偷偷加入GPS、Wi-Fi等其他功能,也测试它是否安全。引入第三方,这非常重要,“你不需要相信我,你可以相信专业人士的意见”。

值得注意的还有Token的数据存储方式,它并不会自动上传你的个人信息,只存在Token设备内。只有当持有者确诊新冠时,才需要上交Token设备给医务人员,进行后续的接触者追踪。在这里,个人数据并非目的,追踪接触者进行防疫,这才是目的。(编者注:纽约大学AI Now研究中心全球战略及项目总监Amba Kak在接受澎湃新闻专访时也提到一个类似的案例,国际红十字会在分配人道主义救援时使用了生物识别技术,但决定放弃建立一个中心化的生物特征数据库。)

澎湃新闻:您曾对两个不同概念“身份验证”(Proof of Identity)和“使用凭证”(Proof of Authorization or Credentials)作出区分,大部分情况下,人们并不需要实名制的身份验证,人脸识别这项技术有被滥用的趋势吗?

沈茂祯:当我们使用生物特征信息进行身份验证时,我们所做的是确认你的身份,它需要我们提供高级别的个人数据,系统也需要保证高级别的安全性。

但通常情况下,当我们去电影院、动物园、演唱会,需要出示的是门票,也就是使用凭证,付费购买了门票就可以进入,并不需要实名制。对方需要的也只是这个使用凭证,无权获得额外信息。当然,有时你需要提供身份证,证明自己已经成年了,可以看分级电影,或者购买酒精。

二者之外,还有另一个相关的概念是Proof of Presence——不仅需要确保是本人,本人还需要在场,比如选举投票或结婚时,不可以假以他人。

我们需要区分这些概念,警惕技术的滥用。2016年,新加坡曾考虑在地铁闸口使用人脸识别技术,以提高乘客通过效率,这非常糟糕。搭乘地铁,有使用凭证就足够了,无论是单次的地铁车票,还是储值卡,并不需要实名制。

澎湃新闻:但新冠疫情会让这些边界变得模糊吗?以中国为例,出于防疫需要,如今人们搭乘公共交通、游览景点,都需要扫码登记。

沈茂祯:传染病大流行是特殊情况,我想类似的特殊状况还有恐怖袭击——遭遇恐怖事件时,出于安保需要,政府总是希望能够知道所有人的行踪。但有一个关键问题需要我们追问,等到事件平息后,个人数据会被删除吗?

即便没有新冠疫情,我们也能看到这种危险趋势,相较于简单的使用凭证,越来越多商家和机构开始要求提供生物特征数据进行身份验证,这种滥用真的必要吗?(编者注:2019年,瑞典数据监管委员会The Swedish Data Inspection Authority对当地一所高中开出了第一张基于欧盟《通用数据保护条例》(GDPR)的罚单,认为该校使用人脸识别系统记录学生出勤率违背了GDPR规定,违背了收集数据的“必要性”原则。)

澎湃新闻:这是否对数据安全提出了新要求?政府、企业和个人可以做些什么?

沈茂祯:政府需要先制定更完善的法律去保护个人隐私,确保个人的生物信息不被滥用。而科技公司也需要确保这些信息不容易被人盗取。

我认为,人们不能盲目假定法律可以保护一切,我们可以对政府、商家提出要求,明确哪些应该是禁区。在生物识别应用不断扩张的同时,需要留有传统的身份验证方式。

供应商往往会声称他们的算法准确性极高,但谁能验证供应商的自说自话?可以有行业审查,比如每年、每两年进行评测、审查。

前面提到的第三方也很关键,第三方可以独立于政府和技术供应商之外,相较于普通民众,他们了解技术,也了解法律,理想状况下,我们需要有“看门狗”(watchdog)这样的机制。

制图:白浪

 

    责任编辑:冯婧
    校对:施鋆