大数据黑洞:人工智能时代必须面对的数据风险

澎湃新闻记者 程千千
2019-08-22 15:46
来源:澎湃新闻

“您要买房吗”“您要贷款吗”“有个股票群您要不要加入”……每天,我们都可能会接到类似的骚扰电话,其中有些甚至能直接说出我们的姓名和家庭住址。而近些年各大平台用户数据泄露事件的发生,更使数据安全问题被提到重要位置。随着数据的应用范围越来越广,一些看似合法的数据交易其实潜藏着法律风险,而我们的数据竟也成为数据黑产链条上被觊觎的“肥肉”。从某种意义上说,数据是财富,但又不仅限于此。对于企业而言,数据问题甚至已成为攸关生死的事。

8月16日下午,第197期北大博雅讲坛“大数据黑洞:我们正在坠入的深渊”在上海志达书店举行。围绕大数据在应用过程中出现的多种风险,大数据的发展到底给我们的个人、社会和国家带来了什么影响,上海交通大学凯原法学院副教授、天册律师事务所资深顾问何渊为现场读者做了一场兼具深度与趣味的演讲,并带来了自己的新书《大数据战争》。
何渊在讲座现场 本文图均为志达书店提供
“人工智能”与“大数据”是近几年非常热门的概念。根据何渊的说法,“人工智能”等于“大数据”+“算法”。目前,我们遇到的人工智能方面的问题,都可以从大数据的处理和算法两个角度来讨论。算法主要涉及伦理问题,而大数据则主要涉及隐私和安全问题。

如今,越来越多的人意识到数据是一种财富。何渊解释说,这是因为4G、5G技术的出现,使高效、大量地处理数据成为可能,不断聚集的数据因此具有了财富价值,于是引起了人们的争抢,数据的风险也由此产生。

针对数据应用的法律风险,何渊着重从五个方面进行了分享。一是数据泄露。根据中国消费者协会2018年的调查报告,85.2%的人遇到过信息泄露的情况。通过一个手机号就能把个人的身份信息、财产状况查个遍,包括户籍、资产、开房记录、打车记录、通话记录、实时位置信息等。

何渊在讲座现场
数据泄露通常与数据黑产问题有关。《大数据战争》一书中提到了数据堂涉数据黑产交易案件,最后公司相关涉案人员被法院处以一年六个月到三年不等的刑期,并处罚金;另外,巧达科技案、瑞智华胜案都涉及非法窃取数据问题,尤其是后者所涉数据量高达30亿条,两起案件都仍在进一步处理中,后续会公布相关的惩处结果。
《大数据战争》

数据泄露问题在国外也时时发生。比如,英国航空公司就曾因50万客户数据泄露被处罚1.83亿英镑;万豪酒店数据泄露案导致其全球超5亿客户受影响,被英国信息专员办公室(ICO)处以1.24亿美元的罚款;Facebook数据泄露事件使多达8700万用户受影响,被美国联邦贸易委员会(FTC)罚款50亿美元。

二是隐私保护。关于隐私问题,《大数据战争》一书提到了两个案件,其一是中国被遗忘权第一案——任甲玉诉百度案。此案提出了一个问题,即我们能否要求互联网平台删除我们不希望被他人知道的过往信息。按照法院的说法,中国法律中并没有规定“被遗忘权”这种权利类型,要保护此类权利,必须证明利益是正当的,且保护是必要的;其二则是cookie隐私第一案——朱烨诉百度案。此案提出的问题是,我们能否阻止互联网公司搜集我们的信息用于其广告推广等经营事项。二审法院认为,百度进行了匿名化处理,相关信息不能识别个人,而只能识别到电脑,且其已经尽到显著提醒说明的义务,因而判朱烨败诉。

何渊认为,个人数据权至少包括两个方面:其一是数据人格权,包括知情同意权,数据修改、删除权,数据被遗忘权等;其二是数据财产权,包括数据采集权、数据可携权、数据使用权和数据收益权等。

三是伦理问题。何渊提到,网上的某些商家会把真假货掺在一起卖,如果你的购物数据中很少给中评、差评,很少退货,那么你收到假货的可能性就会增大。另外,一些航空公司、酒店代理商、电商平台会根据你以往的消费数据给你进行数据画像,然后提供一个你可以接受的价格,这就是所谓的“同房不同价”,涉及到了价格歧视问题。

四是数据竞争。因数据竞争问题,现实中一些企业已经发生过争端,例如《大数据战争》中详细分析的大众点评网诉百度案、新浪微博诉脉脉案。前者确立了爬虫规则,即你可以利用爬虫去爬取他人的数据,但你不能用爬取来的数据干与他人相同的事情,也就是不能与他人形成直接竞争;后者则确立了合法收集、使用个人信息数据方面的“三重授权原则”,即“用户授权”+“平台授权”+“用户授权”,其中第一个“用户授权”是用户同意平台(新浪微博)使用其数据,第二个“用户授权”是用户同意平台将其数据交给第三方(脉脉)使用。

五是国家能力。何渊指出,当一个企业过于庞大、拥有太多数据的时候,是存在比较大的风险的,且会影响到国家数据能力,因此国家数据能力是未来国家不可或缺的治理能力。在数据自由流动过程中,国家必须认真面对国家数据能力、数据垄断等棘手问题,着力避免出现互联网公司的数据技术能力替代国家的认证能力等窘迫状况。这就要求国家要加强对互联网公司的监管,但也不能破坏数据产业的发展,即要做到“数据流通和数据权利保护的平衡”。

针对上述风险,何渊指出,中国也在采取措施积极应对。比如全国人大常委会已经在着手制定《个人信息保护法》《数据安全法》,国家网信办也在制定数据安全方面的规章。现有的法律规范中,《最高人民法院、最高人民检察院关于办理侵犯公民个人信息刑事案件适用法律若干问题的解释》对“非法提供”和“非法获取”公民个人信息入刑情况作出了规定,《网络安全法》对窃取或以其他非法方式获取、非法出售或非法向他人提供个人信息作出了处罚规定。

本次博雅讲坛由北京大学出版社、北大博雅讲坛、上海悦悦图书有限公司主办。

    责任编辑:梁佳
    校对:张亮亮