一浪接着一浪,有关个人隐私数据的讨论似乎又成一股风潮。

前脚李开复“口误”提及人脸数据的使用风波还未平,后脚苹果已经要在iOS 14上更新“隐私大招”,大刀阔斧动广告主们的奶酪。

在苹果的最新发布会上,库克宣布iOS 14将于9月17日上线。而这版系统最亮眼的更新或许是推迟到明年1月实施的隐私保护功能。从已有信息来看,这次苹果的隐私更新主要由两方面构成,一是IDFA(Identifier for Advertising),二是剪切板。

关于IDFA,这是一个广告商识别符。每部苹果手机都有一个IDFA,被各大互联网公司用于跟踪用户行为、记录广告投放所获得的下载或购买转化次数,是广告主们支付广告费用的重要依据。而一旦用户拒绝,这部分个人信息将无法被获取,同时也意味着广告主无法延续既往的商业模式。

而剪切板也是各大APP读取用户信息的渠道,iOS 14将实现一旦有应用读取剪贴板,用户就会通过弹窗得知这一操作,此类应用也必然导致用户反感。

事实上,早在今年夏天,苹果就宣布将在iOS 14中更新这些功能。不过当时迫于广告主们的压力,宣布将实施日期由今年9月推迟到明年年初。

经常在网上冲浪的“科技老炮儿”们可能会发现,短短数月,不管是苹果、蚂蚁金服还是旷世科技、李开复,这些科技圈的响亮名头正被同一话题环扣在一起。这种现象似乎并不常见,不过其实,有关隐私数据使用的讨论早在几年前就被摆上台面。

最经典的案例当属2018年3月发生的Facebook事件,当时有超过数万条数据被泄露和滥用,扎克伯格不得不连续接受各方质询,Facebook也一度股价大跌。接着在2019年,GDPR天价罚单产生,英国航空公司和万豪由于客户数据泄露事件而先后收到高达1.83亿英镑、1.24亿美元的罚款通知。

有数据统计,在GDPR实施的两年多内,已经有近300起罚款。并且,罚单的金额也在扩大——2019年的罚款金额达到4.175亿欧元,几乎是2018年的1000倍。

这两年间的一切变化似乎都意味着,隐私数据使用和科技进展之间的矛盾,已经到了一个不得不解决的节点。

当前,一些观点认为使用大数据的科技公司都带有“原罪”,不过36氪同样也观察到,不仅是苹果,其余一些科技公司也正进行尝试,希望让隐私数据的保护和使用得以两全。

用户拒绝的是什么?

在探究具体的解决方案之前,或许需要搞清楚,用户的不满到底由何而起。

首先来想象一下,当iPhone界面弹出:你希望分享你的IDFA吗?预料中的答案可能是:不。

很明显,当前几乎每个人都曾被没完没了的推销电话、广告弹窗,甚至诈骗行为骚扰过。而苹果这个简单的“是否”问题,至少让用户拥有了一次自己决定隐私数据使用的权利。

但对B端而言,情况就没这么乐观了——拒绝分享IDFA的做法,会打破以往通过追踪用户数据而投放精准广告的“标准操作”。要知道,拒绝分享IDFA这串标识的背后,其实切走的包含多家巨头公司在内的广告收益蛋糕——资料显示,2019年Facebook的广告收入达到707亿美元。同年,阿里巴巴的广告业务收入超过了1000亿元,百度和腾讯的广告收入也分别达到781亿元和684亿元。这也是为什么苹果的这次更新会在广告圈引起轩然大波。

不过在“哀嚎一片”的同时,广告主可能也会意识到,在隐私数据保护这个话题上,至少有一部分用户反感的不是使用数据本身,而是没有知情权地滥用个人隐私数据。 

这其中暗含两层意思,首先是知情权,即给到用户“是或否”的选择。第二是“滥用”,即在用户选择“是”的基础上,保证其基本的隐私数据安全,甚至给予相应的利益分成。

针对选择权,一些调研论证了用户对隐私数据使用的态度。在2020年第一季度旧金山人工智能个性化平台Formation.ai的一项调查中,参与调查的2000名美国消费者中有79%认为,品牌的个性化策略越多,消费者会对品牌越忠诚。还有20%的消费者认为,自己收到的推广邮件“精准”地戳中了自身生活方式、兴趣或购买历史。

但同时,另一些调查也表明,用户希望数据可以在获得自身授权的情况下共享,而且需要拥有选择退出的权利。不难想象,出于对数据泄露风险的担忧,会是用户想要选择退出的原因之一。

不管是否承认,针对隐私数据使用方式,B端和C端的利益在某些层面上相通。原因很简单,AI等技术的进展离不开大数据的“浇灌”,而C端也一定会感受到技术带来的便利,这其中的值得讨论的地方在于,关乎个人权益的隐私数据该以怎样的方式被使用。

此时,企业和用户各自的诉求已经很明显——B端需要海量数据训练模型,C端在体验“精准营销”的同时也保证数据使用的相应权利。不可否认的是,即使以往的数据使用方式存在诸多不妥,用户依然也需要科技进步改善自身的生活体验。所以,最佳的解决方案应该能同时满足普通用户和企业方(如广告主)两者的需求。

换句话说,科技公司在期待使用数据的同时,也需要提供至少“尊重用户选择权且保障其数据安全”的解决方案。

解铃还须系铃人?

好消息是,一些科技公司正朝着兼顾隐私数据安全和使用的方向探索。我们目前观察到的方式有消费电子厂商的在自身生态层面提供的方案,和隐私计算公司结合了密码学、分布式计算、区块链等技术的对外解决方案。

关于前者,在苹果决定询问用户是否愿意分享IDFA之外,华为、小米等公司也在逐步提供相应的服务,这在一定程度上保障了用户对隐私数据的使用权利以及降低了部分数据泄漏风险。

以小米为例,今年4月小米官宣了「小米隐私品牌」。“随着国际化,我们发现隐私上我们做的是不够的,所以开始加强。”小米集团副总裁、技术委员会主席崔宝秋曾对媒体表示。

根据介绍,小米目前已经自研并开源了MACE(Mobile AI Compute Engine)框架,这是专为移动终端开发的AI框架。用户数据无需上传至云端,可以直接在移动终端完成离线运算。通过离线模型技术,可以保护用户隐私。同时,小米在系统中运用了“差分隐私”。这是一种隐私保护算法,会在数据上传之前添加一些干扰噪声,确保上传数据不是用户的真实数据,仅可以用于整体数据的趋势研究。

在更直接的用户体感上,其在产品中提供的隐私照明弹和隐私面具等功能也可以来拒绝应用过度获取手机权限。

华为也在保护用户隐私上做出了尝试。为了让收集的敏感个人数据脱敏,华为同样使用了差分隐私技术,从而保证提供给华为的数据不会关联至用户个人。同时根据其前不久发布的最新消息,EMUI 11在隐私安全方面也进行了升级,增加了分享脱敏和隐私备忘录功能,可以让用户在分享照片以及使用备忘录的过程中避免隐私泄露。

此类进展或许也和这些公司的业务布局相关。不论是苹果、小米还是华为,手机、平板电脑、可穿戴设备、智能音箱等产品都被视作数据流动的出入口,在使用过程中也免不了遭到监管的压力,同时面临用户对数据使用方式质疑。在这种情况下,公司提供相应的隐私保护解决方案,既是对用户的保护也是业务合规开展的前提。

同时,在市面上也出现了另一种隐私数据保护方案——隐私计算,这类方案当前以服务B端客户为主,或许能在保护普通用户数据安全的基础上,更大范围地满足生态圈中众多其他企业的需求。

在此需要解释的是,隐私计算是一个“大帽子”,广义上是指面向隐私保护的计算系统与技术,这其中可能利用多种细分技术(如密码学、区块链、分布式计算等),这些融合了多种技术的隐私计算方案,想要达成的效果是使数据在各个环节中“可用不可见”。当前主要应用在金融、政企等领域。

和前文提到的消费电子厂商相比,目前入局隐私计算领域的公司背景不一,具体可分为以下五类:独立的新兴技术提供方、互联网公司、为行业提供产品/服务的老牌技术公司、传统大数据公司、金融科技公司。这些公司目前所采用的技术路线多是密码学(如安全多方计算)、分布式计算、可信硬件及区块链的结合体。

其中,密码学从数学理论层面保证了数据在流通中的安全,分布式计算是多方联合建模的方式,可信硬件在工程落地方面较具备优势,它们一起在上层进行计算,而区块链则在下层提供支付和结算功能。

简而言之,这种方式使得密文计算成为可能,对C端的利好是,让用户的个人隐私敏感数据得以在密文条件下发挥效用,甚至未来有可能在区块链的作用下获得分润。对B端来说,能够以恰当的方式提取数据价值,“哺育”业务。

那么,隐私计算具体的落地场景是什么?较典型的场景是帮助B端做风控和营销——是的,正包括当前让广告主焦头烂额的营销。

在逻辑上,这两种场景的实现都是在敏感数据被加密的情况下,汇集多方数据实现联合建模,从而既保证用户隐私数据的安全,又能勾画出用于风控和营销画像。 

但不可否认,当前这一行业各家公司几乎均处于产品化落地的过程中,当中计算效率、商业模式等问题也有待探讨,大面积商用还有待时日。

当政策和技术双管齐下

不论是大牌的消费电子厂商还是独立的隐私计算公司,用户需求和政策监管是促使科技企业们保护个人隐私数据的双重驱动力,后者造成的压力或许更直接。

前文提到的GDPR被看做目前最全面、最严格、应用最广泛的隐私保护法规之一。

其影响的企业包括,设立在欧盟境内的企业(控制者、处理者)、未在欧盟境内设立,但向欧盟境内的数据主体(自然人)提供产品和服务的企业(控制者、处理者)、未在欧盟境内设立,但涉及监控欧盟境内数据主体(自然人)行为的企业(控制者、处理者)、未在欧盟境内设立,但在欧洲成员国法律适用的地方设立的企业(控制者、处理者)。简而言之,这项法规不仅适用于欧盟境内企业组织机构,也适用于欧盟以外的企业组织机构,覆盖范围十分宽广。

在具体处理标准上,GDPR对违反某些重要规定的罚款最高可达2000万欧元,或全球年营业额的4%。违反其他规定的罚款最高可达1000万欧元,或全球年营业额的2%,以较高者为准。

在欧洲之外,政策的敏感度也在全球范围内显露。在美国,即使还没有单一的法规或条例来实施对一般数据的保护,但其在50个州和地区中也拥有数百条用户隐私和数据安全条例。比如,加利福尼亚州在2018年颁布了《加利福尼亚州消费者隐私法》,该法规中授予了消费者了解被收集信息的权利,以及与谁共享这些信息的权利。并且,消费者还可以选择禁止科技公司出售他们的数据。 

在中国,一些相应的政策也在推进。当前已经有《中华人民共和国网络安全法》、《数据安全法(草案)》等若干法规逐步出台。一个更耳熟能详的现象是,工信部也加强了对各类APP的管理,各类存在侵害用户权益行为,且未按时完成整改的APP会面临下架风险。 

政策严厉,合规是众多科技公司持续稳定运营的关键。但还有一种更和谐的可能,即政策和科技公司不是被迫监管的关系,而是达成共识后的协力。

爱沙尼亚是一个例子,该国通过政策和科技的结合,使C端用户更自由、便捷地掌握和使用自身的信息。该国有三个比较著名的数字项目,分别是“e-Estonia”,“X-Road”和“e-Residency”。e-Estonia是爱沙尼亚推出的数字国家计划的项目,使爱沙尼亚公民皆能拥有属于自己的电子身份证卡,用于服务公民在生活中的需求。这一项目的核心是数字身份,爱沙尼亚人可以拥有自己的电子身份证卡,从而提升自己的线上工作、生活效率。

X-Road是爱沙尼亚的安全在线数据传输平台。这是一个去中心化的公共数据库系统,旨在打通爱沙尼亚政府部门以及重要的本地公用事业公司的数据库,实现关键数据在整个国家公共基础设施内部的互联和互通。

e-Residency是该国政府向全世界公民开放的一个项目,该计划使世界各地的人们可以通过申请“电子居民”得到由政府认证、颁发的电子身份证号码,享受爱沙尼亚的部分线上服务。

根据“数字爱沙尼亚”专家Katrin Nyman-Metcalf的说法,爱沙尼亚政府并没有更多地采集公民数据的操作。在爱沙尼亚,如果官方需要获取数据只能在自己的工作地点获取数据库中既存的数据。而作为个人,注册成为X-Road的成员,就可以获取公共数据。而且系统会验证数据索取者的身份,并根据身份决定索取者可获取的数据权限。因为每一次对数据的访问都会留下印记,所以公民可以意识到是谁在什么时间获取和使用自己的数据。如果有所怀疑,公民有权利质询数据出于什么原因被使用,而有关部门有义务回答。

在国内,我们看到有些公司也在逐步计划让C端用户更自由地掌握自身数据。

在36氪此前对「蒸汽记忆」CEO谢扬的访谈中,其透露公司当前的身份认证业务是这件事的开始,他真正希望达成的是以后每个人都会拥有有一个POD,即个人的在线数据柜。有了这个在线数据柜,个人可以将自己的结构化数据(如个人在各大平台上的粉丝关系、聊天记录、工作日历等)和非结构化数据(照片、日记等)存储其中,这些数据可以通过POD授权给各种不同的应用,而不用像现在一样通过各种APP实现。

换言之,数据是掌握在个人手中的,个人拥有数据的使用权,而非其他平台。理想状态下的效果是,倘若一个APP封停了个人账户,那么他在APP上的内容和粉丝关系仍可跟随个人授权给其他平台。

个人的在线数据柜,这一理想在当下看来既浪漫又遥远。但不论如何,用户对隐私数据的合理使用意识已经觉醒,科技公司对此的多样尝试也在途中。

这些由技术而始的束缚,或许也可以由技术尝试打破。

————————

参考文献:

《苹果的“隐私大招”,会让一大批App焦头烂额》,第一财经

《GDPR 2 周年,我们分析了近 300 起罚款事件》,InfoQ

《【调查】大多数消费者愿意用自身数据交换个性化服务》,数世咨询

苹果引发了一场大恐慌:将影响中国所有App开发者和使用苹果手机的人,硅发布

《「矩阵元」孙立林:隐私计算行业火热,未来生态是底层基础设施结合上层应用》,36氪