宋晓冬健数:技术阻碍数据价值发挥如何用隐私数据安全技术激发数据的价值

在全球数据经济飞速发展的今天,构建负责任的数据经济框架事关每个人的安全。然而,什么是负责任的数据经济?它的目标和原则是什么?在构建数据经济框架之前,我们应该如何确认和保存数据?

11月10日,加州大学伯克利分校电气工程与计算机科学系教授、Oasis Labs创始人宋晓东在召开的“数据X大会暨一方简书战略会议”上提出上述问题以方建树着。

这是一个关于数据安全和数据经济的大讨论时代。易方建树邀请了商汤科技创始人兼CEO、创新工场董事长兼CEO宋晓东,就数据元素市场建设、行业数据价值输出、数据发展与应用生态、隐私与安全计算技术进步等议题进行了研讨。包括李开复在内的数百位数据技术行业领军人物参与了讨论。

宋晓东认为,当前最紧迫的是构建负责任的数据经济框架,从而不断激发数据的潜在价值。

她非常重视未来十年对数据经济的探索。“2020 年将是建立负责任的数据经济的重要十年,”她说。

技术缺失阻碍数据价值实现

如何利用隐私数据安全技术激发数据价值,是宋晓东一直在探讨的话题。在她看来,作为数字化和智能化时代最重要的生产要素现代密码学原理与应用答案,数据已经成为现代经济的关键驱动力。

她用一组数字来支持她的观点。现在,世界每天产生 2.5 万亿字节的数据。在这个庞大的数字背后,意味着不可估量的价值。据推测,2020年全球数据经济产值估计已达3万亿美元;而欧盟公司估计显示,2020年个人数据产生的价值已占欧洲GDP总量的8%。

但在宋晓东看来,在当前时代,个人对自己数据的使用权已经失控。许多个人数据在我不知情的情况下被第三方买卖。例如,加州机动车管理局(DMV)被发现非法出售司机个人信息,每年获利5000万美元。

还有第三方买卖数据,声称数据已被匿名化。然而,研究表明,数据匿名化并不能充分保护用户的私人信息。

《纽约时报》进行了一项研究,他们从匿名手机位置数据中追踪为总统辩护的前特勤局特工的位置,以了解特朗普的位置。

隐私数据保护不充分不仅对个人构成安全威胁,还会对企业造成大规模数据攻击。攻击者多次成功获取企业数亿甚至数十亿用户的敏感信息。

海量数据与真正的数据价值实现之间确实存在很大差距。宋晓东表示,根据数据的特点,传统的技术方案存在很多不足。

传统的技术方案主要对静态或传输中的数据进行加密,因此只能在静态或传输中保护数据,这种情况下数据要么未被使用,要么已被复制。数据复制后就很难控制了,我们也不知道复制的数据以后会怎么用。

“因此,我们今天在如何更好地使用数据方面面临的最大挑战是如何在使用数据的同时保护用户隐私,以及如何负责任地使用数据。” 宋晓东表示,如果这些挑战不解决,问题会越来越严重,甚至会阻碍未来的社会进步,甚至会破坏人类的基本权利和价值观。

上述多重隐私数据安全问题不仅困扰着个人和企业,也对数据安全技术公司提出了挑战。如今,宋晓东所说的具有巨大经济价值的数据大部分都被锁定在数据库中,由于缺乏保护隐私数据的解决方案而无法使用。更难发挥其应有的数据价值。针对这一问题,作为一家数据安全技术公司,一方简书认为,在实现“数据价值解锁”的技术路径中,隐私计算只是必要和不充分条件,一方简书做的是补充条件。提供数据的全生命周期服务就足够了。易方建树不局限于单一技术,

构建负责任的数据经济框架势在必行

宋晓东提出要尽快构建负责任的数据经济框架。

什么是负责任的数据经济?负责任的数据经济的目标和原则是什么?在她看来,这应该首先考虑到个人数据权利的保护。

图片[1]-宋晓冬健数:技术阻碍数据价值发挥如何用隐私数据安全技术激发数据的价值-老王博客

“数据权利是数据经济的基石,需要建立数据权利才能防止数据被滥用和滥用,”她说。除了建立数据权益保护机制外,我们还需要公平分配数据产生的价值,让用户能够从自己的数据中获得更好的收益。最重要的是,我们需要能够更有效地使用数据,以最大限度地提高社会和经济效益。

但是数据具有许多独特的属性,这些属性对建立负责任的数据经济构成了巨大挑战。例如,数据使用和数据隐私之间存在天然的对抗。我们希望从数据中获得更多的信息和更多的价值,但我们也希望在数据使用过程中保证用户的隐私和安全。此外,数据本身还具有其他特征,包括关联性、外部性等。

因此,要建立负责任的数据经济框架现代密码学原理与应用答案,不能满足原有的数据隐私保护框架。“我们需要提出一个新的解决方案。”

宋晓东提出的“负责任的数据经济框架”分为三个部分,分别是技术方案、更好的法律框架和激励模式。

该技术方案针对的是上述传统技术的不足,即在使用过程中如何保护数据。她认为主要有两点。首先,我们需要能够控制数据的使用,包括数据的可用性和不可见性;其次,要保护计算结果的输出不泄露敏感信息,保证数据使用的合规性。

在新技术领域,有几个主要方面可以帮助共同解决技术问题。包括安全计算,其中包括使用安全硬件和加密支持的方案,以确保数据在计算过程中不泄露;差分隐私,可用于确保数据输出不会泄露敏感的个人信息;联邦,它可以帮助数据使用分布式方法进行模型训练,而无需离开数据所有者的机器。

“简单说一下安全计算技术,安全计算的目的是保证数据计算过程中敏感数据信息不被泄露。这里主要有两种方法,一种是使用可信硬件,另一种是使用密码学,包括 Secure multi- “

近年来,对于同态加密和多方安全计算的使用进行了很多研究,但是在性能方面,这些方法仍然不足以支持很多实际应用,包括在很多应用场景中,将这些方法应用于机器模型训练需要很多年的时间。

另一种做安全计算的方法是使用可信硬件,它的优点是性能非常好,可以支持通用计算。近年来,不少硬件厂商也开发了自己的值得信赖的硬件产品。比如ARM在2014年提出了一套基于嵌入式设备的硬件隔离技术,英特尔、英伟达等也都开发了自己的产品。伯克利大学还开发了一种开源安全硬件 Keystone,它是一个开放框架和可定制的可信执行环境。实验结果表明,Keystone 环境中的持续学习与原生计算有很大不同。

隐私安全计算与大规模实施还有很大差距。目前,除了易方建树等少数一线数据安全计算公司外,全球能够真正实现应用场景的应用寥寥无几。但未来十年,宋晓东认为,很多隐私和安全计算的技术会不断发展,并有可能成为数据计算的基础设施。即使在未来十年内,大多数芯片都将具有安全飞地(安全执行环境),并且大多数计算机将使用安全飞地。

下一个十年是建立负责任的数据经济的重要十年

负责任的数据经济框架除了技术解决方案外,还需要有效的法律框架和激励模式。

法律框架内的数据权是什么?谁控制数据权利?这些最基本的问题今天没有明确的答案。

来自世界各地的从业者也在探索不同的数据权利概念和框架,例如 Eric Posner 和 Glen Weyl 提出的“数据就是生产力”,个人有可能就数据的使用形成联盟和讨价还价。集体名称。记者 Rana Foroohar 提出的“公共数据库(或数据信托)”建议数据权利受政府监管。其他包括“标准最低工资”,它保证为用户提供一些基本补偿,以换取有用的数据;以及“大型科技公司主导的系统”,这表明大型科技公司为用户提供管理、下载和删除自己数据的手段。工具。

“总的来说,我们需要数据驱动、技术引导的法规。例如,负责任数据技术的发展将如何影响监管框架?如何制定法规以更快、更广泛地促进负责任数据技术的使用?” 宋晓东说道。. 此外,我们需要新的既定模型和更好、更公平的方式来分配数据产生的价值。

值得注意的是,宋晓东和他的团队最近提出在机器模型的训练中使用Shapley值的概念来分配数据产生的值,以达到更好的效果。

至于未来如何正确存储和利用数据,他表示,未来我们将看到一种使用数据源的新兴方法。“数据信任、数据共享将主导各种数据的应用,从而实现所有权经济,用户作为数据所有者和合作伙伴从数据中受益。”

这也将催生被称为“数据守护者”或“数据受托人”的团体和行业,他们可能成为数据生态系统中可以管理、保护和提升用户数据价值的重要新实体。

宋晓东预测,这些新形式的数据信任和数据托管可能会创造巨大的经济价值,“比今天的数据市场高几个数量级”。

“总体而言,数字时代需要建设负责任的数据经济,共创美好明天。2020年将是建设负责任数据经济的重要十年。”宋晓东说。

© 版权声明
THE END
喜欢就支持一下吧
点赞0
分享
评论 抢沙发

请登录后发表评论