蒋昌俊院士团队:基于数据生成的隐式隐私保护框架(IMPOSTER “伪装者”)
2023/2/8 17:40:33 阅读:152 发布者:
以下文章来源于EDP Sciences ,作者蒋昌俊团队
近日,Security and Safety (S&S)在线发表了同济大学计算机科学与技术系蒋昌俊团队的研究成果。该研究团队提出了一个基于数据生成的事前隐式隐私保护框架IMPOSTER,该框架可以缓解隐式隐私的泄露,同时保持良好的数据效用。
研究团队解决了一种特殊的、不易察觉的隐私类型,被称为隐式隐私。与传统的隐私(显式隐私)相比,隐式隐私有两个基本特性。(1) 它最初没有被定义为隐私属性;(2) 它与隐私属性紧密相关。换句话说,攻击者可以利用它以一定的概率推断出隐私属性,间接导致隐私信息的泄露。为了处理隐式隐私泄露问题,研究团队给出了隐式隐私属性的可度量定义,并提出了一个基于数据生成的事前隐式隐私保护框架IMPOSTER (“伪装者”)。与传统的生成对抗网络(GAN)不同,研究团队在IMPOSTER框架中提出的隐式隐私保护模块增加了一个额外的判别器来保护隐式隐私。此外,研究团队引入了变分自编码器(VAE)来捕捉合成样本和真实样本之间的元素误差。当VAE中真实样本和生成样本之间的重构误差在可接受的范围内时,对隐式隐私保护模块的收敛性进行了理论分析。在实验部分,研究团队从以下三个方面评估IMPOSTER框架的有效性。(1) 生成的合成数据是否消除了显式隐私属性和隐式隐私属性之间的关联。(2) 生成的合成数据是否保留了良好的数据效用。(3) 参数敏感性分析。实验表明,IMPOSTER可以缓解隐式隐私的泄露,同时保持良好的数据效用。这项研究可应用于数字经济的隐私保护、风险控制等方面,保证数字经济在信息网络安全的威胁下,拥有数据安全,能安全、可靠地持续运行。
Figure. The framework of IMPOSTER “伪装者”框架图
本文提出的框架IMPOSTER包括一个隐式隐私探测模块和一个隐式隐私保护模块。前者使用标准化互信息量来探测与传统隐私属性密切相关的隐式隐私属性。基于数据生成的思想,后者为生成对抗网络(GAN)框架配备了一个额外的判别器,来消除传统隐私属性和隐式隐私属性之间的关联。
作者简介
杨卿 同济大学计算机科学与技术系博士生。研究兴趣包括数据挖掘、数据隐私和身份认证。
王成 同济大学计算机科学与技术系教授。研究兴趣包括网络空间安全和智能信息服务。
胡腾 同济大学计算机科学与技术系博士生。研究兴趣包括数据挖掘、机器学习和欺诈检测。
陈雪 同济大学计算机科学与技术系博士生。研究兴趣包括数据隐私和机器学习。
蒋昌俊 中国工程院院士,中国人工智能学会监事长,同济大学嵌入式系统与服务计算教育部重点实验室的负责人,IET Fellow,英国布鲁内尔大学的荣誉教授。研究兴趣包括网络计算与并行处理,在并发理论、网格计算和智能交通系统等方面取得了重要成果。曾获得一个国际奖项和七个科技领域的奖项。
欢迎扫描二维码或者点击“阅读原文”
查看文章详情
引用信息:Yang Q, Wang C and Hu T et al. Implicit privacy preservation: a framework based on data generation. Security and Safety 2022; 1: 2022008. https://doi.org/10.1051/sands/2022008
转自:“蔻享学术”微信公众号
如有侵权,请联系本站删除!