系统工程与电子技术 ›› 2020, Vol. 42 ›› Issue (6): 1310-1316.doi: 10.3969/j.issn.1001-506X.2020.06.14

• 系统工程 • 上一篇    下一篇

基于生成对抗网络的高端装备研制数据脱敏方法

向南(), 张雄涛(), 豆亚杰(), 徐向前(), 杨克巍(), 谭跃进()   

  1. 国防科技大学系统工程学院, 湖南 长沙 410072
  • 收稿日期:2019-10-28 出版日期:2020-06-01 发布日期:2020-06-01
  • 作者简介:向南(1995-),女,硕士研究生,主要研究方向为系统优化与综合集成技术。E-mail:xiangnan1827@163.com|张雄涛(1996-),男,硕士研究生,主要研究方向为智能系统工程。E-mail:zhangxiongtao14@nudt.edu.cn|豆亚杰(1987-),男,讲师,博士,主要研究方向为组合决策、效能评估。E-mail:yajiedou_nudt@163.com|徐向前(1995-),男,硕士研究生,主要研究方向为决策分析。E-mail:xuxiangqian18@163.com|杨克巍(1977-),男,教授,博士,主要研究方向为国防采办与体系工程、智能Agent建模。E-mail:kayyang27@nudt.edu.cn|谭跃进(1958-),男,教授,博士研究生导师,硕士,主要研究方向为复杂系统工程管理、武器装备体系技术。E-mail:yjtan@nudt.edu.cn
  • 基金资助:
    国家自然科学基金(71901214);国家自然科学基金(71690233)

High-end equipment development data hyposensitization method based on generative adversarial networks

Nan XIANG(), Xiongtao ZHANG(), Yajie DOU(), Xiangqian XU(), Kewei YANG(), Yuejin TAN()   

  1. College of Systems Engineering, National University of Defense Technology, Changsha 410073, China
  • Received:2019-10-28 Online:2020-06-01 Published:2020-06-01
  • Supported by:
    国家自然科学基金(71901214);国家自然科学基金(71690233)

摘要:

针对高端装备研制数据的保密性和重要性,提出一种基于生成对抗网络(generative adversarial networks, GAN)的高端装备研制数据脱敏方法。面对高端装备研制数据在数据挖掘和数据共享时可能面临泄露的风险,利用GAN进行数据脱敏。在随机生成的高斯数据集上进行实验,通过比较源数据和脱敏数据的统计特征,证明GAN的数据脱敏方法能够有效实现数据脱敏过程中所要求的数据安全性、数据有效性和成本可控性。最后,在Yeast数据集上进行验证, GAN输出的脱敏数据同样在现实世界数据集上表现出色,能够准确地预测Yeast的分类,为高端装备研制数据的管理和分析提供了一种新的思路。

关键词: 高端装备研制, 数据脱敏, 生成对抗网络

Abstract:

Aiming for the confidentiality and importance of high-end equipment development data, a data hyposensitization method based on generative adversarial networks (GAN) is proposed. Considering the high-end equipment development data may face the risk of sensitive data disclosure during data mining and data sharing, the GAN for data hyposensitization is used. Experiments are carried out on randomly generated Gauss data sets. By comparing the statistical characteristics of the original data and hyposensitization data, it is proved that the data hyposensitization method based on GAN can effectively realize the data security, data utility and cost controllability. Finally, on the Yeast dataset, the desensitized data output by the GAN also performs well in real-world datasets, which can accurately predict the classification of Yeast, providing a new idea for the management and analysis of high-end equipment development data.

Key words: high-end equipment development, data hyposensitization, generative adversarial networks (GAN)

中图分类号: