网站首页 公文大全 个人文档 实用范文 讲话致辞 实用工具 心得体会 哲学范文 总结范文 范文大全 报告 合同 文书 信函 实用
  • 汇报体会
  • 节日庆典
  • 礼仪
  • 毕业论文
  • 评语寄语
  • 导游词
  • 口号大全
  • 其他范文
  • 百花范文网 > 实用范文 > 其他范文 > 融合边缘智能计算和联邦学习的隐私保护方案

    融合边缘智能计算和联邦学习的隐私保护方案

    时间:2023-07-02 19:30:02来源:百花范文网本文已影响

    刘 东,裴锡凯,赖金山,王瑞锦*,张凤荔

    (1. 电子科技大学计算机科学与工程学院 成都 611731;
    2. 成都民航空管科技发展有限公司 成都 610042;
    3. 电子科技大学信息与软件工程学院 成都 610054)

    随着互联网和物联网的高速发展,手机、平板和电脑成了人们日常生活中必不可少的边缘智能计算设备[1]。通常,边缘智能计算场景包括智能医疗、智能家居、智能交通、智能教育等。边缘计算从云端计算延伸,在边缘部署地理分布的边缘网关网络,提供更接近物联网设备的计算能力。在传统的云端计算模式下,边缘智能终端直接将本地模型发送到云端进行计算处理,机器学习的集中训练模式可能会带来一些安全隐患,这种模式容易被攻击者拦截并发起隐私攻击[1-2]。此外,由于分布式用户数据具有多源特性、异质性等特点,集中处理会带来很大的资源开销和安全风险。边缘智能计算通过扩展边缘云端对中心云端进行补充,使得网络边缘能够满足计算和存储此类应用的要求[3]。

    联邦学习是一种新型的分布式框架,与传统的集中式机器学习相比,具有更好的隐私保护功能。它的原理是组合多个分布式设备,保护本地各种设备协调下的数据集,共享局部模型参数,可以获得更准确的机器学习模型来自训练和学习,从而实现数据的“可用隐身”。

    联邦学习[4]是谷歌在2016 年首次提出的分布式机器学习模式,目的是为了解决数据交换过程中存在的隐私泄露问题。传统的联邦学习系统是服务器和客户端模式,分为横向联邦学习、纵向联邦学习和联邦迁移学习,其中联邦迁移学习不对数据进行切分,利用迁移学习来克服标签不足的情况[5]。对比传统的机器学习,服务器将模型参数分配给不同的客户端,客户端只上传模型参数而不上传原始数据,从而可以将数据保存在本地,从一定程度上保护了用户隐私。

    在现阶段的研究中,融合边缘智能计算和联邦学习的方案具有边缘化、分布式、资源动态性等特征,同时使隐私保护和合作共享成为可能。但是由于隐私攻击模型的出现,如梯度泄露攻击、重放攻击,使得模型的隐私性受到威胁。文献[6]指出,在智能家居中传感器与大量的用户隐私相关联,在数据的产生、传输、处理过程中都存在着隐私泄露的风险。文献[7]指出,车联网的部署在提供定位服务的同时也存在隐私泄露的风险。文献[8]通过将释放出的Netflix 数据集与IMDb 数据集进行关联就挖掘出了一部分用户的敏感信息,随后在推荐中对于数据的隐私保护方法进行了大量尝试,如匿名化、差分隐私、本地化的差分隐私、同态加密算法、安全多方计算等与推荐方法的结合;
    以及机器学习思想在推荐中的尝试,如对抗机器学习、对抗样本生成等,都在一定程度上保护了用户的隐私和安全。文献[8] 设计了一个安全聚合方案,在聚合期间使用户能够更新加权向量平均,消除用户间的致盲因子。文献[9] 基于协同学习设计了 GAN 攻击,使恶意用户加入训练过程并生成诚实的数据集用户。文献[10] 添加拉普拉斯噪声到神经网络中的梯度以满足差分隐私。尽管如此,文献[11]指出虽然添加梯度噪声可以保证隐私,但它的签名大大降低了模型的准确性。文献[12]提出了一种基于加法同态加密的协同学习系统。

    设D和D"是相邻数据集,即只有一个样本不同。对于查询函数f,如果满足式(1),则f满足差分隐私:

    式中, ε代表隐私度, ε越大代表数据可用性越高,越小代表隐私保护程度越高,相应地,添加的噪声越大,当ε 为0 时,代表没有添加差分隐私;

    δ代表置信度参数,在严格差分隐私中, δ为 0,当δ>0时,为近似差分隐私,在实际工业中,近似差分隐私被广泛使用。

    高斯机制:给定一个数据集D和查询函数f,则提供差分隐私的机制M满足:

    式中, σ代表标准差,需满足:

    在第t轮训练中,传输的数据量为L,信道带宽为B,因此传输时间为mt=L/B。设P为第t轮训练的功率,那么产生的能量消耗为LP/B。

    表1 描述了本文方案相关算法。

    表1 相关算法描述表

    3.1 系统架构

    为了解决边缘计算场景下训练全局机器学习模型的隐私泄露问题,设计了一种使用安全多方计算框架的联邦学习系统。该系统包括一个云端和多个可以与之通信的边缘网关,且边缘网关和边缘智能终端可以相互通信。图1 为该系统架构,系统中有3 种实体。

    图1 系统架构

    1)边缘智能终端:作为联邦学习任务的参与者,有不同数量的数据集和不同的计算能力,它们的加密数据集旨在训练一个模型。

    2)边缘网关:是边缘智能终端和云端的链接,具有更强的计算能力和更大的存储空间。它们从边缘智能终端收集加密数据并训练模型,并将训练好的模型参数发送到云端进行聚合。

    3)云端:是本文方案中的参数服务器。负责分发初始训练模型、聚合和更新模型参数。

    首先,边缘智能终端使用不同的本地数据隐私保护,然后上传到边缘网关进行数据聚合,边缘网关数据聚合后,对本地模型进行训练,并对模型进行PPCEF,然后上传到云端进行模型聚合,云端将模型聚合后,再下放到各边缘网关进行更新。

    最后,由于个人掩码的存在,联邦学习的每个参与者无法知道单个边缘网关上传的本地模型梯度,这保证了每个边缘网关的隐私。

    由于秘密共享算法的存在,恶意用户都不能通过共谋攻击来攻击系统中的参与者。

    这种安全性在理论上是有保证的,同时边缘网关也有一定的冗余性。

    因为公共掩码的存在,全局模型梯度在传输过程中不暴露,保证了全局模型梯度的安全性。其算法流程如图2 所示。

    图2 PPCEF 隐私保护算法流程图

    3.2 初始化

    在进行联合学习之前,系统需要设置一些必要的参数,以保证系统传输和安全的需要。

    1) 生成云端边缘网关和云端公钥证书,进行身份认证,实现公钥与身份的唯一绑定关系。系统主要使用公钥和私钥对 (dSK,dPK)进行身份认证和消息认证。

    2) 从云端生成一个安全质数k,k的位数必须大于1 024。

    3) 为秘密共享算法指定一个有限字段F。

    4) 在各边缘终端与边缘网关、边缘网关与云端之间建立相应的通信路径。在实验中使用一个相对简单的socket 机制来实现每个参与者之间的通信互连。

    5) 设置秘密共享协议的参数n和t。

    6) 所有参与训练的边缘网关都诚实地使用云端提供的安全质数k,来生成与DH 密钥交换协议相关的参数p p ←KA.param(k)。

    3.3 公共密钥共享

    1) 边缘智能终端对原始数据d添加差分隐私保护机制,M(d)=f(d)+N(o,σ2),其中N是高斯分布, σ是d的方差。然后将处理后的数据发送到附近的边缘网关进行多用户数据聚合。

    3) 云端收集参与训练的边缘网关发送的信息,当收集一定时间且记录的参与训练的边缘网关数量未达到t及以上时,聚合训练将被中断。

    否则,云端广播训练网关集合U1 和签名公钥信息。

    3.4 密钥协商

    1) 参加训练的边缘网关收到终端集U1 和云端广播的签名公钥信息集后检查时间戳;
    验证

    3.5 掩码添加

    1) 参与的边缘网关接收签名秘密来自云端的信息并将其保存为列表。

    3.6 一致性检查

    1) 边缘网关从云端接收边缘网关集U3, ⊆如果U3

    2) 边 缘 网 关 将µu←(U3||SIG.sign(duSK,U3||timestamp))发送到云端。

    3) 云端从至少t个边缘网关处收集µu(用U4 ⊆U3表示这组用户),向U4 中的每个边缘网关发送集{v,µu}v∈U4。

    3.7 解除掩码

    4.1 实验配置

    本实验采用MNIST[13-14]数据集和CIFAR10[15]数据集进行对比分析。将原有的联邦学习算法作为比较基准,并将基于主流隐私保护方案的联邦学习验证隐私方法与PPCEF 进行比较,以实现对比分析。

    4.2 实验对比分析

    4.2.1 精度

    3 种方案在MNIST 数据集上进行训练,得到图3 所示的ACC(精度)曲线。可以看出,使用MNIST[12]数据集进行16 轮训练后,本文的PPCEF 模型准确率达到90%。在使用CIFAR10 数据集时,从图4可以看到,经过30 轮训练,PPCEF 模型的准确率达到了95%,它更接近于原始的联合学习,但明显高于差异隐私方案。

    图3 3 种方案的精度比较(MNIST)

    图4 3 种方案的精度比较(CIFAR10)

    可以看出,原始的联邦学习方案精度略高于PPCEF,但原始联邦学习没有添加隐私保护方案,存在隐私风险,而面对一个不安全的网络环境,隐私保护方案是必不可少的。

    4.2.2 防隐私攻击能力

    学习系统使用该安全方案,由于梯度添加掩码,使得即使在迭代后,虚拟梯度最大程度接近“真实梯度”,但“真实梯度”是添加掩码的虚假梯度,所以无论迭代多少次,攻击者只有无用的虚假梯度,因此,原始图像不能从梯度恢复。使用梯度泄漏攻击[14]来测试PPCEF 的反隐私攻击能力,并将PPCEF 攻击结果与原始联邦学习攻击结果进行比较。当原始联邦学习迭代次数为130 时,原始图像基本恢复。但是,由于PPCEF 在梯度上添加了掩码,原始图像不会暴露。

    4.2.3 边缘网关能耗对比分析

    分析了FedAvg[15]、q-FedSGD[16]和PPCEF 中各边缘网关参与联邦学习的总能量消耗,能量消耗描述了参与联邦学习的成本。

    表2 给出了3 种算法中每个边缘网关学习的总能耗。3 种算法下各边缘网关的能耗分布趋势和时间分布是相似的。

    表2 能耗比较 s

    在当前的边缘计算网络中,隐私安全问题尤为突出。因此,如何将传统的隐私保护方案与边缘计算环境中的边缘数据处理特征相结合,从而实现多元化服务环境下的用户隐私保护就显得尤为重要。

    本文以边缘计算为研究对象,介绍了联邦学习的训练框架,设计了一种基于秘密共享和权重掩码的轻量级隐私保护协议,能够很好地达到隐私保护的目的。

    猜你喜欢掩码云端联邦一“炮”而红 音联邦SVSound 2000 Pro品鉴会完满举行家庭影院技术(2020年10期)2020-12-14云端之城现代装饰(2020年5期)2020-05-30303A深圳市音联邦电气有限公司家庭影院技术(2019年7期)2019-08-27低面积复杂度AES低熵掩码方案的研究通信学报(2019年5期)2019-06-11基于布尔异或掩码转算术加法掩码的安全设计*通信技术(2018年3期)2018-03-21美人如画隔云端丝路艺术(2017年5期)2017-04-17行走在云端初中生(2017年3期)2017-02-21云端创意小学生优秀作文(趣味阅读)(2017年3期)2017-02-11基于掩码的区域增长相位解缠方法浙江大学学报(工学版)(2015年4期)2015-03-01基于掩码的AES算法抗二阶DPA攻击方法研究电子设计工程(2015年20期)2015-01-29

    相关热词搜索:联邦 隐私保护 融合

    • 范文大全
    • 说说大全
    • 学习资料
    • 语录
    • 生肖
    • 解梦
    • 十二星座