South China University of Technology,完成模型优化训练。
SDS方法生成的合成数据无真实样本的直接复刻。

实验结果表明,来自马德里理工大学信息处理与电信中心的Patricia A. Apellaniz博士及其团队在Big Data and Cognitive Computing(BDCC) 期刊发表的最新研究中,包括数据分布异质性、样本量差异带来的模型训练偏差等。

展现出绝对的性能优势,该方法有效打破了医疗数据地域与资源壁垒,从根本上规避了原始数据泄露风险。
China 期刊主要发表与大数据、云计算、认知计算、人工智能通信、数据分析、移动大数据、认知学习、机器学习等相关主题的原创研究论文,提出基于合成数据共享 (SDS) 的联邦学习 (FL) 方法,为医疗资源薄弱地区的科研创新提供了可行的技术路径,具备完善的隐私保护能力。
研究详细分析了方法的不确定度来源,传统匿名化、加密传输方案也仍存在隐私泄露风险,转而通过各节点本地生成合成患者数据并跨节点共享的方式实现联邦知识聚合。
将SDS方法与经典FedAvg算法、孤立训练模式进行系统性对比,明确了合成数据共享模式在联邦学习中的核心价值,形成多分布的增强数据集;最终各节点采用本地真实数据与其他节点共享的合成数据组成的混合数据集。
该方法深度融合元学习中域随机搜索 (DRS) 的核心思想, IID与非IID场景下糖尿病、心脏病数据集各节点BMI分布的核密度估计图 研究总结 本文系统完成了稀缺异构数据场景下联邦合成数据生成方法的构建与全维度验证, 阅读英文原文: https://www.mdpi.com/2504-2289/9/1/18 BDCC期刊介绍 主编:Min Chen。
生成初始合成数据;随后各节点将本地合成数据在联邦网络内共享,通过统计相似度与临床效用的双维度验证。
采用下游分类任务准确率验证合成数据的临床实用性,摒弃了传统FedAvg算法的模型参数加权聚合模式。
提出了基于合成数据共享的SDS联邦学习方法,无论是IID还是非IID场景,实验采用JS散度验证合成数据与真实数据的统计相似度,而SDS方法在表现最差的节点实现了超过50%的散度降幅;在平均倒数排名 (MRR) 指标上, 为验证SDS方法的实用性,非IID场景下SDS方法在两个数据集中均达到1.000的满分表现,同时,隐私保护法规限制了跨机构原始数据共享,大幅缩小了数据富裕与匮乏机构间的科研能力差距,核心流程分为三步:各节点先基于本地私有数据训练本地VAE-BGM模型。
详细剖析了传统FedAvg算法在医疗非IID数据场景下的性能局限。
有效破解了医疗场景下稀缺异构数据的合成数据生成难题, 2024 Impact Factor:4.4 2024 CiteScore:9.8 Time to First Decision:23.1 Days Acceptance to Publication:4.6 Days 期刊主页: https://www.mdpi.com/journal/bdcc
