|
中山大学学报(自然科学版) 2018
一种隐私保护的序列数据马尔可夫分类方案Keywords: 数据挖掘,隐私保护,序列分类,马尔可夫模型 Abstract: 摘要 数据挖掘是当前热门的研究方向,序列数据分类作为一种非典型的数据挖掘任务在很多领域有广泛的应用前景,例如金融、生物等领域.由于序列数据难以定义特征,其分类问题,传统的基于特征的分类方法难以适用.一种常见的解决方案是使用概率模型进行序列分类,例如马尔可夫模型.在大数据时代,经常需要多个独立的机构或个人共享数据进行数据挖掘任务,很多数据由于伦理、法律等方面的问题,不适合直接共享.本文在保证每个参与方数据隐私(包括数据本身以及数据的统计特征)的前提下针对如何训练马尔可夫模型,借助密码学技术提出了一个解决方案.方案针对1阶和2阶马尔可夫模型没有误差并且有较小的时间开销,尤其是训练轮数增加时性能较高
|