首页 >> 收录期刊 >> 计算机科学 >> 正文
杂志中文名:计算机科学
杂志英文名:Computer Science
主管单位:国家科学技术部
主办单位:国家科技部西南信息中心
地址:重庆市渝北区北部新区洪湖西路18号
邮编:401121
电话:023-63500828;
Email:jsjkx12@163.com
ISSN:1002-137X
主编:朱完元












基于Spark平台的并行KNN异常检测算法
引用本文:冯贵兰,周文刚.基于Spark平台的并行KNN异常检测算法[J].计算机科学,2018,45(Z11):349-352, 366.
作者姓名:冯贵兰  周文刚
作者单位:中国民航飞行学院现代教育技术中心 四川 广汉618307,中国民航飞行学院飞行技术学院 四川 广汉618307
基金项目:本文受民航飞行数据分析研究项目(XM2852)资助
摘    要:随着大数据时代的到来,异常检测受到了广泛关注。针对传统KNN异常检测算法处理速度和计算资源的瓶颈,以及Hadoop平台上的MapReduce不能友好支持迭代计算和基于内存计算等问题,提出了一种基于Spark平台的并行KNN异常检测算法。该算法首先对数据集进行分区和广播,然后用map函数计算数据集在每个分区的K近邻,使用reduce函数归并map函数的输出计算全局K近邻得到异常度,将异常度前n个对象视为异常。与传统KNN异常检测算法相比,在保证检测精度的前提下该算法的性能与计算资源呈近似线性关系;与其他并行异常检测算法相比,该算法无需额外扩展数据,支持迭代,而且通过在内存中缓存中间结果来减少I/O花销。实验结果证明,该算法可以提高KNN算法在大规模数据上的异常检测效率。

关 键 词:Spark平台  并行  K近邻  异常检测
作者简介:冯贵兰(1988-),女,硕士生,工程师,主要研究领域为云计算、信息安全,E-mail:fengguilan1016@sina.com;周文刚(1981-),男,博士生,讲师,主要研究领域为网络管理、机器学习、人工智能等。

Spark-based Parallel Outlier Detection Algorithm of K-nearest Neighbor
FENG Gui-lan and ZHOU Wen-gang.Spark-based Parallel Outlier Detection Algorithm of K-nearest Neighbor[J].Computer Science,2018,45(Z11):349-352, 366.
Authors:FENG Gui-lan  ZHOU Wen-gang
Affiliation:Modern Education Technology Center,Civil Aviation Flight University of China,Guanghan,Sichuan 618307,China and Institute of Flight Technology,Civil Aviation Flight University of China,Guanghan,Sichuan 618307,China
Abstract:
Keywords:Spark  Parallel  K-nearest neighbors  Outlier detection
    浏览原始摘要     下载PDF全文