基于随机森林的异常邮件检测方法研究与实现
DOI:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

国家自然科学基金资助面上项目(61871432),国家自然科学基金资助青年项目(661702178),湖南省自然科 学基金资助青年项目(20173065),湖南省教育厅高等教育教学改革研究基金资助项目(2017[452]-289)。


Research and Implementation of Abnormal Mail Detection Method Based on Random Forest Algorithm
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    目前现有技术在中文异常邮件过滤方面,存在误判、效率不高等缺陷。为了缓解此问题,结合随机森林算法的优点,采用了中文分词方法进行特征提取,并对词频进行权重计算,通过奇异值降解,更好地填充算法以完成对中文异常邮件的检测。多种算法的对比分析检测效果表明,提出的基于随机森林异常邮件检测器在精准度、召回率的性能均优于其他算法,而在时间效能上也处于较好水平。

    Abstract:

    Currently, such deflects as misjudgment and inefficiency can be found in the technology of filtering Chinese abnormal mails. In order to efficiently solve this problem, this paper combines the advantages of random forest algorithm, adopts Chinese word segmentation method to extract features, and calculates the weight of word frequency. Based on a singular value degradation, this new approach performs better in filling in the algorithm to complete the detection of Chinese abnormal mail. Compared with the detection results of various algorithms, the experimental results show that the performance of the proposed random forest anomaly email detector is superior to other algorithms in accuracy, recall rate and time efficiency.

    参考文献
    相似文献
    引证文献
引用本文

彭 成,展万里,周晓红.基于随机森林的异常邮件检测方法研究与实现[J].湖南工业大学学报,2020,34(1):70-76.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2019-05-29
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2020-01-10
  • 出版日期:
文章二维码