央企文库

当前位置:首页 > 汇报材料 > 调研报告

调研报告

基于关联规则的网络数据动态聚类方法研究

2020-01-01 00:00:00调研报告
王喆 宋晓峰 王玉芳摘要:针对传统聚类方法动态聚类效果差、耗时长的问题,提出了一种基于关联规则的网络数据动态聚类方法。通过对网络数据属性的分析,建立关联规则,并在此基础上确定网络数据的值函数,实现网络数据的动态聚

王喆 宋晓峰 王玉芳

摘要:针对传统聚类方法动态聚类效果差、耗时长的问题,提出了一种基于关联规则的网络数据动态聚类方法。通过对网络数据属性的分析,建立关联规则,并在此基础上确定网络数据的值函数,实现网络数据的动态聚类。实验表明,该方法在改善聚类效果方面具有一定的优势。

关键词: 网络数据;动态聚类;关联规则

中图分类号:TP391      文献标识码:A

文章编号:1009-3044(2021)32-0051-02

随着网络规模的不断扩大和网络数据的激增,网络数据的碎片化和高度非结构化给网络数据的挖掘和聚类带来了挑战,使其成为近年来学术界研究的热点。例如,用户浏览网站后留下的各种各样的信息和数据,使得网络数据迅速膨胀,在由此形成的网络数据库中,可以实时分析挖掘出用户的个性化需求和兴趣,以及用户的职业、年龄、教育背景、地域等信息,对这些信息进行聚类分析,可以获得网络舆论和用户态度等统计数据。但是,传统聚类方法动态聚类效果差、耗时长,为此,本文提出了一种基于关联规则的网络数据动态聚类方法,利用网络数据属性进行关联分析,确定网络数据的值函数, ……此处隐藏163个字…… 态聚类效果差、耗时长,为此,本文提出了一种基于关联规则的网络数据动态聚类方法,利用网络数据属性进行关联分析,确定网络数据的值函数,实现网络数据的动态聚類。实验表明,该方法可有效改善聚类效果。

1 网络数据属性

当通用告警转换为模糊告警的时候,模糊告警项的模糊支持度[X]定义为:

[fsupportX=1ni=1nj=1,k∈Fxjmμfiksij]                  (1)

其中:[n]为事件数量,[m]为集合X的元素个数,表[μfiksij]显示了告警[j]与[X]关于模糊集[k]经过[i]转换之后的关系。如果给定两个集合[X=x1,x2,...,xp]和[Y=y1,y2,...,yq],支持度和可信度的转换关系[X?Y]定义如下;

[fsupportX?Y=1ni=1nj=1,k∈Fxjpμfjksij∧j=1,k∈Fyjqμfjksij]     (2)

[fconfidenceX?Y=fsupportX?YfsupportXY]                 (3)

通过在模糊集中引入模糊关系度,加入模糊频率集的特征以满足向下封闭规则,也就是模糊频率集的子集必须具有模糊频率特性。

[I=i1,i2,...,im]表示模糊告警数据库中的所有告警集,[S]为一个[k-]项目集[(k

文章评论