基于Java的网络信息过滤插件的研究
李应霆 叶传奇 李玉进 尚嘉琳 肖洋洋 闫凯
摘要:随着互联网时代的发展,伴随着信息服务技术的不断迭代,由网络技术产生的相关应用逐步受到诸多行业的青睐,为了使上网更加方便快捷,越来越多的用户放弃传统的应用程序而选择安装相应插件,用以简化电脑环境。该文设计了一个过滤插件,该插件主要通过DFA过滤算法,实现了在网页中对含有敏感词汇的过滤。结果表明,与其他过滤算法相比,DFA算法在替换耗时和精确度方面都有较为优秀。
关键词:信息过滤;DFA算法;插件设计;关键词过滤中图分类号:TP393 文献标识码:A
文章编号:1009-3044(2021)29-0062-02
1概述
由于互联网技术的不断发展,人们逐步认识到网络所起到的重要作用,并通过网络进行信息的传递与资源的共享来达到交流的目的。但是,在国内外网络上传播有利信息的同时,也会有不法分子利用其开源性、公共性等特点传播不良信息,使一些是非辨别能力较弱的人受到严重影响,更有甚者会危害到国家的安全与社会的稳定发展。因此互联网在加强人们沟通的同时,也需要更加稳定的过滤技术的加持。网络信息过滤主要针对互联网上信息鱼龙混杂的问题,但它同样也可以为解决信息化社会中人们想要自主设置信息获取的途径与内容等个性化定制需求提供一些新的思路。
2开发技术
插件。插件是一种遵循一定规范性应用程序接口编写出来的程序,其只能运行在规定的应用平台上,不可以脱离指定的应用平台而单独实现运行。其结构使应用程序编写具有良好的扩充和定制功能。其中有三种插件系统的实现方法,其中最重要的是实现插件与主程序之间的交互,一般按照一些特定规则的DLL ……此处隐藏2733个字…… lt;String> set = filter.getSensitiveWord(string, 1),或 Set< String> set = filter.getSensitiveWord(string,2)来达到过滤文本的目的。其中 set存放的是文本中存在的敏感词,程序运行完成后可直接在控制台查看过滤信息;string 为待要过滤的文本;1 表示最小匹配规则;2表示最大匹配规则。完成文本过滤功能后,输出文本中的敏感词将会用***表示。
6结束语
随着计算机科学和信息技术飞速发展,网络方便了信息共享,推动社会进步。但通过网络传播不良信息仍是一个严重的社会问题。本文插件的研究采用多种过滤技术并用的方式来对网页不良信息进行有效的过滤和屏蔽,并加强了DFA算法,对特殊字符也能有效的识别并将其过滤,此插件通过减少未成年人接触敏感词、不良信息具有重大意义。
参考文献:
[1] 焦玉英,李法运.国外信息过滤研究进展[C].信息化与信息资源管理学术研讨会,武汉大学,2003.
[2] 庞雅丽,王彩芬.个性化信息过滤技术[J].甘肃科技,2007,23(3):124-126,171.
[3] 牛伟霞,张永奎.潜在语义索引方法在信息过滤中的应用[J].计算机工程与应用,2001,37(9):57-59,62.
[4] 何彬.网络化产品设计信息过滤器的设计与可靠性[D].武汉:武汉理工大学,2005.
[5] 丛健.不良信息过滤技术研究[D].北京:北京邮电大学,2012.
【通联编辑:代影】