摘要:
对网络日志数据挖掘预处理技术进行研究,针对Frame页面过滤方法与超时阈值设定进行分析,提出了应用ID3算法改进Frame页面过滤过程中丢失SubFrame页面信息且需要进行站点提升步骤。在超时阈值的设定方面采用动态修正方法,提高预处理技术对长时间会话的识别能力的改进方法。通过实验验证,该方法有效地减少了预处理过程中的信息丢失,同时提高了挖掘结果的精度。
孙宇航,孙应飞. 基于网络日志的数据挖掘预处理改进方法[J]. Journal of Systems Engineering and Electronics, 2009, 31(12): 2994-2997.
SUN Yu-hang, SUN Ying-fei. Improved method of data mining preprocessing based on Web log[J]. Journal of Systems Engineering and Electronics, 2009, 31(12): 2994-2997.