不确定性数据流上的频繁项集挖掘关键技术研究

负责人:李海峰

依托单位:中央财经大学

批准年份:2011

前往基金查询
项目简介
项目名称
不确定性数据流上的频繁项集挖掘关键技术研究
项目批准号
61100112
学科分类
F020512 信息科学部 _计算机科学 _计算机应用技术 _知识发现与知识工程
资助类型
信息科学
负责人
李海峰
依托单位
中央财经大学
批准年份
2011
起止时间
201201-201412
批准金额
21.00万元
摘要
静态不确定性数据的挖掘算法开销庞大,难以应用到快速、无限且动态变化的数据流环境中。本项目将围绕计算效率、存储开销、结果实用性和实际应用四个大问题展开系统研究,旨在提出数据流环境中计算资源和存储资源受限时不确定性数据的高质量实时挖掘方法:首先建立不确定性数据频繁项集的合理概念,研究该定义的增量式计算模型和存储方法,采用混合遍历方式和基于数学模型的剪枝策略实现高效实时的挖掘算法;然后提出基于存在概率的项集精简表示方法和挖掘算法,以减少存储开销;进一步,探讨利用参数自适应的Top-k方法实现不确定性数据挖掘的结果质量优化策略,采用SKYLINE方法建立频繁项集挖掘的多目标优化机制;最后,重新定义不确定性数据的关联规则,实现动态的关联规则挖掘算法。本项目的研究可望加强对不确定性数据挖掘问题的认知,为数据挖掘基本技术的研究方向提供新思路,同时算法效率和实用性的提高可以推进信息技术在社会发展中的应用。
评论区 (0)
#插入话题