特定主题社会化媒体内容的动态识别关键技术研究

负责人:叶允明

依托单位:哈尔滨工业大学

批准年份:2010

前往基金查询
项目简介
项目名称
特定主题社会化媒体内容的动态识别关键技术研究
项目批准号
61073195
学科分类
F020807 信息科学部 _计算机科学 _计算机网络 _网络行为学与网络生态学
资助类型
信息科学
负责人
叶允明
依托单位
哈尔滨工业大学
批准年份
2010
起止时间
201101-201312
批准金额
30.00万元
摘要
随着博客、wiki、微博等社会化媒体的普及应用,如何从社会化媒体文本流中动态识别出特定主题的内容已成为很多应用领域广泛关注的问题。这个应用问题可以转换为文本流动态分类问题,其关键研究难点是:在小样本和无增量训练样本的条件下,如何使分类算法能自动从无类标数据中学习,进而能动态更新和优化分类模型,最终使分类器的精度能随时间的推移不断提高。本课题围绕这个关键问题,在分析社会化媒体文本流特征的基础上,研究基于聚类树分类和集成学习的文本流动态分类模型,以及该模型下的关键算法:(1)聚类树学习算法,用于解决小样本半监督学习问题;(2)主题漂移检测算法,用于解决分类模型何时更新的问题;(3)基于聚类树森林的动态识别算法,用于解决分类模型如何更新的问题。课题的创新在于:基于动态聚类树集成学习的社会化媒体文本流分类模型;基于聚类簇概念相似性计算的主题漂移检测算法;基于误差估计的分类模型动态更新算法。
评论区 (0)
#插入话题