集成噪声数据清洗的中文UGC评论挖掘理论与方法研究

负责人:芦鹏宇

依托单位:哈尔滨工业大学

批准年份:2010

前往基金查询
项目简介
项目名称
集成噪声数据清洗的中文UGC评论挖掘理论与方法研究
项目批准号
71071041
学科分类
G011201 管理科学部 _管理科学与工程 _服务科学与工程
资助类型
管理科学
负责人
芦鹏宇
依托单位
哈尔滨工业大学
批准年份
2010
起止时间
201101-201312
批准金额
27.00万元
摘要
随着Web2.0时代的到来,面向UGC的评论挖掘的重要性日渐明显。然而,现有的研究主要集中于对英文在线评论进行分析,针对中文客户评论的相关研究仍处于起步阶段。本研究将采用中国电子商务数据对中文UGC在线产品评论进行分析,探索集成噪声数据清洗的中文UGC评论挖掘的理论与方法。课题的研究工作将主要围绕两个方面展开:1)通过对领域评论知识的表示方法、产品特征词汇与评论词汇的抽取及扩展方法、评论词汇的极性标注及其倾向强度判别方法等的研究,提出领域评论知识库的创建理论与方法,填补目前对该理论研究的空白;2)通过对中文UGC的噪声分析与清洗方法、中文在线评论的评论表达式识别方法、评论结果集的集成方法等的研究,建立集成噪声数据清洗的中文UGC评论分析理论与方法,为实现中文评论的在线分析奠定理论基础。本研究的成果将帮助企业深入理解互联网上的客户评论信息,从而提高企业竞争优势。
评论区 (0)
#插入话题