基于Web知识挖掘与融合的命名实体消歧技术研究

负责人:赵军

依托单位:中国科学院自动化研究所

批准年份:2010

前往基金查询
项目简介
项目名称
基于Web知识挖掘与融合的命名实体消歧技术研究
项目批准号
61070106
学科分类
F020601 信息科学部 _计算机科学 _自然语言理解与机器翻译 _计算语言学
资助类型
信息科学
负责人
赵军
依托单位
中国科学院自动化研究所
批准年份
2010
起止时间
201101-201312
批准金额
36.00万元
摘要
网络知识源数量丰富,如何在信息处理具体任务中,将多源异构知识动态挖掘并有机融合起来为当前目标服务,是一个重要科学问题。本课题以实体排歧为具体任务,研究结构化知识源中的知识挖掘与融合方法、非结构化知识源中的知识挖掘与融合方法,探索多源异构知识在实体排歧中的应用,为网络时代基于知识的信息处理方法寻求有效途径。研究内容包括:(1)提出基于语义图的结构化语义关联方法,对多源异构结构化知识统一建模,并有效挖掘和集成显式和隐藏的结构化知识;(2)建立知识驱动的语言模型,并通过基于相关文档扩展训练集和基于层级结构平滑参数两种手段,解决数据稀疏问题,实现非结构化知识源中知识的有效挖掘与集成;(3)提出基于结构化知识的实体聚类排歧方法,用知识关联替代简单词匹配,提高实体排歧系统的性能;(4)提出基于多源异构知识的实体链接方法,利用实体概念在知识空间中的关联信息辅助概率化语言模型进行实体链接排歧,提高其性能。
评论区 (0)
#插入话题