面向中文指称概念的知识获取方法研究

负责人:王石

依托单位:中国科学院计算技术研究所

批准年份:2012

前往基金查询
项目简介
项目名称
面向中文指称概念的知识获取方法研究
项目批准号
61203284
学科分类
F030502 信息科学部 _自动化 _人工智能与知识工程 _知识的表示、发现与获取
资助类型
信息科学
负责人
王石
依托单位
中国科学院计算技术研究所
批准年份
2012
起止时间
201301-201512
批准金额
25.00万元
摘要
指称概念内部蕴含着丰富的知识,由于这些知识具有常识性和高压缩性,基于语料库的方法在获取时遇到了困难。本课题在已构建的大规模中文指称概念库和上下位知识库基础上,研究从指称概念内部获取语义关系的新方法,是对大规模知识库建设的有益补充。首先,结合上下位知识库和语料库度量概念间的语义结构相似性,监督学习指定类型的语义关系,并用语义规则进行知识验证。其次,采用软层次聚类方法,非监督学习指称概念内未指定类型的语义关系,并用词汇-句法模式方法自动分析其元性质,辅助人工关系命名并最终建立层次性的语义关系分类体系。最后,借助于中文指称概念的构词规律,利用后缀频率统计特征和语义验证规则,从指称概念中获取后缀型上下位关系,并基于隐喻词汇和语境特征识别和排除隐喻型上下位。在研究上,本课题可为自然语言深层语义分析这一难题提供思路。在应用中,本方法可结合面向语料库的知识获取系统,建设大规模知识库,为智能系统提供资源。
评论区 (0)
#插入话题