构建基于情境的词汇语义学的计算平台

负责人:周强

依托单位:清华大学

批准年份:2001

前往基金查询
项目简介
项目名称
构建基于情境的词汇语义学的计算平台
项目批准号
60173008
学科分类
F020601 信息科学部 _计算机科学 _自然语言理解与机器翻译 _计算语言学
资助类型
信息科学
负责人
周强
依托单位
清华大学
批准年份
2001
起止时间
200201-200412
批准金额
18.00万元
摘要
因特网上信息的爆炸式增长对文本内容分析和计算技术提出了新的挑战。本项目从词汇意义描述和计算角度对此进行了初步探索,取得了以下研究成果: 1)提出了把情境作为认知图式的数学模型和在概念的生成情境中定义概念和描述概念间关系的做法,并为此提炼了一套数学描述工具,形成了完整的基于情境的词汇语义学描述体系; 2)总结形成了一套基于不同语义词典描述资源的人工提炼情境内容的基本准则和处理方法,并据此开发了一个方便灵活的汉语情境开发支撑平台; 3)人工总结提炼了约140个情境描述,基本上涵盖了人类认知过程中的各个重要的认知图式,初步形成了一个针对常识知识描述的概念结构网络; 4)与其他项目配合,开发完成了100万词规模的汉语句法树库TCT,对包含文学、学术、新闻和应用四大类平衡语料的汉语文本句子进行了详尽的句法信息标注和描述; 5)初步探索了汉语句法成分到语义角色的自动联结算法,取得了较好的实验效果; 以上研究工作初步建立起一个基于情境的词汇内部概念结构描述和内容计算平台,形成了汉语"句法->语义->概念"分析理解的联系通道,为进一步进行面向不同领域的文本挖掘、信息抽取和知识发现研究打下了很好的基础。
评论区 (0)
#插入话题