维吾尔文网络信息内容分析与理解的关键理论和技术研究

负责人:吐尔地·托合提

依托单位:新疆大学

批准年份:2010

前往基金查询
项目简介
项目名称
维吾尔文网络信息内容分析与理解的关键理论和技术研究
项目批准号
61063022
学科分类
F020606 信息科学部 _计算机科学 _自然语言理解与机器翻译 _自然语言处理相关技术
资助类型
信息科学
负责人
吐尔地·托合提
依托单位
新疆大学
批准年份
2010
起止时间
201101-201312
批准金额
25.00万元
摘要
面对迅速增长的WEB数据,如何搜集并从中发现信息,对信息进行分析和理解、提取、组织和处理、如何针对特定的需求获取最新的信息、如何区分有用的信息和无用的"垃圾"信息、如何管理网络信息的传播逐渐成为当前信息科学和技术领域面临的一大挑战。本课题在中英文的新理论、新方法和新技术的基础上,从维吾尔文语言文字特点出发,围绕网络内容分析及理解所涉及的关键理论和技术,开展维吾尔文网路信息的收集和整合(网页采集,文本提取及精化,编码转换,分词,词干切分),文本表示(维吾尔文文本特征提取,特征选取,文本结构化),文本分析(分类,聚类)以及基于统计的维吾尔文网页文档自动摘要等四个方面的研究,建立维吾尔文网络信息内容分析与理解理论体系及技术基础,并通过研发有关算法、工具和平台在相关领域中应用与验证本课题取得的研究成果。
评论区 (0)
#插入话题