基于进程相似性的大规模并行程序在线可扩展分析方法研究

负责人:翟季冬

依托单位:清华大学

批准年份:2011

前往基金查询
项目简介
项目名称
基于进程相似性的大规模并行程序在线可扩展分析方法研究
项目批准号
61103021
学科分类
F020305 信息科学部 _计算机科学 _计算机体系结构 _高性能计算与超级计算机
资助类型
信息科学
负责人
翟季冬
依托单位
清华大学
批准年份
2011
起止时间
201201-201412
批准金额
24.00万元
摘要
高性能计算机的硬件已经进入千万亿次计算时代,但是,大量重要的科学应用程序尚未扩展到相应的计算平台。并行程序可扩展分析技术能够帮助应用开发人员定位并行程序性能瓶颈,改进程序的可扩展性。然而,随着系统规模的逐渐增大,现有可扩展分析方法产生的性能数据已经远超出当前的I/O处理能力,使其无法帮助程序应用到拥有数十万个核的高性能计算平台,这较大地限制了高性能计算领域的发展。针对上述问题,本课题研究工作包括:首先,研究大规模并行程序进程间计算和通信模式的相似性,提出基于通信类型序列和函数调用图的轻量级方式对进程分组,选取代表进程进行性能分析;其次,提出静动态结合的大规模并行程序通信Traces压缩算法,改进现有压缩技术完全动态时猜测通信结构较高的处理开销;最后,提出基于虚拟重叠网络和进程间删冗的在线性能数据采集和分析方法,定位程序的可扩展性瓶颈,改进现有方法较大的离线存储和处理开销。
评论区 (0)
#插入话题