

摘 要 随着网络的快速发展,通过整合分散的计算资源,搭建分布式并行计算环境进行大规模分布式计算已成为重要趋势。本文分析了现有分布式计算系统结构的本质特征,明确了搭建分布式并行网络系统与现有网络结构之间的矛盾,提出了一种新的基于池化技术架构的分布式并行计算网络连接结构并讨论了其中关键难点问题。
关键词 池化;分布式并行计算;连接结构;网络
1 引言
分布式并行计算近年来一直是国内外计算机界具有重要意义的研究课题,高性能分布式计算发展到今天,通过整合分散的计算资源,调动所有可能的计算资源进行大规模高性能计算已成为一种趋势,也是目前彻底突破计算瓶颈唯一行之有效且廉价的解决方案。而如何组织互联网分散的、互不相识的空闲计算机组成动态的并行工作组是问题的关键,发展的看,构筑分布式并行计算网络系统将成为可能。主要在于两点:
(1) 网络计算资源庞大,但实际利用率非常低,据有关统计表明,系统使用率仅30%左右,有的空闲率竟达91%,如何利用闲散资源构筑强大的并行计算能力已越来越被人们所关注,而分布式并行计算网络环境在经济使用上具有重要的现实意义。
(2) 网络技术得到很大突破,Tbps级传输速率和10-12比特一下的传输差错率将成为现实,网络的带宽局限将得到极大缓解,网上形成庞大而繁杂的各类资源,如何更好管理组织利用这些资源是应用的关键。
2 传统计算机互连结构特征分析
机间互连主要为了实现资源共享、任务并行和容错,其特征是自主性、透明性、并行性、互操作性和可扩展性。传统的计算机互连系统结构主要分为:
图1 池化分布式并行计算网络结构图
(3) 节点服务器:即服务器池中各服务器计算资源,既可为小型机也可为普通PC机。池化系统对服务器的软、硬件类型配置没有任何限制。
(4) 服务器与客户端池化设置软件:控制台安装客户端池化设置软件与服务器池化设置软件,各节点服务器安装服务器池化设置软件。池化设置软件如图2、3所示。
图2 服务器池化设置
图3 客户端池化设置
3.2 池化系统的工作流程
3.2.1形成过程
首先按计算项目的类别划分不同的服务器池,各节点服务器安装池化服务器端设置软件,进行协议、端口号、池策略、池名等设置(同一服务器池内的节点服务
器,池策略必须一致)。然后池化器通过定时发布组播协议监控服务器池内服务器运行状况,并收集服务器性能信息。其后控制台服务器安装池化客户端设置软件,用户登陆控制台发布计算任务。
3.2.2运行过程
用户通过各自密码登陆控制台发布计算任务,控制台自动切割任务后,池化器对池名进行池名解析,并根据预先设置好的池策略将任务“撒进”计算池,各节点服务器接收任务后进行任务计算,最后将各自计算结果汇总至控制台。
3.2.3扩展过程
池化架构分布式并行计算系统具有灵活的扩展性,池化器对所连接的服务器数量没有限制,同时对服务器软、硬件类型配置也没有任何限制,池化器最大可同时容纳1000个会话业务。服务器只需安装池化服务器端设置软件即可加入服务器池。