分布式计算环境下的管理工具

发布时间:2005-03-22 作者:马小骏Ma Xiaojun 顾冠群Gu Guanqun 阅读量:

随着现代通信技术的高速发展,

通信系统的规模越来越大,随之而来的

分布式计算环境下的管理问题已越来越受到

人们的关注……

 

 

1 引言

 

    70年代是主机型系统发展的年代,当时管理员的主要任务是主机系统的管理。80年代,网络的飞速发展和客户机/服务器结构系统的迅速崛起,使得管理员不仅要管理服务器、客户机,还要管理网络设备、通信介质等。

    90年代,随着信息技术的迅速发展,一方面网络的规模越来越大,另一方面网络中有着各种不同的操作平台和不同的应用软件在运行。按照传统的解决方案,不同的系统、不同的应用程序需要有相应的管理人员进行管理,不但增加了管理人员的负担,同时还降低了工作效率。

    针对如何更有效地管理分布式计算环境下的各种资源,不会因为一些意想不到的情况而导致系统崩溃这个问题,许多著名的公司如CA、HP、Tivoli、 BMC等公司总结过去的管理经验,各自推出了自己的管理工具,这些管理工具都为分布式计算环境管理信息技术资源提供了很好的解决方案。

 

 

 

2 管理工具的结构和功能

 

    管理工具一般采用管理者/代理人的体系结构,使用户得以跨越不同系统,在整个网络上运行。网络上的任何管理用的计算机可称作“管理者”,而被管理的计算机都可以称作“代理人”,管理者和代理人是相对而言的,按照树形结构,以此展开。

一个好的管理工具应该具有如下特点:

(1)支持商业用各种传统的和流行的平台、数据库、应用软件和因特网(Internet)等。

(2)管理各种类型的网络,从局域网(LAN)到广域网(WAN),从桌面系统到Internet。

(3)在管理分布式计算环境下的各种资源时,应能提供一个统一、开放的界面。

(4)提供一系列广泛的开发工具、应用接口和可控代理节点,使用户能够将安全性和性能监控等功能集成到自己的应用程序中去。

管理工具的基本功能和组成结构可用图1描述。

管理工具由两部分组成,即管理工具框架和功能模块。

    管理工具框架是管理工具操作的平台。它为用户管理各种计算资源提供一个统一的界面,并提供一系列的开发工具和公共接口,利用这些工具和标准接口,用户很容易把自己的安全策略加进管理工具框架。如某个应用程序经常要产生大量的数据,为了保证不会因为磁盘满而导致应用程序无法正常运行,可以在应用程序中加入相应的检测警告信息,通过管理工具提供的接口,把安全策略加入管理工具中。

    另外,好的管理工具应该和第3方合作,如Orcale、Sybase数据库等,使得在使用由这些数据库开发的应用程序时更容易和管理工具结合起来。

功能模块则是由管理工具提供的帮助管理员管理各种计算资源的程序集合。它包括:

资源配置管理模块、事件管理模块、安全性管理模块、管理操作模块。下面分别加以介绍。

 

2.1 资源配置管理模块

    资源配置管理包括软件分发和系统配置等。计算资源的日趋分布是网络规模不断扩大的必然结果。系统的更新、软件的升级对管理员而言,是一个严峻的挑战。管理员要到各个地方帮助安装软件,而且不但要了解应用程序的安装过程,还要熟悉各种操作系统的命令和配置,以便在软件安装时根据某些系统的配置作具体的调整。因而优秀的管理工具应能够智能地帮助管理员做到以下几方面的工作:

.帮助管理员随时了解某远程系统所安装的应用程序或正在运行的软件。

.帮助管理员自动安装软件。

.软件在某计算机上安装时是否有问题,有什么问题,以及如何解决。

当要向许多分布的或远程的计算机分发一个软件时,管理员可以在一台典型的计算机上,预先安装一遍,管理工具则能作一次“快照”,把安装时的配置信息自动记录下来,产生一个安装配置表,并自动产生一个文件包,把安装配置表和要被安装的软件打成一个包。下一次在同种类型的计算机上安装时,只需运行这个文件包。它首先自动解包,然后能按照安装配置表自动地安装软件。在安装过程中,如果碰到某个问题不能安装下去,则首先记录下出现问题的各种状态、配置参数,接着恢复到安装前的状态,然后再通过下述的事件管理功能,向监控台报告情况。

    当然,需申明的是,自动安装要求两台计算机的操作系统要一致。对于需分别在不同操作系统上安装的软件,可分别选取不同操作系统的计算机进行预装,以生成不同的文件包。

    另外,当某台计算机发生故障,管理员发现或者用户向管理员发出求救信号时,管理员可以不用赶到现场,而只需在管理中心,通过自己的计算机即可接管远程计算机并对其进行配置管理,当然,这应在网络带宽允许的范围内。

 

2.2 事件管理模块

    随着计算机的普及和网络的延伸,企业的运作越来越依赖于它的网络计算环境,某些关键应用程序的崩溃常常会给企业带来重大的损失。

事件管理程序应提供一个实时事件监视器——控制台,它显示操作系统、系统管理和网络的活动。例如,违反安全的活动、作业活动、操作系统的问题和应用程序的消息都显示在控制台上。

    所有消息和事件都写入一个永久性的记录文件中,该文件可作为管理报告的输入,并为各种活动保持一个历史记录。这个记录文件记录了所有违反安全性的活动和允许的资源访问。“记录”权限功能允许用户访问资源,但同时也将一条消息发送到事件管理程序进行记录,这个记录文件也就是违例报告的基础。通过事件管理程序,可以设置、告知管理程序在截获所选择的消息时采取一个或多个动作,例如:

.对消息作出响应;

.禁止消息传递;

.把信息传到其它已管理的平台;

.发布要在其它平台执行的命令;

.解释所有动作的结果,以便确定是否需要其它动作;

.开始其它的程序或命令文本。

    需要强调的是,在事件管理程序中,管理员能够在管理中心很方便地设置一些可用性策略,并通过网络很方便地传送到远程目标系统。如某台计算机的硬盘剩余空间只有10Mbyte时,向控制台报警或自动归档以腾出空间等。

 

2.3 安全性管理模块

    安全性管理的重要性不言而喻。由于不同的操作平台有着不同的安全策略,因此管理员必须在不同平台下定义各自的用户,以实现其安全策略。

先进的管理工具在安全性管理方面可用模型来描述。

    操作系统对管理员是透明的,无论被管理对象的操作平台是UNIX、Windows、Win-dows95、Windows NT 、OS2等,还是其它平台,在管理员看来,其安全策略都是一致的,如用户的定义、权限的设置、对各种资源的访问级别等等。也就是说,管理工具定义了唯一的一种基于策略的安全模型,管理员使用起来非常方便,不必浪费更多的时间熟悉各种不同操作平台的安全策略。

    操作系统一般通过定义用户、用户组,以及不同用户、用户组的访问权限来实现安全控制,当然这些都是最基本的,在此基础上还可以对它进行改进,以增强安全控制功能。如可以再增加所谓“角色”来方便管理,也就是说,可以把某些具有类似性质的用户或用户组放在一起,赋予它在一段时间内可以访问某些特殊资源的权利,过期后,“角色”自动作废。

    我们还可通过管理工具定义某些特殊级别的资源,如某些应用程序可以被授权用户访问、执行,但绝对不允许被拷贝,即使是系统管理员也一样。

 

2.4 管理操作模块

该模块应提供以下功能:

(1)资源监控

当管理员发现网络流量异常大时,管理员可以分别选择各资源对象,主动查看网络设备、计算机。管理工具应支持简单网络管理协议(SNMP)。管理员不用到现场,只要在管理中心,就能很方便地监视各网络资源,甚至是某台计算机的流量情况。

管理员还可通过设置,由管理工具记录出现这些情况的事件、位置等,以帮助分析出现这种情况的原因。

(2)任务管理

管理员可以制订一些策略来使系统自动运行某些应用程序。例如:时间触发方式,到达某一时间,系统自动运行某一程序;事件触发方式,当某一事件发生,则另一程序自动开始运行。

(3)备份

管理员可以定义一个备份策略,如批处理备份,每周或每月备份一次。为了确保可以恢复当前的文件版本,还可以定义一种每天的增量备份,增量备份只备份那些自上次备份以来有所改变的文件。

(4)归档

    管理员可把没有使用过、或在一段时间内不使用的文件安全地归档,为新的工作留出空间。归档中,系统可能使用一种所谓的智能透明恢复。如果一个用户或者一个程序试图访问一个已归档的文件,智能透明恢复将检测到这个访问行动,“挂起”这个操作,然后恢复该文件并继续运行。因此,即使必要的文件已归档,重要的生产工作仍将继续运行。

     还有一种方式,谓之阀值归档。当硬盘使用超过90%,系统根据最早、最少使用原则,把长期没有被访问或很少访问的文件,优先归档。

另外,管理工具还应提供资源核算记费、报表发送等功能。

 

 

3 结论

 

    以上介绍了分布式计算环境下的管理工具的基本模型,随着企业的运作日趋依赖于分布式环境,选择一个具有如下特征的管理工具将对系统很重要:

.确保支持现在和以后的新平台;

.所有功能密切配合;

    .开放、可互操作,适应各种平台;.有一个可定制的界面,能灵活地适应不同用户的独特要求。□

 

[摘要] 本文介绍了分布式计算环境下管理工具中的资源配置管理、事件管理、安全性管理以及管理操作等功能模块,描述了管理工具应该具有的结构和功能。

[关键词] 资源配置管理 事件管理 安全性管理 管理工具

[Abstract] The function modulars of re-source allocation management,event management and safety management as well as the man-agement operation modular of the management tool applied under a distributed computing environment are introduced and the architec-ture and functions that the man-agement tool should possess are expounded.

[Keywords] Resource allocation manage-ment Event management Safety management Management tool