Internet的发展及其相关技术2

发布时间:2005-03-15 作者:孟祥武 艾波 阅读量:

 Internet的超高速发展,对信息业无论从网络结构、业务分布、管理模式、经营思想等均带来了一场革命,其对信息业的影响也许是100年来最重大和最深刻的一次。

     本刊分3期介绍Internet的应用及其相关技术,上期已介绍了Internet协议、Internet提供的服务、WWW,本期介绍的内容有:WWW、Intranet、Extranet。

 

4.2 WWW的基本要素

      WWW是使多媒体文档能用超链接连接的一种Windows风格的数据传输工具。WWW技术使用户可以通过单击文档中的单词或图像来打开其它的文档,如文本、图像、声音、动画等。

     WWW应用程序可以被限制在企业内部网(Intranet)中使用,也可以设置成可访问整个Internet网络。现在的许多WWW技术都是为Intranet开发的。Intranet从根本上说,就是一个仅对一个封闭节点子网用户开放的应用程序。除了防火墙(防火墙常被用作局域网与Internet连接的网关)外,许多公司还谨慎地采取了一些其它的安全措施。Intranet能被用于发送和接收E-mail、分送和查询信息以及协调本部门和外部门的项目。

    最初的WWW是用来传输文本文档的,但随着WWW浏览器的开发,WWW逐渐成为基于多媒体的技术。WWW浏览器给WWW可访问的多媒体资源提供了一个图形用户接口(GUI)前台。一个WWW服务器访问的第一个页面叫作主页,它通常描述并提供到这个服务器的所有可检索信息的链接。只要单击一个高亮度条或一段加下划线的文本,就可以打开一个包含相关信息的WWW页面链接。链接使用户可以访问本服务器以至世界上任何一个Internet服务器上的信息。

    WWW主要由3种标准元素组成:统一资源定位器(URL)、超文本传输协议(HTTP)和超文本标记语言(HTML)。

 

4.2.1 URL

     URL就是平时所看到的Internet地址(例如,http://www.coriolis.com)。URL通过多种协议寻找资源地址以定位Internet上的数据。URL可以通过HTTP识别文档、指明E-mail地址、通过FTP传输文件以及访问Gopher菜单。

     URL变换的格式取决于所使用的协议。一个URL可分为3部分:使用的协议、建立连接的服务器以及文件存取路径。一般的(当然也有特殊情况)URL的格式是:proto-col://servername:port/path。

     通常,“:port”段会被省略,由URL为使用的协议指定一个缺省端口。端口号是作为一种标识分配给网上计算机间通信的软件程序的。服务器名可以被定义为大写或者小写,也可以用一个IP地址或一个主机名来代替。IP地址是用来标识主机以及网络中主机位置的一串数字。主机名通常与域名保持一致。

    通常,WWW使用HTTP协议在Internet上传输信息。客户机利用HTTP从服务器取数据的步骤分为3步:

(1)客户机与服务器建立连接;

(2)客户机向服务器发一个对指定文档的请求;

(3)服务器在发送对象以及与对象有关的信息的同时,通过一个状态码给对方响应。

     状态码通常用来指示请求是否被接受,另外还有一些代码用来显示传输中的各种错误。对象的信息域可以包含大量的信息,包括:

.文件内容类型(例如可执行文件、图形文件或HTML文件);

.文件最后依次被修改的日期;

.文档语言代码;

.文档的有效截止日期。

    客户浏览器可使用内容类型域来判断如何处理要检索的信息(例如图形、声音等)。此外,浏览器还可利用最后一次被修改的时间来减少大的图片和比特型图形的重复传输。最近一次的传输被保存在浏览器中,如果最后一次被修改日期不变,下次浏览该文档时将不再进行传输。

 

4.2.2 HTTP

     HTTP被定义为一种用于增加数据传输速率的“无状态协议”。所谓“无状态协议”表示HTTP不需要保存与一个请求到另一个请求的连接有关的任何信息。协议的状态在URL中设置而无须在内部定义状态。

     需注意的是,URL是区分大小写的,因此必须精确地输入地址。

     HTTP的一个连接只能对应一个请求,因此它也是“无连接”的。处理完一个请求后,就开始建立客户机到服务器的连接。对每一个客户请求都要建立一个新的服务器的连接。对包含许多图片的WWW页面进行检索需要花很长的时间,因为必须对每一个图形建立一个连接。有些浏览器,像Netscape和Ex-plorer,可以同时打开多个连接以同时传输多个文档;而有些浏览器只能一次打开一个连接,即处理一个请求,因此传输文档要慢得多。

 

4.2.3 HTML

     HTML是标准通用标记语言(SGML)的一个延伸。另外还有一些其它的标记语言,包括LaTex、RTF和Frame。标记语言通过给每一种应用附上特殊的“标签”来区分文本域。可以使用HTML在文档间建立超文本链接以提供传输机制。通过用与其它文档相关的代码来标记文档以在Internet上实现交互,这样就形成了WWW。

     HTML是专门为WWW上客户与服务器共同识别的一种语言,是一种由标识来表示某些特性或功能的描述语言。它是由WWW的管理员或主页的设计者编写出来的HTML文本文件,存放在由Internet服务器软件HTTPD指定的存放位置,如Documnet Root所指定目录。

    如果你是WWW的管理员,在建立WWW服务器时,一般都要规定你的HTML存放目录,即服务器配置文件都要指定Document Root的目录位置,并且缺省运行的主HTML文件一般是index.html、in-dex.htm或defaut.html等。

     如果你仅仅是一个电话拨入的个人帐户,在WWW管理许可情况下也可以建立你的个人主页。只要在你的个人用户目录下建一个pub-lic_html目录,并把写好的HTML程序放在public_html下。任何人就可以通过访问URL:http://your-ac-count-host-url/~your-account,看到你的主页了。

     HTML的元素由HTML1.0、HTML2.0、HTML3.0、HTML3.2以及Netscape的扩展元素组成。有关HTML的标准请参见相关描述文档。

     为了访问Internet和WWW,必须有一台称为网络主机的计算机。局域网必须连到一台网络主机上。本地网和Internet的连接点叫作路由器,实际上是桥接局域网和Internet的特殊计算机。专用电话线增加了Internet物理网络的远程能力。远程计算机通过专用电话线与连接到In-ternet上的局域网相连。

 

5 Intranet

 

     1995年,Intranet一词开始流行。部分企业开始试图把WWW服务器用于企业内部信息共享。

     1996年,形成Intranet热,WWW服务器与数据库的连接工具相继出台,先进企业开始利用In-tranet。

     1997年,“Intranet是企业信息系统的基础”得到业界的认同,In-tranet工具及相应产品急剧增多,组建Intranet的企业也急剧增多。

 

5.1 Intranet的优势

     Intranet的实际效果是十分显著的,如节约客户机端的软件费用、减轻远程运行管理负荷等。

     为了利用客户机/服务器(C/S)版软件,一般要在客户机端安装和维护与数据库通信的接口软件和专门为应用开发的客户机端软件模块,并需要进行用户化的定制设置,每台客户机端的软件费可能很高。另外,C/S版软件由于软件费用的原因用户难以发展。若能利用WWW浏览器,就不需要在客户机端配置另外的软件,这样就可大大节约客户机端软件的安装和维护费用,由于操作方式基本一致,培训也比较简单。

    基于浏览器/服务器(B/S)结构,系统软件的安装和维护均可集中在服务器端,以减少用户这方面的工作量。

    由于不需要适应不同客户机平台的特殊性,Intranet避免了分别开发客户软件而造成的浪费。Intranet软件的开发适于快速集中进行,开发好的软件又可以快速地推广使用,这样也提高了系统和信息的利用率。

 

5.2 Intranet的现存问题

    当然,在Intranet的运营中也出现了许多新课题,这些课题随In-tranet的用途不同而稍有区别。

    当将Intranet作为全公司信息共享的基础时,关键是如何构建顺畅通信的运营体制,因此应做到:

(1)组建、准备用户可以简单登录信息的机制。如果掌握有用信息的管理部门不发布信息,Intranet成功的希望就很渺茫。

(2)经常整理、维护所存储信息的内容,与业务部门协同,保持信息的“新鲜度”,同时要防止信息内容充斥泛滥和防止不该公开的信息公开。可以在每个部门都任命信息发布负责人,并制定信息发布规则,使Intranet上的每页信息都清楚地标明信息发布负责人。Intranet上未标明信息发布负责人的信息将被视为“电子信息垃圾”而被及时清除。

(3)统一文档格式,使所有用户都能阅读信息。浏览器能表示的格式较少,一般只表示HTML形式的文本、JPEG形式的图像和GIF形式的图像等3种类型。要想处理这3种类型以外的数据,WWW浏览器中就必须装入追加功能的程序(即插件模块)。但这对于一般用户来说是太难了,因此应尽可能使Intranet上的文档格式统一。所以,要制定In-tranet上登录文档格式标准,并彻底贯彻执行。

     技术上最大的新课题是用In-tranet实现信息共享时,必须有全面周密的访问权限控制,根据用户标识符(ID)和保密字,来控制每个用户可利用的信息内容和功能。例如,无关人员不能查看经营信息,任何用户不能更改他人的个人信息等等。

    目前可利用的访问控制方式有:

(1)使用WWW服务器产品中所备有的标准访问控制功能;

(2)用外部程序开发访问控制机制;

(3)使用专门的访问控制软件。

    3种方式各有长短,要根据实际需要的访问控制级别进行选择。

     另外,Intranet本来是利用Inter-net技术来进行信息的发布和阅览的,若将它应用于实际的业务系统,则引发出一系列问题。

例如,Intranet系统易用性方面一般稍逊于C/S系统;在HTML的表现方面,不仅难以做成精致的用户接口,而且处理和显示速度都慢;再者,如果原封不动地使用WWW服务器和WWW浏览器间的通信协议HTTP,很难用于数据库的更新处理,也难以实现一些比较复杂的检索处理。HTTP是非常简单的协议,它响应来自WWW浏览器的申请,传送位于所指定URL处的文件。每传送一次文件,会话就被中断,所以不能保证事务处理的连续性。

      虽然这些问题将来一定能够解决,但就目前Intranet的功能而言,它还很难完全取代所有的C/S系统。因此,在构建Intranet时,应首先使用当前的成熟技术,从替代以全公司信息共享和信息检索为中心的C/S系统开始,逐步扩大应用领域,这对于企业用户来说,不失为上策。很好地运用Intranet技术将有望实现信息系统演进过程中的“内部有效性”。

 

5.3 基于Web的数据库访问

    要把Intranet用于企业核心业务处理,就必须实现Web服务器与数据库访问的完美结合,基于Web的数据库访问为克服C/S系统在规模和灵活性方面的问题提供了广阔空间。图1基本描述了这一思路下的体系结构。

     在客户端应用软件的基本运行环境是Browser,借助Java虚拟机和各种媒体插件,一方面为用户提供丰富的人机界面,另一方面为应用软件的运行提供了统一的环境;中间的业务逻辑层重点实现原先分布在客户端和服务器端的业务处理能力,使业务逻辑的开发相对集中,便于管理和维护,便于跟踪业务流程和业务规则的变化而及时更新软件;分布式信息访问层使业务软件的运行可以利用广泛的信息源,其作用完全类似于“中间件”;针对一些特殊应用,表示层将业务处理结果转化为特定的形式,并与Web服务器共同以HTML方式把它在网络上发布出去。

     这一结构在服务器端的几乎每个层次都可以独立运行或以不同的方式组合在一台计算机上运行,这些系统的运行并不局限在特定的计算机环境中,但是它们应该符合一定的接口规范。

 

6 Extranet

 

6.1 Extranet的基本概念

    企业外部网(Extranet)是Intranet的延伸和扩展,被视为企业信息系统的一种新的应用形态。Extranet是把Intranet的技术应用到企业与企业之间的系统中。

   Intranet可定义为利用WWW技术构建的企业内部信息系统,使用范围局限于一个企业内部或一个企业集团的内部。而Extranet则把利用WWW技术构建的信息系统的使用范围扩大到特定的外部企业。具体说来,就是将交易地点、合作地点及与本企业有关的公司、销售店以及固定客户等纳入到信息系统中来。

    在Extranet中,使用Intranet代替用户电话网和WAN来实现企业间的连接。在要求必须确保安全保密的场合,要配置专用的通信设备,构建虚拟专用网络(VPN)。所谓的VPN就是使用公共通信网虚拟构建的专用网络,像专线一样,只有特定的用户方可使用。

     在利用Internet构建VPN时,必须把只让具有特定IP地址的数据通过的所谓“隧道”功能和具有加密功能的路由器或防火墙设置在In-tranet的连接点。由电子邮件和文件传送所实现的数据交换不包含在Extranet中,这是狭义的Extranet定义。但是,按此定义的Extranet在实用上有所欠缺。在实际的企业系统中,不仅是WWW应用,还要求有C/S型应用。许多企业还想使用In-ternet以外的其它网络与对方实现连接。所以,在此给出了广义的Ex-tranet定义。把使用ISDN和帧中继等这类Internet以外的网络作为通信线路、用TCP/IP进行通信的形态也包含在Extranet中。用电子邮件和文件传送所实现的数据交换,以及在特定企业间使用确保安全保密的TCP/IP网络的情况,也都可以包含在Extranet中。

 

(收稿日期:1998-11-18)