一、導言
政府信息資源是一切產生于政府內部或雖然產生于政府外部但對政府活動有影響的信息資源的統(tǒng)稱。由于政府總以某種方式與人們的工作和生活的每一方面直接或間接相聯(lián)系,因此,政府信息資源的總量常常多得驚人,甚至達到無法計數的地步。據統(tǒng)計,目前各級政府部門大約集聚了全社會信息資源總量的80%。這些信息資源常常比一般的信息資源更有價值,其質量和可信度也較高,并且直接關系到國民經濟與社會發(fā)展的狀況和水平。如何加強管理、綜合開發(fā)和有效利用這些資源已經成為各級政府工作的當務之急,也是一個值得研究和探討的新領域。
二、研究現(xiàn)狀
?、眹庹畔①Y源定位服務由于元數據能夠處理各種形式的信息,包括數字化及非數字化的信息,特別是能較好地解決網絡信息的發(fā)現(xiàn)、控制和管理問題,因此,目前在國際上已廣泛應用在包括政府信息、博物館藏品、檔案等各種類型的信息中。目前政府信息的元數據格式主要有兩種:政府信息指引服務(Government I Locater Service,GILS)及都柏林核心元 數據集(Dublin Core,DC)。其中依照GIL 發(fā)展指引服務的國家較多,包括美國、 加拿大、日本、俄羅斯等;以Dublin 為構建系統(tǒng)標準的有澳大利亞。在系統(tǒng) 規(guī)格方面,主要遵循Z39.50(信息檢索 應用服務定義和協(xié)議規(guī)范,1996年被 ISO正式確定為信息檢索的國際標準) 的信息檢索標準,可跨資料庫、跨機構 組織,甚至跨國界,以單一檢索界面檢 索所需的政府信息資源,使政府信息資 源的共享朝著全球一體化的方向發(fā)展。 美國等發(fā)達國家從20世紀70-80年 代就開始研究和出臺了一系列管理政策,對政府信息資源進行管理。為了整合政府的公共信息資源,為公眾提供單一窗口的政府信息導航、檢索與定位服務,1994年12月,美國商務部將政府信息定位服務GILS計劃作為聯(lián)邦政府信息處理標準(FIPS 192)頒發(fā),公布正式建立GILS政府信息定位服務。此公告要求所有政府機構必須實行GILS檢索系統(tǒng)的使用。美國將GILS作為政府信息基礎設施的核心組成部分進行建設。
⒉我國政務信息資源目錄體系建設
為充分發(fā)揮信息資源開發(fā)利用在信息化建設中的重要作用,《中共中央辦公廳國務院辦公廳關于加強信息資源開發(fā)利用工作的若干意見》(中辦發(fā)[2004Core34號)、《國家信息化領導小組關于我國電子政務建設指導意見》(中辦發(fā)[200217號)兩個文件中都明確提出了建設政務信息資源目錄體系的任務。為貫徹文件精神,加快政務信息資源開發(fā)利用建設,解決政府部門間信息資源的查詢和共享,促進跨行業(yè)、跨部門、跨地區(qū)的互連互通,國務院信息化工作辦公室組織相關部門編寫了政務信息資源目錄體系標準。國家電子政務標準化總體組于2004年11月組建了政務信息資源目錄體系與交換體系標準編寫組,積極開展該標準編寫工作,并廣泛、認真地征求專家、部委、地方各方面的意見和建議,對該標準予以反復修改,最終形成了政務信息資源目錄體系與交換體系》標準征求意見稿。國家標準委2005年8月正式批準成立了政務信息資源目錄體系與交換體系標準工作組,并于9月底召開了該工作組會議,通過了該標準的征求意見稿。
《政務信息資源目錄體系與交換體系》中將政務信息資源目錄體系定為:采集、存儲、使用和管理政務信資源目錄內容,通過元數據信息的定位和發(fā)現(xiàn),實現(xiàn)政務信息資源共享的統(tǒng)。從實踐意義上看,建設政務信息源目錄體系,就是要對部門間政務信資源進行梳理和整合,進行分級、分點、分布式的組織和管理。它體現(xiàn)了種政務資源的內在關聯(lián),是信息資源享和服務的一套工具;是方便信息資檢索、定位和共享的應用服務體系。
三、關鍵技術研究
?、痹獢祿槿〖夹g
政務信息資源目錄體系中元數據式,將遵循國家《政務信息資源目錄系》標準中的核心元數據標準。元數抽取技術是指從Web頁面等格式化態(tài)的政務信息資源中,依照某一元數標準,自動生產元數據的技術。元數抽取基于采集系統(tǒng)和存儲系統(tǒng)實現(xiàn),其原理如圖1所示。

⑴采集系統(tǒng)
采集系統(tǒng)針對一個專題,分以下步進行數據采集:
——利用搜索引擎,對設定的專進行泛搜索,確定探索的范圍;
——利用網絡蜘蛛,在確定的探索范圍內進行泛探索,探尋可能有價值站點
——對有價值的信息源進行監(jiān)視,定時捕獲更新的內容;
——數據清洗,對捕獲的內容進行清洗,只保留關注的有價值的信息。
⑵存儲系統(tǒng)
存儲系統(tǒng)把捕獲的Web頁面分解為元數據,并對其分類保存。在這里,存儲的概念不僅是把數據放到數據庫或者保存到硬盤上,更重要的是根據一定的目錄體系標準,把數據分解為元數據,然后進行存儲。
?、苍獢祿芾砑夹g
政務信息資源目錄體系中元數據的管理包括元數據的命名、發(fā)布和訪問,并為用戶提供統(tǒng)一的訪問接口。目錄體系中的所有元數據構成元數據目錄。在元數據目錄中,采用統(tǒng)一的結構來描述元數據,并提供訪問API(Applicat Programming Interface,應用程序接口),通過API可以插入、更新、刪除、查詢目錄中的數據。它為元數據目錄提供統(tǒng)一的邏輯視圖,實際的元數據目錄可以是多個異構的、分布式的副本的目錄。
《政務信息資源目錄體系》標準中對于元數據的命名規(guī)則、編碼方式以及目錄接口API等技術要求都有明確描述,在實現(xiàn)中只要嚴格遵循這些描述即可。
?、衬夸浄占夹g
在現(xiàn)實應用中,目錄服務被賦予兩種范圍的含義。其一是較為含混的:任何一個提供分布的用戶命名管理的系統(tǒng) 服務都被冠以目錄服務的名稱。例如Email系統(tǒng)中的用戶帳號管理系統(tǒng),NTDomain管理系統(tǒng)等。另一個較為嚴格:目錄服務被定義成基于X.500系列建議的基于分布網絡信息處理的、有層次結構的目標管理體系。例如,Novell公司的Novell目錄服務(NDS),基于LDAP(Lightweight Directory ACC輕量級目錄訪問協(xié)議)的Internet目錄訪問服務,等等。目前,人們基本采用后者的定義來判斷一種服務是否為目錄服務。
目錄服務提供元數據目錄的統(tǒng)一邏輯視圖,實現(xiàn)單一系統(tǒng)映像。在實際應用中,元數據目錄可以采用分布式存儲,每個管理域可以設置一個元數據目錄。政務信息資源目錄體系的所有服務都使用元數據目錄中存儲的信息,并通過目錄服務協(xié)議訪問元數據。應用程序的其它服務在使用元數據信息時,通過元目錄服務協(xié)議訪問元數據。各服務之間需要通過軟件進行相互協(xié)同。異構形式的網絡應用,如Email、數據庫服務、Internet/Intranet訪問等,采用同構的目錄服務。多種應用共享一套資源信息,避免了管理上的重復操作和多系統(tǒng)間的不協(xié)調,提高了應用系統(tǒng)的身份驗證安全等級,降低了管理的復雜度,也方便了用戶的使用(參見圖2)。
基于LDAP實現(xiàn)的政務信息資源目錄體系,可順利地訪問所有授權的網絡資源。具有能在單臺服務器或全球多服務器網絡上管理所有網絡資源的強大功能,是一種跨平臺、跨地域的目錄服務,且在不同的服務器上只需登錄一次,就可享受到政務信息資源目錄體系的服務。
四、系統(tǒng)設計實現(xiàn)
?、斌w系框架
政務信息資源目錄體系框架由信息庫系統(tǒng)、標準規(guī)范、技術支撐平臺、管理機制和服務模式構成。目錄體系建設和使用過程中存在三類角色:信息提供者、信息使用者和目錄信息管理者,信息提供者確保編目信息的正確性和實時性,信息管理者負責目錄信息的管理、安全、服務(參見圖3)。

?、蚕到y(tǒng)架構
目錄體系分為國家目錄中心、省級目錄中心、地市目錄中心和縣級目錄中心四級。目錄中心是獨立或托管的平臺系統(tǒng)(參見圖4)。在國家目錄中心建立一個統(tǒng)一的全國各目錄中心網絡地址表,各級目錄中心能夠獲得全國各地的目錄中心網絡地址,實現(xiàn)各級目錄中心跨地區(qū)的目錄中心訪問。各目錄中心為同級各部門建立固定的目錄區(qū)域。各部門需要進行一次確定身份的登錄注冊。每個部門負責維護目錄中心的各自的部門資源服務目錄及資源目錄。
⒊技術架構
政務信息資源目錄體系從技術架構角度劃分為四個系統(tǒng):編目系統(tǒng)、目錄報送系統(tǒng)、目錄管理系統(tǒng)和目錄服務系統(tǒng),如圖5所示。
?、啪幠肯到y(tǒng)
基于核心元數據標準開發(fā)的元數據生成工具,從不同形態(tài)的政務信息資源中,抽取出元數據,生成目錄。其主要功能如下:
——元數據生成:針對已有目錄,采用轉換方式生成元數據;針對網頁、數據庫、電子文件,采用自動抽取的方式生成元數據;針對其他資源,也可利用手工方式進行元數據錄入。
——資源編碼:使用資源編碼的前段碼并賦予后段碼,生成資源ID。
——資源分類:對政務資源進行分類,以自動為主,以手工為輔。
?、颇夸泩笏拖到y(tǒng)
政務信息資源目錄體系利用電子政務專網實現(xiàn)元數據報送。數據報送系統(tǒng)的功能主要將各部門前置機的元數據報送到所對應的目錄服務中心。
?、悄夸浌芾硐到y(tǒng)
目錄管理系統(tǒng)包括數據互訪平臺、元數據管理平臺和系統(tǒng)管理平臺。通過各平臺實現(xiàn)對目錄數據服務的集中管理。它們各自的主要功能如下:
——數據互訪平臺:構筑一個抽象層的數據服務平臺,構筑邏輯上集中,物理上分散的虛擬數據庫,并按照標準來對外提供目錄數據發(fā)布和目錄數據注冊服務。
——元數據管理平臺:用于管理元數據的注冊、更新、刪除,并擔負元數據有效性檢查的工作。
——系統(tǒng)管理平臺:提供了數據庫系統(tǒng)和接口組件服務器的配置,數據的備份、遷移、認證,用戶管理等功能,是提高系統(tǒng)運行可靠性和提高系統(tǒng)可維護性的關鍵。
?、饶夸浄障到y(tǒng)
發(fā)布系統(tǒng)通過發(fā)布與查詢服務器將元數據按照多種分類方式發(fā)布到政務目錄中心網站,供使用者進行瀏覽、查詢。發(fā)布方式依據資源分類標準,在Web頁面展現(xiàn)數據,并以多種查詢方式向用戶提供目錄服務。
五、結束語
政務信息資源目錄體系建設是一項長期、細致、復雜的工作,同時是信息時代一項嶄新的課題,其涉及的范圍廣、部門多。因此在其具體建設實施時必須遵循國家制定的相關標準和規(guī)范,將不同種類信息資源進行統(tǒng)一描述,并根據應用需求建立各種目錄分類方法,為存放分散、種類繁多的政務信息資源提供檢索和導航服務。政務信息資源目錄體系的逐漸完善,必將促進對政務信息資源的進一步開發(fā)和利用。