- 相關推薦
非結構化WEB數據庫與圖書館多媒體信息資源的組織利用
【內容提要】針對傳統(tǒng)關系數據庫在處理非結構化多媒體WEB信息中所存在的問題,結合圖書館多媒體數據庫的特點及特定技術要求,介紹了非結構化WEB數據庫的技術特點及其在組織與利用館藏多媒體信息資源中的作用。【摘 要 題】信息資源建設
.
【關 鍵 詞】非結構化WEB數據庫/多媒體/信息資源/組織利用/關系數據庫
【 正 文】
1 非結構化WEB數據庫簡介
非結構化WEB數據庫,是指其字段長度可變,并且每個字段的記錄又可以由可重復或不可重復的子字段構成的基于INTERNET、INTRANET的數據庫,用它不僅可以處理結構化數據(如數字、符號等信息)而且更適合處理非結構化數據(全文文本、圖象、聲音、影視、超媒體等信息)并在互聯(lián)網上發(fā)布。非結構化WEB數據庫主要是針對非結構化數據而產生的,與以往流行的關系數據庫相比,其最大區(qū)別在于它突破了關系數據庫結構定義不易改變和數據定長的限制,支持重復字段、子字段以及變長字段并實現了對變長數據和重復字段進行處理和數據項的變長存儲管理,在處理連續(xù)信息(包括全文信息)和非結構化信息(包括各種多媒體信息)中有著傳統(tǒng)關系型數據庫所無法比擬的優(yōu)勢。
2 圖書館多媒體信息資源的特點及組織利用中的技術要求
2.1 圖書館多媒體信息的數據量非常大,象館藏影視資料和各種多媒體教育(www.xfhttp.com-雪風網絡xfhttp教育網)資料,其動態(tài)圖象信號,每秒可達數兆字節(jié),一段幾分鐘的MP3音樂也有幾兆字節(jié),即使經過壓縮、也十分巨大。如何對多媒體海量數據進行有效地組織、存儲并構成WEB數據庫提供給用戶網上使用,技術要求很高。
2.2 館藏多媒體信息的數據類型很多,包括各種圖文數據、聲音數據、影視數據、超媒體數據、多種格式的隨書光盤等等,其數據長度不固定,結構上的差異大,使得處理這些數據十分困難,要求數據庫既能夠處理可變長度字段又能夠處理可重復的子字段。
2.3 多媒體信息處理在時間上要求很高,多媒體信息中的聲音和動態(tài)圖像對時間特別敏感,在使用這些信息時,必須保證其時間上的要求,否則將會使這些信息失真甚至變得毫無意義。
2.4 開發(fā)利用館藏多媒體信息資源經常要多種信息集成描述,比如某種多媒體,既有圖像,又有聲音,還有文字說明,這樣就會改變傳統(tǒng)的數據庫操作形式和數據庫接口,尤其對圖文并茂的數據庫的建立和查詢,需要統(tǒng)一語義描述。
基于多媒體信息資源的上述特點,要想使館藏豐富的多媒體信息資源得到充分利用,滿足信息用戶不斷增長的信息需求,對多媒體信息處理提出了不同于普通信息處理技術的新要求:
(1) 多媒體數據庫元數據存儲技術要求
我們知道音頻、圖象、視頻等多媒體信息數據是非結構化的,它們不能用簡單的數字解析式表示,多媒體數據庫必須取得基于這些媒體對象內容及信息特征的解釋,才能完成存儲及應用,這些解釋就稱為元數據,通過對元數據的歸類、整理、實現標準化的存儲是多媒體信息資源組織利用的關鍵。多媒體數據庫元數據存儲技術要求包括:文本元數據的存取,語音元數據的存取,圖象元數據的存取,視頻元數據的存取等方面的技術要求。
(2) 多媒體數據庫結構字段設計與數據記錄處理方面的要求
a.允許可變長字段、可重復字段、子字段和MARC字段。
b.數據庫記錄的數目與記錄長度,字段數目與字段長度,字段可重復次數不應受到限制。
c.允許建立可以快速存取的倒排文件和多媒體、多語言記錄表。
d.數據庫可自動接受和產生MARC和ISO2709記錄格式的文件,并且滿足對MEDADATA數據模式的支持功能。
(3) 基于WEB的多媒體信息檢索與信息發(fā)布的技術要求
隨著用戶對于信息需求的大量增加,以及對于多媒體信息的實效性要求,基于WEB的數據庫信息存儲的檢索越來越傾向于多媒體全文信息檢索的查詢語言,并且對于檢索結果的需求也側重于多媒體全文信息的獲取。與此同時,WEB數據庫的信息發(fā)布形式開始更多地過渡到通過網絡瀏覽器以
[1] [2] [3]
【非結構化WEB數據庫與圖書館多媒體信息資源的組織利用】相關文章:
農業(yè)信息資源開發(fā)利用04-28
檔案信息資源的開發(fā)利用04-28
利用Lotus系統(tǒng)開發(fā)Web應用04-27
檔案信息資源開發(fā)利用探析04-29
因特網上的農業(yè)信息資源與檢索利用04-30
利用多媒體輔助地理教學04-28
開發(fā)利用高校檔案信息資源的途徑05-02
基于語義Web的知識組織方法與應用04-29