關於網絡信息檢索論文

信息檢索是指信息按一定的方式組織起來,並根據信息用戶的需要找出有關的信息的過程和技術。下面小編爲大家搜索整理了關於網絡信息檢索論文,希望對大家有所幫助。

關於網絡信息檢索論文

淺談網絡信息檢索的現狀及其發展趨勢

【摘要】隨着計算機技術及網絡技術的發展,網絡信息檢索顯得越發重要。本文主要綜述了網絡信息檢索的全文數據庫、搜索引擎、互聯網“超鏈接”等現行檢索模式及它的智能化、一站式化、可視化等發展趨勢。

【關鍵詞】網絡信息檢索;現狀;發展趨勢

1、信息檢索概述

信息檢索(Information Retrieval)是指將信息按照一定的方式組織和存儲起來,並能根據信息用戶的需要指出其中相關信息的過程,因此它的全稱叫“信息存儲與檢索”。

隨着互聯網的發展,人類社會的信息化、網絡化進程大大加快。當今出現的一系列新型檢索模式,包括網絡信息規範控制標準等爲網絡檢索技術的未來展現了新希望,與之相適應的信息檢索的交流平臺也迅速轉移到以WWW爲核心的網絡應用環境中,信息檢索步入網絡化時代,網絡信息檢索已基本取代了手工檢索。

2、網絡信息檢索的現狀

對大多數讀者而言,檢索並不意味着發現,而是獲得。人們希望不僅僅是提供寬泛的檢索結果,而應該是計算機能試圖理解用戶提問的意圖,並對檢索結果進行適當的分類和排序。但是,現有的搜索引擎大多是基於簡單的關鍵詞匹配,不能真正理解用戶的檢索意圖;各個搜索引擎的信息蒐集和索引建立有很大的不同,每個搜索引擎平均只能涉及到整個網上資源的30%~50%,而其中真正有用的信息也只佔很小的比例,這就意味着使用任何一個搜索引擎都只能檢索到網絡中的部分資源。目前網絡檢索麪臨一系列的挑戰,網絡信息量迅猛增加,人工已經無法對它們進行有效的分類、索引和利用;簡單的關鍵詞搜索,返回的信息量過大,已經讓用戶無法承擔;網絡信息組織的無序性;信息有用性評價困難;網絡信息日新月異的.更變;信息媒體的多樣化;帶寬等其它因素的制約,這些都給因特網信息的獲取造成了極大的阻礙。這樣就造成了要求智能化、專業化、多元化、多媒體化的網絡信息檢索工具出現的呼聲越來越高,並且有更多的人蔘與到其中來。如此種種,給當今的網絡信息檢索研究帶來了發展機遇,也給了它無限的發展空間。

3、網絡信息檢索的現行模式

3.1 網絡全文數據庫檢索

網絡全文數據庫是以全文數據爲數據庫對象,並在網上提供全文檢索服務的數據庫。按數據庫的生產機構分類,可分爲出版商全文期刊數據庫和生產商全文期刊數據庫。前者主要是那些期刊出版單位在其出版的印刷期刊基礎上建立的網絡電子期刊全文數據庫。而後者則是由數據庫生產商根據一定的主題或一定的收錄範圍整合一定數量的期刊出版物而產生的全文數據庫。國內全文數據庫主要有中國學術期刊全文數據庫。

3.2 網絡搜索引擎檢索

搜索引擎是一個專門的系統,它可以對互聯網信息資源進行搜索整理和分類,並將其儲存在網絡數據庫中供用戶查詢。搜索引擎包括蒐集信息、分類和用戶查詢等三大部分。目前流行的搜索引擎有兩大類:關鍵詞全文檢索式搜索引擎和分類目錄式搜索引擎。

關鍵詞全文檢索式搜索引擎主要利用其內部的搜索機器人和蜘蛛程序,自動搜索來自互聯網上的各種內容,在每一個關鍵詞和所有相關的網頁之間按照網頁相關性原理建立一個對應關係,儲存在其網絡服務器的數據庫中。用戶只要輸入關鍵詞就可以找到符合該關鍵詞特徵的所有被索引的網頁,搜索結果以超鏈接的方式列表,搜索結果有簡單介紹,用戶點擊相應的鏈接就可以進入相應的網絡資源網站,從而找到所需信息。用這種方式搜索到的結果通常數以百萬計,但是相關性越高的信息,在搜索結果列表中的位置越靠前。分類目錄式搜索引擎將互聯網信息按照一定的標準進行收集和分類,並編入相應目錄,以層級和逐次分項的方式管理目錄,查找信息可以按照分類目錄一層層進入,最終找到所要的信息。

3.3 互聯網“超鏈接”搜索

Web信息以超文本鏈接方式組織,基本組織單元是信息節點而不是字符串,信息節點之間通過鏈接進行聯繫。超鏈接是網頁必不可少的一個元素,同一主題或相關的信息因超鏈接構成了信息網。超文本信息檢索技術,以超文本信息節點之間的多種鏈接關係爲基礎,根據思維聯想或查找信息的需要,通過鏈接從一個信息節點轉到另一個信息節點。

4、網絡信息檢索的未來發展趨勢

網絡技術的發展,給網絡信息檢索及信息的網絡化帶來的極大的便利,進一步推動了網絡信息檢索理論和技術的快速發展。怎樣爲網絡用戶提供高質量、高效率的檢索方式是網絡信息檢索研究者的努力方向。信息檢索的對象已從傳統的文本信息擴展到如今開放、動態、分佈廣泛的多媒體信息。那麼,網絡信息檢索的發展趨勢如何呢?

4.1 智能化信息檢索

智能化信息檢索是基於自然語言處理的檢索形式。檢索工具是對用戶提供的以自然語言表達的檢索要求進行分析,從而形成檢索策略進行檢索。檢索工具智能化的內涵在於檢索工具具有學習、分析、辨別和推理的能力。近年來,因特網上不斷涌現的人工智能產品,如智能搜索引擎、智能瀏覽器、智能代理等,它們將提高網絡信息檢索的智能化程度,促進智能信息檢索的發展。

網絡中的智能代理通常是一個專家系統、一個過程、一個模塊或一個求解單元。智能代理可以獲得用戶的信息需求,自動檢索信息和推送檢索結果信息。多智能代理系統還具有信息發現、信息篩選、信息推送和信息導航功能,可滿足專業研究人員的特定需求,實現網絡信息檢索與服務的智能化。

4.2 一站式信息檢索

一站式(One Stop)信息檢索是指用戶通過一個檢索工具能滿足自己所有的信息檢索需求。一站式信息檢索將是網絡信息檢索服務的一種發展模式。一站式檢索服務是人性化服務的重要體現,它將大量節約用戶的檢索時間。全球最大的搜索引擎Google正在朝着一站式服務的方向發展。2004年12月,Google宣佈與紐約公共圖書館和包括哈佛大學圖書館在內的4個主要圖書館合作,將這些圖書館的大約1500萬冊藏書掃描進自己的數據主庫以提供網絡用戶檢索。目前,Google已經爲其用戶提供了某種程度上的一站式的檢索服務了。而其他越來越多的檢索服務提供商將向一站式檢索方向發展。

4.3 可視化

可視化指的是運用計算機圖形學和圖像處理技術,將數據轉換爲圖形或圖像在屏幕上顯示出來,並進行交互處理的理論、方法和技術。據統計,獲取信息有70%~80%靠視覺,20%靠聽覺,10%靠觸覺。用圖像取代文字幫助人們檢索的優點在於:圖像的表達更生動、結束語形象、準確,效率更高,具有交互性、多維性、可視性等特點,可以大大加快檢索速度,使時刻都在產生的海量數據得到有效利用。

4.4 商業化

目前網絡信息檢索系統已成爲新的投資熱點,網絡信息檢索系統不再僅僅是一種檢索工具,而且是一種商業產品。2001年10月,全球最大的中文搜索引擎提供商百度聯合新浪等多家中文門戶網站,共同推廣“搜索引擎競價排名”全新網絡商業服務模式。網絡信息檢索的商業化還體現在聯機和光盤檢索逐漸進入網絡環境。由於目前網絡信息檢索的檢準率低,聯網的收費聯機和光盤檢索依舊受到青睞,如世界著名的聯機信息系統DIALOG、OCLC、EBSCO、Silverplatter,國內的萬方數據資源系統、中國學術期刊光盤、重慶維普公司系列光盤等都紛紛在網上設立自己的網絡檢索入口。許多著名科技期刊的上網豐富了網絡資源,它們大多數都是在提供印刷版的同時提供期刊的網上服務,包括收費檢索。

5、小結

在的網絡信息資源中尋找自己所需要的信息資源是一件極具挑戰性的工作。爲此,許多信息專家正在積極地研究探索,並且取得了不少成果。我們相信隨着科學技術的進步,網絡信息檢索發展會越來越快,人們所利用的檢索工具和手段的更替會更加頻繁。

參考文獻

[1]黃靜.網絡信息檢索發展方向展望[J]nal of Library and Information Sciences in Agriculture,2008(1):15-19.

[2]霍小梅,王小蘭.網絡信息檢索的現狀及發展趨勢[J].圖書館論壇,2004(4):180-182.

[3]戴莉.網絡信息檢索的發展趨勢[J].情報探索,2005(2):52-54.

[4]徐謙.網絡信息檢索的智能化趨勢[J].圖書館理論與實踐,2006(2):63-65.

[5]謝新洲.網絡信息檢索技術與案例[M].北京:北京圖書館出版社,2005:9.

[6]易向軍.網絡信息檢索現狀及未來[J].合肥學院學報,2007 (7):90-92.