《人際網(wǎng)絡(luò)環(huán)境下的信息檢索/21世紀(jì)高等學(xué)校教材》改變現(xiàn)行大多數(shù)教材以傳統(tǒng)文獻(xiàn)形態(tài)展開敘述的結(jié)構(gòu)體系,遵循現(xiàn)代信息檢索技術(shù)發(fā)展的規(guī)律,以傳統(tǒng)文獻(xiàn)、數(shù)據(jù)庫、網(wǎng)絡(luò)及機(jī)構(gòu)四類信息源作為主干結(jié)構(gòu),既包含原有內(nèi)容,又有效容納了信息源的新發(fā)展!度穗H網(wǎng)絡(luò)環(huán)境下的信息檢索/21世紀(jì)高等學(xué)校教材》系統(tǒng)介紹了信息檢索理論與技術(shù),并對四類信息源的檢索方法做了詳細(xì)介紹,同時,著力透視了迅猛發(fā)展的信息技術(shù)新熱點,探索人際網(wǎng)絡(luò)環(huán)境對信息檢索技術(shù)與觀念的影響,視角新穎,可讀性強(qiáng)。
《人際網(wǎng)絡(luò)環(huán)境下的信息檢索/21世紀(jì)高等學(xué)校教材》可作為研究生、本科生信息檢索與利用課程的教材,也可供圖書情報工作者、信息管理工作者參考。也.適合于普通讀者作為提高信息素養(yǎng)的讀本。
3)信息檢索的類型
討論檢索類型,先要了解檢索的一種特殊類型,即全文數(shù)據(jù)庫,它是一次信息和二次信息的綜合體。在檢索結(jié)果中,全文數(shù)據(jù)庫有直接的全文鏈接。
按存儲與檢索對象劃分,信息檢索可以分為文獻(xiàn)檢索、數(shù)據(jù)檢索、事實檢索。其中數(shù)據(jù)檢索和事實檢索是確定性的檢索,檢索結(jié)果可以直接利用,一般通過三次信息源來完成;文獻(xiàn)檢索是一種相關(guān)性檢索,檢索結(jié)果是文獻(xiàn)信息的線索,一般通過二次信息來實現(xiàn)。以上三種信息檢索類型的主要區(qū)別在于:數(shù)據(jù)檢索和事實檢索是要檢索出包含在文獻(xiàn)中的信息本身,而文獻(xiàn)檢索只要檢索出包含所需要信息的文獻(xiàn)即可。
按存儲的載體和實現(xiàn)查找的技術(shù)手段為標(biāo)準(zhǔn)劃分,信息檢索可分為手工檢索、機(jī)械檢索、計算機(jī)檢索。其中發(fā)展比較迅速的計算機(jī)檢索是數(shù)據(jù)庫與網(wǎng)絡(luò)信息檢索,也即數(shù)據(jù)庫與網(wǎng)絡(luò)信息搜索,是指互聯(lián)網(wǎng)用戶在網(wǎng)絡(luò)終端通過特定的網(wǎng)絡(luò)搜索工具或是通過瀏覽的方式查找并獲取信息的行為。
按檢索途徑劃分,信息檢索還可分為直接檢索、間接檢索。
4)人際網(wǎng)絡(luò)時代信息檢索相關(guān)熱點
。1)智能檢索或知識檢索
傳統(tǒng)的全文檢索技術(shù)基于關(guān)鍵詞匹配進(jìn)行檢索,往往存在查不全、查不準(zhǔn)、檢索質(zhì)量不高的現(xiàn)象,特別是在網(wǎng)絡(luò)信息時代,利用關(guān)鍵詞匹配很難滿足人們檢索的要求。而智能檢索利用分詞詞典、同義詞典、同音詞典改善檢索效果,比如用戶查詢“計算機(jī)”,與“電腦”相關(guān)的信息也能檢索出來;進(jìn)一步還可在知識層面或者說概念層面上輔助查詢,通過主題詞典、上下位詞典、相關(guān)同級詞典形成一個知識體系或概念網(wǎng)絡(luò),給予用戶智能知識提示,最終幫助用戶獲得最佳的檢索效果,比如用戶可以進(jìn)一步縮小查詢范圍至“微機(jī)”、“服務(wù)器”或擴(kuò)大查詢至“信息技術(shù)”或查詢相關(guān)的“電子技術(shù)”、“軟件”、“計算機(jī)應(yīng)用”等范疇。另外,智能檢索還包括歧義信息和檢索處理,如“蘋果”,究竟是指水果還是電腦品牌,又如“華人”與“中華人民共和國”的區(qū)分,將通過歧義知識描述庫、全文索引、用戶檢索上下文分析以及用戶相關(guān)性反饋等技術(shù)結(jié)合處理,高效、準(zhǔn)確地反饋給用戶最需要的信息。
。2)數(shù)據(jù)(知識)挖掘
數(shù)據(jù)(知識)挖掘主要指文本挖掘技術(shù)的發(fā)展,目的是幫助人們更好的發(fā)現(xiàn)、組織、表示信息,提取知識,滿足信息檢索的高層次需要,包括摘要、分類(聚類)和相似性檢索等方面。自動摘要就是利用計算機(jī)自動地從原始文獻(xiàn)中提取文摘。在信息檢索中,自動摘要有助于用戶快速評價檢索結(jié)果的相關(guān)程度;在信息服務(wù)中,自動摘要有助于多種形式的內(nèi)容分發(fā),如發(fā)往PDA、手機(jī)等輕應(yīng)用終端。相似性檢索技術(shù)基于文檔內(nèi)容特征檢索與其相似或相關(guān)的文檔,是實現(xiàn)用戶個性化相關(guān)反饋的基礎(chǔ),也可用于去重分析。自動分類可基于統(tǒng)計或規(guī)則,經(jīng)過計算機(jī)分析形成預(yù)定義分類樹,再根據(jù)文檔的內(nèi)容特征將其歸類;自動聚類則是根據(jù)文檔內(nèi)容的相關(guān)程度進(jìn)行分組歸并。自動分類(聚類)在信息組織、導(dǎo)航方面非常有用。
。3)異構(gòu)信息整合檢索和全息檢索
在信息檢索分布化和網(wǎng)絡(luò)化的趨勢下,信息檢索系統(tǒng)的開放性和集成性要求越來越高,需要能夠檢索和整合不同來源和結(jié)構(gòu)的信息。這是異構(gòu)信息檢索技術(shù)發(fā)展的基點,包括支持各種格式化文件,如TEXT、HTML、XML、RTF、MS Office、PDF、PS2/PS、MARC、IS0 2709等處理和檢索;支持多語種信息的檢索;支持結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一處理;和關(guān)系數(shù)據(jù)庫檢索的無縫集成以及其他開放檢索接口的集成等。所謂全息檢索,就是支持一切格式和方式的檢索。從實踐來講,發(fā)展到異構(gòu)信息整合檢索的層面,基于自然語言理解的人機(jī)交互以及多媒體信息檢索整合等方面尚有待取得進(jìn)一步突破。
另外,從工程實踐角度,綜合采用內(nèi)存和外部存儲的多級緩存、分布式群集和負(fù)載均衡技術(shù)也是信息檢索技術(shù)發(fā)展的重要方面。
隨著互聯(lián)網(wǎng)的普及和電子商務(wù)的發(fā)展,企業(yè)和個人可獲取、需處理的信息量呈爆發(fā)式增長,而且其中絕大部分都是非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。內(nèi)容管理的重要性日益凸現(xiàn),而信息檢索作為內(nèi)容管理的核心支撐技術(shù),隨著內(nèi)容管理的發(fā)展和普及,亦將應(yīng)用到各個領(lǐng)域,成為人們?nèi)粘9ぷ魃畹拿芮谢锇椤?br />
在新時期,信息檢索呈現(xiàn)智能化、可視化、簡單化、多樣化、個性化、商業(yè)化等發(fā)展趨勢。
5)信息檢索的意義
。1)充分利用和掌握有效的信息資源,有利于舉一反三,擴(kuò)大知識視野,學(xué)好專業(yè)知識和技能;
。2)掌握科學(xué)的信息檢索方法是獲取新知識的捷徑,可以使自己在廣闊的知識領(lǐng)域中不斷更新知識,更好地適應(yīng)社會發(fā)展的需求;
(3)掌握科學(xué)的信息檢索方法可以縮短查詢信息的時間,獲取更多的信息,提高工作效率,有利于就業(yè)后了解市場同類產(chǎn)品及銷售情況,積極參與市場競爭;
。4)有利于為個人、企業(yè)提供競爭情報和相關(guān)信息,為決策作參考。
……