1. 布爾邏輯檢索
利用布爾邏輯算符進(jìn)行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種技術(shù)。常用的布爾邏輯算符有三種,分別是邏輯或“OR”、邏輯與“AND”、邏輯非“NOT”。
2. 截詞檢索
截詞檢索是計算機檢索系統中應用非常普遍的一種技術(shù)。由于西文的構詞特性,在檢索中經(jīng)常會(huì )遇到名詞的單復數形式不一致;同一個(gè)意思的詞,英美拼法不一致;詞干加上不同性質(zhì)的前綴和后綴就可以派生出許多意義相近的詞等等。這是就要用到截詞檢索
3. 位置檢索
位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索,就是利用記錄中的自然語(yǔ)言進(jìn)行檢索,詞與詞之間的邏輯關(guān)系用位置算符組配,對檢索詞之間的相對位置進(jìn)行限制。這是一種可以不依賴(lài)主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法。
4. 字段限定檢索
字段限定檢索是指限定檢索詞在數據庫記錄中的一個(gè)或幾個(gè)字段范圍內查找的一種檢索方法。在檢索系統中,數據庫設置的可供檢索的字段通常有兩種:表達文獻主題內容特征的基本字段和表達文獻外部特征的輔助字段。
5. 加權檢索
加權檢索是某些檢索系統中提供的一種定量檢索技術(shù)。加權檢索同布爾檢索、截詞檢索等一樣,也是文獻檢索的一個(gè)基本檢索手段,但與它們不同的是,加權檢索的側重點(diǎn)不在于判定檢索詞或字符串是不是在數據庫中存在、與別的檢索詞或字符串是什么關(guān)系,而是在于判定檢索詞或字符串在滿(mǎn)足檢索邏輯后對文獻命中與否的影響程度。
6. 聚類(lèi)檢索
聚類(lèi)是把沒(méi)有分類(lèi)的事物,在不知道應分幾類(lèi)的情況下,根據事物彼此不同的內在屬性,將屬性相似的信息劃分到同一類(lèi)下面。
信息檢索方法包括:普通法、追溯法和分段法。
1、普通法是利用書(shū)目、文摘、索引等檢索工具進(jìn)行文獻資料查找的方法。運用這種方法的關(guān)鍵在于熟悉各種檢索工具的性質(zhì)、特點(diǎn)和查找過(guò)程,從不同角度查找。普通法又可分為順檢法和倒檢法。
2、追溯法是利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒(méi)有檢索工具或檢索工具不全時(shí),此法可獲得針對性很強的資料,查準率較高,查全率較差。
3、分段法是追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
擴展資料
檢索原因
信息檢索是獲取知識的捷徑
美國普林斯頓大學(xué)物理系一個(gè)年輕大學(xué)生名叫約瀚·菲利普,在圖書(shū)館里借閱有關(guān)公開(kāi)資料,僅用四個(gè)月時(shí)間,就畫(huà)出一張制造原子彈的設計圖。
他設計的原子彈,體積小(棒球大小)、重量輕(7.5公斤)、威力大(相當廣島原子彈3/4的威力),造價(jià)低(當時(shí)僅需兩千美元),致使一些國家(法國、巴基斯坦等)紛紛致函美國大使館,爭相購買(mǎi)他的設計拷貝。
二十世紀七十年代,美國核專(zhuān)家泰勒收到一份題為《制造核彈的方法》的報告,他被報告精湛的技術(shù)設計所吸引,驚嘆地說(shuō):“至今我看到的報告中,它是最詳細、最全面的一份。”
但使他更為驚異的是,這份報告竟出于哈佛大學(xué)經(jīng)濟專(zhuān)業(yè)的青年學(xué)生之手,而這個(gè)四百多頁(yè)的技術(shù)報告的全部信息來(lái)源又都是從圖書(shū)館那些極為平常的、完全公開(kāi)的圖書(shū)資料中所獲得的。
參考資料來(lái)源:百度百科——信息檢索
在計算機信息檢索系統中,常用的檢索技術(shù)主要有以下六種:
1. 布爾邏輯檢索
利用布爾邏輯算符進(jìn)行檢索詞或代碼的邏輯組配,是現代信息檢索系統中最常用的一種技術(shù)。常用的布爾邏輯算符有三種,分別是邏輯或“OR”、邏輯與“AND”和邏輯非“NOT”。
2. 截詞檢索
截詞檢索是計算機檢索系統中應用非常普遍的一種技術(shù)。由于西文的構詞特性,在檢索中經(jīng)常會(huì )遇到名詞的單復數形式不一致;同一個(gè)意思的詞,英美拼法不一致;詞干加上不同性質(zhì)的前綴和后綴就可以派生出許多意義相近的詞等等。這是就要用到截詞檢索。
3. 位置檢索
位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索,就是利用記錄中的自然語(yǔ)言進(jìn)行檢索,詞與詞之間的邏輯關(guān)系用位置算符組配,對檢索詞之間的相對位置進(jìn)行限制。這是一種可以不依賴(lài)主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法。
4. 字段限定檢索
字段限定檢索是指限定檢索詞在數據庫記錄中的一個(gè)或幾個(gè)字段范圍內查找的一種檢索方法。在檢索系統中,數據庫設置的可供檢索的字段通常有兩種:表達文獻主題內容特征的基本字段和表達文獻外部特征的輔助字段。
5. 加權檢索
加權檢索是某些檢索系統中提供的一種定量檢索技術(shù)。加權檢索同布爾檢索、截詞檢索等一樣,也是文獻檢索的一個(gè)基本檢索手段,但與它們不同的是,加權檢索的側重點(diǎn)不在于判定檢索詞或字符串是不是在數據庫中存在、與別的檢索詞或字符串是什么關(guān)系,而是在于判定檢索詞或字符串在滿(mǎn)足檢索邏輯后對文獻命中與否的影響程度。
6. 聚類(lèi)檢索
聚類(lèi)是把沒(méi)有分類(lèi)的事物,在不知道應分幾類(lèi)的情況下,根據事物彼此不同的內在屬性,將屬性相似的信息劃分到同一類(lèi)下面。
分類(lèi)(瀏覽)檢索
分類(lèi)(瀏覽)檢索(Browse)一般按照人為設定固定類(lèi)目收錄相關(guān)信息,檢索時(shí)只需按照類(lèi)目層層遞進(jìn),遂層深入即可得到相關(guān)信息。一般有按主題或字順的方式組織分類(lèi)。其優(yōu)點(diǎn)是簡(jiǎn)單明了,無(wú)需任何檢索基礎知識都能檢索到相關(guān)信息,缺點(diǎn)是人為的分類(lèi)無(wú)法做到足夠的細致,手工加工使用信息發(fā)布時(shí)間有所延遲。關(guān)鍵詞檢索
關(guān)鍵詞檢索(Search)一般有簡(jiǎn)單檢索(Simple Search/Quick Search)、高級檢索(Advance Search)和專(zhuān)家檢索(Expert Search)之分。簡(jiǎn)單檢索
簡(jiǎn)單檢索一般提供一個(gè)檢索詞輸入框,用于輸入在缺省字段中出現的檢索詞,有的系統也可直接輸入專(zhuān)家檢索的檢索式,如Google首頁(yè)的檢索方式。高級檢索
高級檢索一般可有多個(gè)輸入框,并可選擇檢索字段及各輸入框之間的邏輯關(guān)系。還可有各種限制條件的設置。專(zhuān)家檢索
專(zhuān)家檢索可用于輸入檢索式檢索。用于有過(guò)專(zhuān)門(mén)檢索技巧學(xué)習的用戶(hù)使用,需要了解檢索系統的邏輯組配檢索、截詞檢索和字段檢索等各種檢索技巧。
信息檢索的基本方法是:普通法、追溯法和分段法。
1、普通法:利用書(shū)目、文摘、索引等檢索工具進(jìn)行文獻資料查找的方法。運用這種方法的關(guān)鍵在于熟悉各種檢索工具的性質(zhì)、特點(diǎn)和查找過(guò)程,從不同角度查找。普通法又可分為順檢法和倒檢法。
2、追溯法:利用已有文獻所附的參考文獻不斷追蹤查找的方法,在沒(méi)有檢索工具或檢索工具不全時(shí),此法可獲得針對性很強的資料,查準率較高,查全率較差。
3、分段法:追溯法和普通法的綜合,它將兩種方法分期、分段交替使用,直至查到所需資料為止。
擴展資料
信息檢索起源于圖書(shū)館的參考咨詢(xún)和文摘索引工作,從19世紀下半葉首先開(kāi)始發(fā)展,至20世紀40年代,索引和檢索成已為圖書(shū)館獨立的工具和用戶(hù)服務(wù)項目。隨著(zhù)1946年世界上第一臺電子計算機問(wèn)世,計算機技術(shù)逐步走進(jìn)信息檢索領(lǐng)域,并與信息檢索理論緊密結合起來(lái)。
信息檢索的目標,或者說(shuō)基本的任務(wù),就是從一大堆信息中找到我們需要的某部分信息。進(jìn)一步使之更加具體:信息檢索的目標是在一大堆文檔等非結構化信息中根據我們的需求挑選出我們需要的部分文檔。
參考資料來(lái)源:百度百科-信息檢索
網(wǎng)絡(luò )信息檢索方法主要有以下四種:1、漫游法2、直接查找法3、搜索引擎法4、網(wǎng)絡(luò )資源指南法。
1.漫游法
(1)偶然發(fā)現。這是在因特網(wǎng)上發(fā)現、檢索信息的原始方法。即在日常的網(wǎng)絡(luò )閱讀、漫游過(guò)程中,意外發(fā)現一些有用信息。這種方式的目的性不是很強,具不可預見(jiàn)性和偶然性。
(2)順“鏈”而行。指用戶(hù)在閱讀超文本文檔時(shí),利用文檔中的鏈接從一網(wǎng)頁(yè)轉向另一相關(guān)網(wǎng)頁(yè)。此方法類(lèi)似于傳統手工檢索中的“追溯檢索”,即根據文獻后所附的參考文獻追溯查找相關(guān)的文獻,從而不斷擴大檢索范圍。這種方法可能在較短的時(shí)間內檢出大量相關(guān)信息,也可能偏離檢索目標而一無(wú)所獲。
2.直接查找法
直接查找法是已經(jīng)知道要查找的信息可能存在的地址,而直接在瀏覽器的地址欄中輸入其網(wǎng)址進(jìn)行瀏覽查找的方法。此方法適合于經(jīng)常上網(wǎng)漫游的用戶(hù)。其優(yōu)點(diǎn)是節省時(shí)間、目的性強、節省費用,缺點(diǎn)是信息量少。
3.搜索引穆檢索法
此方法是最為常規、普遍的網(wǎng)絡(luò )信息檢索方法。搜索引擎是提供給用戶(hù)進(jìn)行關(guān)鍵詞、詞組或自然語(yǔ)言檢索的工具。用戶(hù)提出檢索要求,搜索引擎代替用戶(hù)在數據庫中進(jìn)行檢索,并將檢索結果提供給用戶(hù)。它一般支持布爾檢索、詞組檢索、截詞檢索、字段檢索等功能。利用搜索引擎進(jìn)行檢索的優(yōu)點(diǎn)是:省時(shí)省力,簡(jiǎn)單方便,檢索速度快、范圍廣,能及時(shí)獲取新增信息。
其缺點(diǎn)是:由于采用計算機軟件自動(dòng)進(jìn)行信息的加工、處理,且檢索軟件的智能性不很高,造成檢索的準確性不是很理想,與人們的檢索需求及對檢索效率的期望有一定差距。
4.網(wǎng)絡(luò )資源指南檢索法
此方法是利用網(wǎng)絡(luò )資源指南進(jìn)行查找相關(guān)信息的方法。網(wǎng)絡(luò )資源指南類(lèi)似于傳統的文獻檢索工具————書(shū)目之書(shū)目(bibliography of bibliographies),或專(zhuān)題書(shū)目,國外有人稱(chēng)之為web of webs,webliographies,其目的是可實(shí)現對網(wǎng)絡(luò )信息資源的智能性查找。它們通常由專(zhuān)業(yè)人員在對網(wǎng)絡(luò )信息資源進(jìn)行鑒別、選擇、評價(jià)、組織的基礎上編制而成,對于有目的的網(wǎng)絡(luò )信息檢索具有重要的指導作用。
其局限性在于:由于其管理、維護跟不上網(wǎng)絡(luò )信息的增長(cháng)速度,使得其收錄范圍不夠全面,新穎性、及時(shí)性不夠強,且用戶(hù)還要受標引者分類(lèi)思想的限制。
文獻檢索的方法:直接法、順查法、倒查法、抽查法、追溯法、循環(huán)法。
1、直接法
又稱(chēng)常用法,是指直接利用檢索系統(工具)檢索文獻信息的方法。它又分為順查法、倒查法和抽查法。
2、順查法
順查法是指按照時(shí)間的順序,由遠及近地利用檢索系統進(jìn)行文獻信息檢索的方法。這種方法能收集到某一課題的系統文獻,它適用于較大課題的文獻檢索。例如,已知某課題的起始年代,需要了解其發(fā)展的全過(guò)程,就可以用順查法從最初的年代開(kāi)始查找。
3、倒查法
倒查法是由近及遠,從新到舊,逆著(zhù)時(shí)間的順序利用檢索工具進(jìn)行文獻檢索的方法。使用這種方法可以最快地獲得最新資料。
4、抽查法
抽查法是指針對項目的特點(diǎn),選擇有關(guān)該項目的文獻信息最可能出現或最多出現的時(shí)間段,利用檢索工具進(jìn)行重點(diǎn)檢索的方法。
5、追溯法
是指不利用一般的檢索系統,而是利用文獻后面所列的參考文獻,逐一追查原文(被引用文獻),然后再從這些原文后所列的參考文獻目錄逐一擴大文獻信息范圍,一環(huán)扣一環(huán)地追查下去的方法。它可以像滾雪球一樣,依據文獻間的引用關(guān)系,獲得更好的檢索結果。
6、循環(huán)法
又稱(chēng)分段法或綜合法。它是分期分交替使用直接法和追溯法,以期取長(cháng)補短,相互配合,獲得更好的檢索結果。
擴展資料
一、文獻檢索系統功能
1、報道文獻信息
檢索系統具有對文獻信息予以揭示、反映、報道的功能。信息用戶(hù)只有通過(guò)利用文獻檢索系統,才能對大量產(chǎn)生并隨時(shí)更新的各種信息進(jìn)行及時(shí)了解和系統的掌握。
2、存儲文獻信息
通過(guò)對大量分散而無(wú)序的原始文獻進(jìn)行了有目的的存儲,并按照一定特征及規則組織,形成了包容各個(gè)年代、各種載體、各個(gè)學(xué)科門(mén)類(lèi)的文獻檢索系統。
3、檢索文獻信息
通過(guò)對信息的報道和存儲,把大量信息按外表特征與內容特征集中排序,實(shí)現方便、高效的信息檢索,它是文獻檢索系統的最突出的功能。
二、計算機信息檢索系統
計算機信息檢索系統主要由計算機硬件及軟件系統、數據庫、數據通訊等設施組成。根據其內容的不同,計算機信息檢索系統又可分為以下幾種:
①計算機光盤(pán)檢索系統
光盤(pán)檢索系統是以大容量的光盤(pán)存儲器為數據庫的存儲介質(zhì),利用計算機和光盤(pán)驅動(dòng)器進(jìn)行讀取和檢索光盤(pán)上的數據信息。它只能滿(mǎn)足較小范圍的特定用戶(hù)的信息檢索需求。
②計算機聯(lián)機檢索系統
計算機聯(lián)機檢索系統是由大型計算機聯(lián)網(wǎng)系統、數據庫、檢索終端及通訊設備組成的信息檢索系統。它能滿(mǎn)足較大范圍的特定用戶(hù)的信息檢索需求。
③計算機網(wǎng)絡(luò )檢索系統
計算機網(wǎng)絡(luò )信息檢索系統包括局域網(wǎng)絡(luò )信息檢索系統(如圖書(shū)館管理系統)和廣域網(wǎng)絡(luò )Internet信息檢索系統。尤其是后者,可以支持因特網(wǎng)用戶(hù)的信息檢索需求。
2、按揭示信息內容的程度劃分其可為書(shū)目、題錄、文摘、全文數據庫。
參考資料來(lái)源:百度百科—文獻檢索
參考資料來(lái)源:百度百科—文獻檢索系統
明確檢索要求和檢索目標 計算機檢索的第一步準備工作是明確檢索要求和檢索目標。
明確檢索要求就是要搞清楚本課題屬于什么學(xué)科,所需文獻的類(lèi)型及語(yǔ)種,查找文獻的年代,所需文獻的最佳篇數,允許支配的檢索費用。這些要求對選擇數據庫、構造檢索策略都是十分重要的。
確定檢索目標也是進(jìn)行計算機信息檢索前應搞清楚的準備工作。例如:如果屬于開(kāi)題調研,則應盡可能地檢索出與之相關(guān)的全部文獻,即要求較高的查全率;以便充分地做好開(kāi)題的準備工作;如果屬于探索性、開(kāi)創(chuàng )性的課題,則只需要查出一些啟發(fā)性的文獻,對查準率和查全率要求都不一定有很高的要求。
4.3.2 課題分析 1. 課題概念的分析方法 分析課題就是分析出課題所涉及的主要概念,并找出能代表這些概念的若干個(gè)詞或詞組,進(jìn)而分析概念之間的上、下、左、右關(guān)系。對于新學(xué)科、交叉學(xué)科和邊緣學(xué)科的課題,則要搞清楚這些概念之間的關(guān)系。
概念分析的結果應以概念組為單元的詞或詞組的形式列出,以便下一步制訂檢索策略時(shí)使用。 2. 隱含概念的分析方法 有些課題的實(shí)質(zhì)性?xún)热萃茈y從課題的名稱(chēng)上反映出來(lái),課題所隱含的概念和相關(guān)的內容需要從課題所屬的專(zhuān)業(yè)角度作深入分析,才能提煉出能夠確切反映課題內容的檢索概念。
例如:"社會(huì )保障"包含"養老保險"、"失業(yè)保險"、"醫療保險"和"社會(huì )救濟"等概念,如果要檢索社會(huì )保障方面的文獻,應該析出上述概念,才能保證文獻的查全率。 3. 核心概念的選取 有些檢索詞中已經(jīng)含有的某些概念,在概念分析中應予以排除。
例如:課題"公司勞動(dòng)獎勵、職工培訓和養老保險制度管理的理論和實(shí)踐",如果把"勞動(dòng)獎勵","職工培訓","養老保險","公司","制度","管理"六個(gè)概念全部組配起來(lái),則會(huì )造成大量文獻漏檢。實(shí)際上,勞動(dòng)力資源管理已經(jīng)包含了勞動(dòng)獎勵、職工培訓和養老保險三個(gè)方面,而且,勞動(dòng)力管理必然是針對該三個(gè)方面而言的。
因此,本課題只須采用"勞動(dòng)力資源"和"管理"這兩個(gè)本質(zhì)概念即可。 為了提高文獻的檢準率,應該從相應的規范詞表中選擇所需的檢索詞。
并且在確定檢索詞時(shí),除了要考慮反映主題概念的同義詞、近義詞等相關(guān)的檢索詞外,還要注意選擇被選用檢索詞的縮寫(xiě)詞和不同拼法的詞,以避免漏檢有關(guān)的文獻。 4.3.3 檢索詞的擴展、選擇和處理 目前的計算機信息檢索系統,還不具備智能思考的能力,還不會(huì )對所輸入的檢索詞以及涉及的所有詞進(jìn)行自動(dòng)、全面的檢索,因此,必須在概念分析的基礎上列出與概念有關(guān)的詞,從中做出選擇,并利用截詞等方法對檢索詞予以歸并。
1.相同概念的檢索詞的擴展 擴展相同概念的檢索詞的方法一般有同義詞方法、主題詞表方法和截詞方法 (1) 同義詞方法。在同一概念的范疇內,從語(yǔ)言角度,選擇不同的名稱(chēng)、不同的拼寫(xiě)方法和單復數形式。
不同的名稱(chēng)包括學(xué)名和俗名、簡(jiǎn)稱(chēng)和全稱(chēng),商品名和物質(zhì)或產(chǎn)品名,事物的代碼和事物的學(xué)名。不同的拼寫(xiě)方法,以英語(yǔ)為例,包括英式英語(yǔ)和美式英語(yǔ)的區別。
(2)截詞方法。當某些檢索詞詞干相同、詞義相近,但詞尾或詞中間有變化時(shí)(多數英語(yǔ)單詞的單復數變化和英美不同拼寫(xiě)形式),可以采用截詞方法擴展檢索詞。
這種方法要求在詞干后使用截詞符。截詞符一般包括"?"和"*"兩種。
具體采用什么形式,各個(gè)系統都有明確的規定。例如:在DIALOG系統中,截詞符號有無(wú)限截詞算符 ("?") 和有限截詞 ("??"和"?? ?")等多種,"?"有時(shí)還用做字符屏蔽符。
(3)主題詞表方法 許多數據庫都編有自己的主題詞表。在數據庫編有主題詞表的情況下,應該盡量從詞表中選擇檢索詞。
使用主題詞表,不僅可以使檢索詞更加規范,提高檢索結果的準確性,而且可以從同族詞中選取更多的上位詞、下位詞、相關(guān)詞,使獲得的檢索結果更為理想。 2.檢索詞的選擇和處理 運用上述方法得到的詞,首先應加以選擇,即注意選用本專(zhuān)業(yè)通用的術(shù)語(yǔ)(應避免使用冷僻詞和根據中文術(shù)語(yǔ)自譯生造的詞),然后以概念為單位,構成組面(facets)。
例如:課題"東西方社會(huì )保障制度比較研究"的概念組面和檢索詞為: 概念組面1:"社會(huì )保障" social security 概念組面2:"制度研究"system? Research 4.3.4 數據庫的選擇 不同數據庫的學(xué)科范圍不同,檢索指令不同,收費的標準也不同。所以,在檢索之前應該閱讀有關(guān)數據庫的使用介紹,以便選擇數據庫時(shí)做到心中有數。
選擇數據庫,我們一般應該遵循以下幾條原則 1.按照課題的檢索要求和目的,選擇收錄文獻種類(lèi)多、專(zhuān)業(yè)覆蓋面寬、年代跨度對口的數據庫; 2.當需要查找最新文獻信息時(shí),選擇數據更新周期短的數據庫; 3.當還需要獲取原文時(shí),選取原文獲取較容易的數據庫; 4.在同時(shí)有多個(gè)數據庫可供選擇的情況下,應首先選擇比較熟悉的數據庫。 5.當幾個(gè)數據庫的內容交叉重復率比較高時(shí),應選擇檢索費用比較低的數據庫。
4.3.5 檢索策略構成和調整方法 在實(shí)際檢索過(guò)程中,僅需一個(gè)檢索詞就能滿(mǎn)足檢索要求的情況并不很多。通常我們需要使用多個(gè)檢索詞構成檢索策略,以滿(mǎn)足由多概念組配而成的較為復雜課題的要求。
檢。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:2.822秒