lawpalyer logo

圖書資訊管理 100 年資訊系統與資訊檢索考古題

民國 100 年(2011)圖書資訊管理「資訊系統與資訊檢索」考試題目,共 8 題 | 資料來源:考選部

0 題選擇題 + 8 題申論題

多數的資訊檢索系統提供切截(Truncation)的檢索功能,請先說明何謂切截?然而, 圖書館資訊系統提供的線上公用目錄(Online Public Access Catalog,簡稱OPAC), 通常僅允許使用者進行後切截(Suffix Truncation)的檢索功能,試討論其考量的因 素。(25 分)
試說明資訊過濾(Information Filtering)與資訊檢索(Information Retrieval)的差異 為何?何謂內容式資訊過濾(Content-based Information Filtering)及協力式資訊過 濾(Collaborative Information Filtering)技術?兩者對於資訊過濾各有何優缺點? (25 分)
使用者下達檢索問句(Query)後,檢索系統送回排序的檢索結果(Ranked Search Results),每一筆檢索結果通常包含簡易的摘錄(Snippet)。試討論建立(Generate) 摘錄的方法。(25 分)
說明檢索系統允許使用者進行檢索結果相關回饋(Relevance Feedback)的目的為何? 檢索系統如何基於相關回饋進行自動查詢語句擴展(Query Expansion)?索引典為 基礎的查詢語句擴展(Thesaurus-based Query Expansion)對於檢索結果的正確率 (Precision Rate)及召回率(Recall Rate)影響為何?(25 分)
傳統上,檢索結果的評估係採用查全率(召回率,Recall Ratio)以及查準率(正確率, Precision Ratio),或是綜合二者之F-measure,請先分別說明三者的計算方式。但 是對於排序的檢索結果,前述三者並不適用,請說明原因。(25 分)
試說明以關鍵字檢索(Keyword Search)發展搜尋引擎的侷限性為何?相較於傳統 關鍵字檢索,基於語意網(Semantic Web)發展搜尋引擎的概念為何?RDF(Resource Description Framework)如何支援發展基於語意網的搜尋引擎?(25 分)
試討論停用詞(Stop Word)的意義,並說明如何建構停用詞表(Stop Word List)。 (25 分)
試說明中文自然語言處理(Natural Language Processing )中的斷詞(Word Segmentation)、未知詞偵測(Unknown Word Detection)及詞類標註(Part-of- speech Tagging)的用途分別為何?上述這些技術對於中文檢索效能的影響為何? (25 分)

圖書資訊管理 100 年其他科目