lawpalyer logo

資料由法律人 LawPlayer整理提供·歷屆國考試題完整收錄 / 法律人 LawPlayer 編輯整理

刑事警察人員 104 年資料探勘技術考古題

民國 104 年(2015)刑事警察人員「資料探勘技術」考試題目,共 5 題 | 資料來源:考選部

0 題選擇題 + 5 題申論題

下列關聯表SJT 限制如下⑴每一門科目的每位學生只能被一位老師教,⑵每位老師 只能教一門科目(但一門科目可由多位老師教)。請問關聯表SJT 是否是廣義第三 正規化型式(BCNF)?並說明理由。假如不是,該如何切割(decompose)關聯表 SJT?切割後有何功能相依性(functional dependency)會遺失?(20 分) 學生(S) 科目(J) 老師(T) 張三 數學 陳老師 張三 物理 黃老師 李四 數學 陳老師 李四 物理 林老師
針對資料探勘(data mining),請描述其資料前置作業(data preprocessing)的主要 步驟。(20 分)
下列資料庫有四筆交易,如果最小支持度(minimum support)為60%、最小信心水 準(minimum confidence)為80%。請找出所有的頻繁項目集(frequent itemsets)和所 有符合下列型態的關聯法則(association rule),同時也要列出其支持度(support)和 信心水準(confidence)。(20 分) {項目1, 項目2} ⇒ 項目3 [支持度(support), 信心水準(confidence)] TID 項目 T100 {K,A,D,B} T200 {D,A,C,E,B} T300 {C,A,B,E} T400 {B,A,D}
用下列分類資料呈現混淆矩陣表(confusion matrix),並算出精確率(precision)、 回想率(recall)及正確率(accuracy)。(20 分) 真實結果: 分類結果: 癌症樣本數目 200 預測真實癌症數目 150 非癌症樣本數目 800 預測真實非癌症數目 700
線上分析處理(OLAP)在高維度下會發生什麼問題?該如何解決?(20 分)

本頁資料來源:考選部歷屆試題·整理提供:法律人 LawPlayer· lawplayer.com