lawpalyer logo

資料由法律人 LawPlayer整理提供·歷屆國考試題完整收錄 / 法律人 LawPlayer 編輯整理

刑事警察人員 106 年資料探勘技術考古題

民國 106 年(2017)刑事警察人員「資料探勘技術」考試題目,共 4 題 | 資料來源:考選部

0 題選擇題 + 4 題申論題

全球3C 公司是一間行銷全世界的歷史悠久的電腦、通訊與消費電子產品公司,它的 資料庫記錄了1950-2017 年的每個月200 種產品、在全世界各城市的銷售數量與金 額。請針對下列每一項的資料倉儲操作先給定義,再以上述背景為例來說明清楚該 操作內涵:⑴向下探究(drill-down)、⑵向上擷取(roll-up)、⑶切片(slice)、⑷切塊 (dice)、⑸轉軸(pivot)。(25 分)
假設關聯資料庫的表格R(A,B,C,D)有四個屬性A,B,C,D,其功能相依(Functional Dependency)為{A,B,D}€C 與{C,D}€B 請以屬性封閉性(Closure)的概念,找出R 的所有候選鍵(Candidate Key),請說 明清楚你使用功能相依的每一個推演步驟。(6 分) 請證明R 滿足第二正規化(2NF)或反證R 不滿足2NF。(3 分) 請證明R 滿足第三正規化(3NF)或反證R 不滿足3NF。(4 分) 請證明R 滿足Boyce-Codd 正規化(BCNF)或反證R 不滿足BCNF。(4 分) 若R 不滿足上述任一正規化,請將其切割,以求滿足之,你必須說明切割後的各 表格為何滿足你所聲稱的正規化。(6 分)
假設XYZ 公司的商品包含A、B、C、D、E、F、G 等多種,由其交易資料庫記錄, 我們得知表一的資料,假設我們要求的最小支持度(Support)為0.2、最小信心水準 (Confidence Level)為0.7。請找出所有包含一個商品的高頻項目集合(Frequent Item-sets),及其個別的支持度(7 分)、找出所有包含兩個商品的高頻項目集合, 及其個別的支持度(12 分)、找出所有包含三個商品的高頻項目集合,及其個別的 支持度(4 分)、列出至少兩條包含三個商品的強(Strong)關聯規則(Association Rules)及其個別規則的信心水準(8 分)。 表一 交易編號 銷售商品 A10001 A、B、C A10002 A、D A10003 D、E A10004 A、B、C A10005 C、F A10006 F A10007 D、F A10008 A、B、C、G A10009 E、G A10010 A、B 106年公務人員特種考試警察人員、一般警察 人員考試及106年特種考試交通事業鐵路 人員、退除役軍人轉任公務人員考試試題 全一張 (背面) 考試別: 一般警察人員考試 等 別: 二等考試 類科別: 刑事警察人員犯罪分析組 科 目: 資料探勘技術(包括資料庫管理與運用、線上交易處理【OLTP】、資料倉 儲【Data Warehouse】、資料探勘【Data Mining】)
假設U 大學之學生資料庫有下列表二的12 筆資料,其Status(學籍狀態)、Major (主修)、Birth_Place(出生地)、GPA(平均成績)四個屬性值之部分的概念樹個 別如圖1,2,3,4(註:圖4 的[2.0-2.9]表示其數值介於2.0 至2.9 間,也可為2.9 或2.0。 其餘[3.0-3.4] 等概念類推)。請利用這些資料,以概念樹導向方式,找出研究生 (Graduate)與大學生(Undergraduate)的區別規則(Discrimination Rule),注意: 請列出你的推導過程,且最後的規則應為最抽象、精簡,並加上機率。(21 分) 表二 Student_ID Status Major Birth_Place GPA 1001 M.A. History 臺北市 3.5 1002 Junior Math 新北市 3.7 1011 Junior Liberal_arts 桃園市 2.6 1012 M.S. Physics 臺南市 3.9 1021 Ph.D. Math 溫哥華市 3.3 1022 Sophomore Chemistry 高雄市 2.7 1031 Senior Computing 基隆市 3.5 1032 Ph.D. Biology 大阪市 3.4 1041 Sophomore Music 臺東市 3.0 1042 Ph.D. Computing 基隆市 3.8 1051 M.S. Statistics 東京市 3.2 1052 Freshman Literature 花蓮市 3.9 圖1 學籍狀態概念樹 Any Undergraduate Graduate Freshman Sophomore Junior Senior M.A. M.S. Ph.D. 圖4 平均成績概念樹 Any Average Good Excellent [2.0 - 2.9] [3.0 - 3.4] [3.5 - 4.0] Any 圖3 出生地概念樹 大 阪 市 Taiwan Foreign 北部 中部 南部 東部 離島 Japan Canada 臺 北 市 新 北 市 基 隆 市 桃 園 市 臺 南 市 高 雄 市 花 蓮 市 臺 東 市 馬 公 市 東 京 市 溫 哥 華 市 Any 圖2 主修概念樹 Art Science Computing Math Physics Chemistry Liberal-arts Biology Statistics History Music Literature

本頁資料來源:考選部歷屆試題·整理提供:法律人 LawPlayer· lawplayer.com