在量化研究中,通常會對擬用的數據資料做:遺漏值(missing values)、
離群值(outliers)、可能性檢核(wild code checks/ illegal value)、一致性
檢核(consistency checks)、跳答檢核(skip/ filter checks)等等查察,以
確保原始數據資料品質。請舉例說明上述5 種數據檢核方式的意涵,並
且指出如下虛擬資料中,符合上述5 種檢核方式的數值(表中若有實例
數值請舉一例即可)。(25 分)
變項名稱
樣本序號
sex
age
eduY
pregnantN
childN
SN1
1
20
14
1
1
SN2
0
15
9
10
1
SN3
0
30
31
1
0
SN4
1
18
18
777
0
SN5
0
60
6
0
1
SN6
0
65
5
2
10
SN7
2
28
10
0
0
SN8
1
19
777
999
0
變項數值說明:生理性別(sex),0 =女性,1 =男性;年齡(age),0-100 歲;教育年數(eduY),
0-30 年;懷孕次數(pregnantN):0-10;親生子女數(childN),1-10 人;適用於各變項值:
777=不適用,999=遺漏值。為方便說明起見,可視上表為一M x N 矩陣,矩陣中元素(數值)
可以Var [row, column]表示之,例如:Var[2,3]=9, Var[3,2]=30, Var[3,3]=31……。