lawpalyer logo

統計 94 年統計學大意考古題

民國 94 年(2005)統計「統計學大意」考試題目,共 11 題 | 資料來源:考選部

0 題選擇題 + 11 題申論題

行政院衛生署疾管局於94 年10 月9-10 日對台灣20 歲以上國民進行民調。依 1092 個隨機有效樣本資料,對最近禽流感威脅進行訪查。資料中顯示有45%的人不 知道正確傳染途徑,而有55%的人知道正確傳染途徑。 若以P 代表全體國人知道正確傳染途徑的百分比,試對P 做一95% 的信賴區間 估計(臨界值為 1.96),並加以解釋。(10 分) 子題之方法與假設檢定有何關聯?試申論之。(15 分)
設X 為某商品之售價為平均值20,變異數5 之常態分配,設進貨成本Y 為平均值15,變異數4 之常態分配 ,若可假設售價與成本互為獨立,則不虧本(即為X-Y>0)之機率為何? 0.0475 0.9525 0.1587 0.8413
在統計學中有那些統計量可以用來說明一組數據的分散度(dispersion or variation)? 試舉出三種統計量及其定義(或公式)。(10 分) 依據行政院主計處94 年8 月18 日發布之“國民所得統計及國內經濟展望報告”取 得93 年度平均每戶可支配所得(單位:千元),分五組級別列表如下: 分組 級別 1 (最低所得組) 2
根據中央極限定理,樣本平均數的抽樣分配,在什麼情況下趨近於常態分配: 母體平均數為0 樣本平均數為0 母體變異數為1 趨近於常態分配的速度與樣本數大小有關
下列敘述何者恆為正確? 一組資料的最大值為90,最小值為10,其中位數為60,則此資料有右偏現象 以算術平均數為中心的標準差,較以任何其他平均數為中心的標準差小 若二組資料有相同標準差,且平均數皆為正數,則平均數愈大者,變異係數(C.V.)也愈大 兩組不同單位的資料可藉標準差比較資料之離散程度
臺灣80 年至87 年的經濟成長率分別為7.55, 6.76, 6.32, 6.54, 6.03, 5.67, 6.77, 4.65(單位:%)。下列何種統 計量最適合用描述臺灣80 年至87 年的八年平均經濟成長率? 算術平均數 幾何平均數 標準差 平均差
(最高所得組) 年所得 297 555 776 1036 1792 戶數 百分比 20 20 20 20 20 試求子題之三種統計量的數值,並加以說明。(15 分) 94 年公務人員升官等考試、94 年關務人員升官等考試試題 科 別: 統計 全一張 (背面) 三、依據台中市政府民政局第002 號統計通報,取得台中市94 年3 月底選民年齡分布 表如下:(註:每組人數不含上限年齡) 年齡組 人數(單位:千人) 20-30 歲 162 30-40 歲 182 40-50 歲 175 50-60 歲 106 60-70 歲 53 70 歲以上 50 合計 728 試計算 算術平均數(mean)。(10 分) 試計算各年齡組人數佔總人數的百分比以及向上累加百分比(“向上”表示年齡增 加)。(10 分) 試找出眾數(mode)組。(5 分) 四、依據台中市政府民政局第002 號統計通報,台中市94 年3 月底計有72 萬8 千選民, 其中性別比例是:男性為48%,女性為52%。今有某媒體記者計畫以隨機方式自台 中市選民中抽出四位選民親自訪問。試回答以下問題: 請列出所有可能的樣本空間。(5 分) 在四位選民中,全部都是女性的可能性為何?(10 分) 在四位選民中有一男三女的可能性為何?(10 分)
設有三組資料:第一組資料有50 個樣本數值,平均數為90;第二組資料有20 個樣本數值,平均數為80; 第三組資料有10 個樣本數值,平均數為60。欲將三組合併,則共80 個樣本數值的共同平均數為: 66.67 76.67 83.75 88.67
設中壢市成年人中,男性的平均體重為68.9 公斤,標準差為6.7 公斤;女性的平均體重為54.5 公斤,標準 差為6.4 公斤,則中壢市成年人中男性體重的差異程度相對於女性體重差異程度,是: 男性體重的差異程度>女性體重差異程度 男性體重的差異程度<女性體重差異程度 男性體重差異程度=女性體重差異程度 無法判斷
設一組資料:1,15,7,4,4,9,2,6, 其平均數與中位數分別為: 1, 15 8, 8 6, 4 6, 5
某人參加兩次考試,每一次考試參加人數、平均成績、標準差及自己考試成績如下表: 次別 參加人數 平均成績 標準差 自己成績 一 400 67.5 15.6 77.5 二 400 70 16 80 兩次考試中,某人考試成績相對較好? 第一次考試 第二次考試 兩次考試一樣好 無法比較 9 一組樣本中所組成次數分配的偏態係數(measure of skewness),以下何者為正確的計算方式? 各觀察值與平均數差距絕對值的總合 各觀察值與平均數差距平方總合 各觀察值與平均數差距三次方總合 各觀察值與平均數差距四次方總合 10 設標準常態分配下,95 百分位數落於標準化值Z=? 1.645 1.96 2.054 2.326 11 若已知 ( ) 50, ( ) 5 E X X σ = = ,若欲達到 ( 50 1) 0.99 P X − ≤ ≥ 的準確度,需抽樣多少個樣本數? 2000 2500 3000 3500 12 收集某地區80 戶家庭父親與兒子的學歷資料的次數分配如下,則: 兒子學歷 父親學歷 大學 大學以下 大學 18 7 大學以下 22 33 兒子學歷與父親學歷為獨立事件 兒子學歷為大學與父親學歷為大學是互斥事件 若已知父親的學歷是大學,則兒子學歷是大學的機率為18 80 若已知父親的學歷是大學以下,則兒子學歷亦是大學以下的機率為33 55 13 某品牌之DVD 放映機由A 廠及B 廠各生產30%及70%,A 廠出廠的產品中有1%瑕疵品,B 廠出廠的產品 中有5%瑕疵品。某日退貨部門回收一件瑕疵品,則下列敘述何者不正確? 猜此瑕疵品是由B 廠製造的,猜對的機率較大 此瑕疵品是由A 廠製造的機率為3 38 此瑕疵品是由B 廠製造的機率為35 1000 A 廠之瑕疵品占全部產品之 3 1000 14 假定 1 ( ) 0.25 P A = , 2 ( ) 0.75 P A = , 1 1 ( ) 0.10 P B A = , 1 2 ( ) 0.30 P B A = ,那麼 1 1 ( ) P A B =? 0.025 0.100 0.182 0.250 15 假定X 為一隨機變數,且 ( ) 100 E X = , 2( ) 60 X σ = 。使得W 為X 的線性函數,W=150+X。那麼 ( ) E W 與 2( ) W σ 為: 100;60 100;210 150;210 250;60 16 設隨機變數X 與Y 為獨立變數,則下列何者為正確?(其中E(X),E(Y)為X 與Y 的期望值,VAR(X),VAR(Y) 為X 與Y 的變異數) ( ) ( ) ( ) Y E X E X E Y = ( ) ( ) E X Y E Y X = ( ) ( ) VAR Y X VAR X Y = ( ) ( ) ( ) VAR X Y VAR X VAR Y + = + 17 個人將其資金投資在四種不同類型投資工具,其年收益及投資組合比例如下: 投資種類 年收益(x) 投資比例 f(x) 房地產 -1.5 2% 定期存款 6.5 50% 債券 8.0 28% 期貨 20.5 20% 設x 為每一元投資的年收益,假設每一投資組合的機率為f(x),則每一元投資其年收益的期望值與標準差為: 8.375;31.464 9.56;31.7464 9.56;5.6344 8.375;5.344 18 假設一上市股票依過去股價分析可知每一天上升或下降1 元的機率各為0.5,當某日的成交價格為80 元時 ,問明日的期望價格為何? 70 元 80 元 90 元 110 元 19 令X 為某工廠一星期製造健身腳踏車的數量,且X 為一隨機變數, ( ) 1,500 E X = , 2( ) 2,500 X σ = 。若定 義 800 ,7 60 + = X C 為工廠一星期的總營運費用(費用計算為7,800 元加上每台腳踏車製造需$60 元),那 麼一星期總營運費用的期望值與變異數為? 97,800;9,000,000 97,800;9,007,800 150,000;11,850,000 157,800;11,700,000 20 某遊覽車公司欲購買輪胎以為半年度定期更新之用,假設所使用輪胎的平均壽命為兩年,欲計算輪胎使用 壽命少於6 個月的機率為: 25 .0 1 − −e 3 1 − −e 25 .0 − e 3 − e 21 給定一連續隨機變數下,其機率密度函數下的面積為: 等於此連續隨機變數的平均數 依不同機率密度函數而定 等於1.00 不能判斷 22 某電腦執行程式的時間(以秒計)為一連續隨機變數,其機率密度函數如下: 0.1 0 10 x ≤ ≤ 0 elsewhere 其執行程式時間(X)的期望值與變異數為: 3.62;16.67 5.00;8.33 7.5;33.33 9.31;108.33 23 下列何種分配之平均值與變異數相等? 常態分配 指數分配 t 分配 poisson 分配 24 抽樣分配係指下列何者的機率分配? 樣本統計量 母體統計量 樣本參數 母體參數 25 設 1x , 2x ,…, nx 為由母體平均數為µ ,變異數 2 σ 中,取出之隨機樣本,且 n x x i ∑ = ,下列敘述何者不正確? 樣本變異數 1 ) ( 2 − − ∑ = n x x s i ,則 2 2 ( ) E s σ = 令 1 2 1 2 x x m + = 及 1 2 3 2 3 x x x m + + = ,則 1 2 var( ) var( ) m m < 1x 可用來估計µ 當n 愈大時, / x s n µ − 愈接近標準常態分配 26 有關 ) ( 2 r α χ 分配,r 為自由度,α 為顯著水準,下列敘述何種為不正確? 若 2 ~ ( , ), 0 X N µ σ σ > ,則 )1( ~ ) ( 2 2 χ σ µ − = x V 若 2 2 1 1 2 2 ~ ( ), ~ ( ) X r X r χ χ ,設 1 2 X X 與 獨立,則 2 1 2 1 2 Y= ~ ( ) X X r r χ + + 若 2 1 r r > ,則 2 2 0.05 1 0.05 2 ( ) ( ) r r χ χ > 卡方分配的平均數與變異數相等 27 令( 1 2 3 4 5 , , , , X X X X X )為由常態母體 2 ( , ) N µ σ 抽出的一組隨機樣本, 4 3 2 1 , , , T T T T 均為µ 的估計量, 1 1 2 3 4 5 2 1 2 3 4 5 3 1 2 3 4 5 4 1 2 3 4 5 ( 2 4 2 ) /10 ( 2 5 2 ) /15 ( ) / 5 (3 2 2 3 ) /11 T X X X X X T X X X X X T X X X X X T X X X X X = + + + + = + + + + = + + + + = + + + + 問下列何者為µ 的不偏估計量中變異數最小者? 1T 2T 3T 4T 28 假設自常態母體隨機抽出n 個樣本數,欲以區間估計方法估計母體平均數,若信賴水準(1 α − )維持不變, 當n 增加時,區間估計的寬度(width of a confidence interval): 必然增加 必然減少 不變 可能增加或減少 29 假設二個母體變異數 2 2 1 2 ( , ) σ σ 之信賴區間為 2 1 2 2 0.84 1.78 σ σ < < ,則可推論: 因為1 包含在區間內,故兩母體變異數可能相等 因為0 包含在區間內,故兩母體變異數可能不相等 因為兩變異數均大於0,故兩母體變異數可能不相等 因為0 包含在區間內,故兩母體變異數可能相等 30 某發行信用卡的銀行欲估計逾期(三個月以上)繳款的比例,抽出100 個信用卡使用者,其中12 人為逾期 繳款,則下列敘述何者不正確? 以p 表示逾期繳款比例,則樣本比例數ˆp 之抽樣分配為近似常態分配 逾期繳款比例的95%信賴區間為(0.056 , 0.184) 在此問題中,必須用ˆp (1- ˆp )來估計樣本比例數的標準誤 為達到 ˆ ( 0.1) 0.95 p p p − ≤ = 的準確度,需抽出大於100 個(n>100)信用卡消費者分析 ( ) f x = 31 在統計檢定問題中,有關「型I 誤差」與「型II 誤差」的敘述何者為正確? 型I 誤差與型II 誤差和為1.00 型I 誤差永遠大於型II 誤差 檢定力(power)與型I 誤差和為1.00 增加樣本數可同時降低型I 誤差與型II 誤差 32 假設 0H : 0.75 p ≤ 對立於 1 H : 0.75 p > ,其中p 為在職工作者希望取得碩士文憑的比率。當隨機抽樣某 群體樣本n=5000 在職工作者,其中有3415 位在職工作者希望取得碩士文憑,問所需的標準化統計檢定 量 * Z 為何? -10.94 -7.071 -0.67 -0.33 33 複迴歸分析中,考慮其模型為 0 1 1 2 2 ... k k Y X X X β β β β ε = + + + + + ,若求得的 1β 估計量為正值,但Y 與 1 X 的簡單相關係數為負值,問造成此一現象的較可能原因為何? 計算有錯誤 高度共線性 應減少解釋變數( i X )的個數 1 X 對Y 無真正的解釋能力,應自模型剔除 34 設X 與Y 的相關係數為 xy R ,W 與Y 的相關係數為 wy R 。若W=7(24- x ),則 xy R 與 wy R 的關係,下列敘述何 者為正確? 7(24 ) wy xy R R = − 7 wy xy R R = wy xy R R = wy xy R R = − 35 下列有關「直線迴歸分析」與「相關分析」的敘述,何者不正確? 迴歸分析是用迴歸方程式來表示一變數隨另一個變數而變化的數量關係 相關分析是研究二個變數之間的相互關係 在迴歸分析中,若無法明確事先控制解釋變數,則可以較易測量者或變異較小的其一變數定為解釋變數 相關分析中若相關係數接近0,可顯示兩變量無因果相關上的實際意義 36 一包含25 樣本觀測值複迴歸的函數 0 1 1 2 2 3 3 ( ) E Y X X X β β β β = + + + ,問迴歸自由度、殘差自由度、總自由 度,各別為何? 3;21;24 3;22;25 21;3;24 4;20;24 37 在一多變量迴歸分析 0 1 1 2 2 ˆY b b X b X = + + 中,假設資料分析結果得到最適模型為 1 2 ˆ 17.6 4.24 1.21 Y X X = + + ,其中 1 ( ) S b =1.0, 2 ( ) S b =0.2,以下敘述何者為真? 因為 1b 大於 2b ,故應將 2 X 剔除,只將 1 X 列入模型 以假設檢定H0: 1 0 β = ,在α =0.05 水準下,結果為不拒絕H0,並顯示 1 X 無法估計Y 以假設檢定H0: 1 0 β = ,在α =0.05 水準下,結果為拒絕H0,並顯示 1 X 可估計Y 因為 1b 大於 2b ,故應將 1 X 剔除,只將 2 X 列入模型 38 假設以簡單線性迴歸分析研究20 位受測者年齡(X)與受測者去年觀看電影的次數(Y),並得到以下受測 者資料結果: 675 X = ∑ 2 24,675 X = ∑ 11,174 XY = ∑ 371 Y = ∑ 2 7,933 Y = ∑ 則Y 與X 的關係應為: ˆ 28.92 1.406 Y X =− + ˆ 5.45 0.711 Y X =− + ˆ 37.10 0.550 Y X = + X Y 711 .0 56 . 42 ˆ − = 39 某公司有42 位銷售人員,在今年年初一月,設X 為每位銷售人員被要求預測自己未來一年在負責銷售的區 域,銷售公司主要產品的金額。設年底時紀錄正確銷售額為Y。針對此一產品,計算迴歸 0 1 ˆY b b X = + 。初 步結果如下:(X 與Y 的單位皆為千元) 126 X = n=42 0b =6.72 MSE=104.34 2 1 ( ) 37.7 X X − = ∑ 2 1 ( ) 45.738 Y Y − = ∑ 1b =1.0500 若估計金額 h X =150(千元)時,正確的平均銷售額(千元計)之點估計為: 150.00 157.50 164.22 268.56 40 在檢定處理(treatment)平均數的F 檢定中,MSTR 與MSE 為隨機變數,對應的期望值分別為 ) (MSTR E 與 ) (MSE E 。假如處理平均數不全相同,那麼下列為此兩平均數期望值關係較可能的狀況? ( ) ( ) E MSTR E MSE > ( ) ( ) E MSTR E MSE = ( ) ( ) E MSTR E MSE < ( ) ( ) j E MSTR E MSE µ = = ∑