教育測驗與統計概要考古題

看課程介紹看課程

資料由法律人 LawPlayer整理提供·橫跨多種國考 / 法律人 LawPlayer 編輯整理

教育測驗與統計概要考古題｜歷屆國考試題彙整

橫跨多種國家考試的教育測驗與統計概要歷屆試題（選擇題 + 申論題）

年份：

教育行政 100 題

動態評量（dynamic assessment）是屬於另類評量方法的一種，請說明它的適用對象，以及若與傳統評量比較，動態評量具有那些優點特色可以彌補傳統評量的不足？（25分）

何謂客觀式測驗？其適用時機與種類為何？（20 分）

假設有一位心理學家想籌建一套測驗評量系統，作為未來升學或就業時的診斷評估與甄選之用，並擬由各種不同心理測驗工具所組成。請問：你會建議他該考量什麼因素作為挑選測驗工具之參考標準？（25分）

大雄的數學考70 分，英文考85 分。該校數學科的平均值為65，標準差為5；英文的平均值為80，標準差為10。就相對地位而言，大雄這兩科的表現那一科程度比較好？本題需顯示計算過程與結果。（30 分）

有一題選擇題經施測與試題分析後，各選項次數分布情形如下表，請分別計算這題的難度值與鑑別度值（都要列出計算式與過程），並判讀其數值意義（好壞或優劣），以及分析本題之誘答力。（30 分）選項 A B C＊D 高分組2 0 14

某國小六年級學生的英語文檢測成績，剛好呈現常態分配的結果；此時，平均數、中位數及眾數等三種集中量數的數值，剛好都會相等。由於該校地處都市與偏鄉的交界處，後來因為發生下列事故情境，導致該校英語文成績的次數分配開始產生變化：情境：由於當地政府正在積極整頓當地的交通問題，一時之間，交通陷入黑暗期，導致該校英語文成績優異的學生紛紛轉出至鄰近都市裡的學校就讀。請問：此時，該校英語文檢測成績的次數分配，將會呈現何種偏態的次數分配？（5分）在該種偏態的次數分配中，平均數、中位數及眾數等三種集中量數，何者的數值將會最大？（5分）情境：一段時間後，當地政府整頓交通問題完畢，當地交通變得十分通暢。該校校長為挽救該校的就學率，大力推動雙語教育政策，反而吸引鄰近都市與偏鄉學校中英語文高材生紛紛轉入該校就讀，甚至，連當初轉學出去的高材生也全部紛紛回籠轉學回來就讀。請問：此時，該校英語文檢測成績的次數分配，將會呈現何種偏態的次數分配？（5分）在該種偏態的次數分配中，平均數、中位數及眾數等三種集中量數，何者的數值將會最大？（5分）情境：經過上述兩種情境的干擾影響後，該校校長終將發現，在該校英語文檢測成績的次數分配中，有一種集中量數始終都會介於另兩種集中量數之間。請問：它會是何種集中量數？（5分）

低分組0 0 8 12 ＊者表示為該題之正確答案四、為辦理高中職學生機器人擂臺一日賽，主辦單位邀請五位專家擔任評審。主辦單位如何提高競賽評審結果的信度。（20 分）

某教授觀察到教育統計學的學習成績，似乎存在著性別差異，且多數文獻均顯示男性學生的成績遠優於女性學生的成績。請問：你會建議他採用何種統計分析方法來驗證所觀察到的現象，並說明此檢驗的步驟？（25分）

王老師以標準化智力測驗來建立高中聯考成績的效標關聯效度，其效度係數為.80。智力測驗與高中聯考成績的平均數與標準差如下表所示。如果有一位國三學生小美在智力測驗得到125 分。請回答下列問題： 若以智力測驗結果預測高中聯考成績，則小美高中聯考成績應該是幾分？（10 分） 高中聯考成績的估計標準誤是多少？（5 分） 小美的智商為125 分，若以95%信賴區間進行估計，她的高中聯考成績應介於那個區間之內？（10 分）表智力測驗與高中聯考成績之平均數與標準差項目智力測驗高中聯考平均數 100.0 470.0 標準差 15.0 75.0

請試述下列名詞之意涵：（每小題5 分，共25 分） 穩定與等值係數（coefficient of stability and equivalence） 內容效度（content validity） 估計標準誤（standard error of estimate） 典型表現測驗（typical performance test） 效標混淆（criterion contamination）

計算兩個變項之間的相關係數會因為變項尺度之不同，而有不同的估計方法。請舉出五種相關係數估計方法，並指出每種方法使用變項尺度。（25 分）

凱利方格法（repertory grids）的基本理念為何？（10 分）又其實施程序為何？（15 分）

王老師要診斷國小六年級學生的學習困難，請幫王老師提供診斷學習困難的策略。（25 分）

請分別舉例說明簡單迴歸分析、單因子變異數分析及單因子共變數分析的使用時機（12 分），並敘明簡單迴歸分析及單因子共變數分析有那些基本假設？（13 分）

近年來試題反應理論（Item Response Theory）成為測驗編製很重要的新方法之一。請說明它的意義、基本假定，以及對它的評價。（25 分）

使用概念圖於評量的適用時機及其相應之目的為何？（10 分）其評量的計分包含那些項目？（15 分）

Anderson 等人對Bloom 在認知領域的教學目標做了修正，請說明此兩向度之內容。（20 分）

有關選擇題的命題原則，請提出四項並詳細說明。（20 分）

差異化教學愈來愈受重視，請說明與之搭配的差異化評量作法為何？（30 分）

選擇反應題型（客觀式測驗題）與建構反應題型（論文式題型）在計算信度時，分別適用何種信度指標？請說明這兩種信度指標的計算方式，以及你使用這兩種信度指標的理由。（20 分）

共有兒童75 人，他們第一次接受牙醫檢查的年齡統計如下表：年齡（歲） 1 2 3

102 年國中基本學力測驗的計分方式是將受測者的答對題數轉換成1～80 分的量尺分數（各科平均數約為50 分），103 年以後改成國中教育會考，將受測者的答對題數依據事先公布的能力描述轉換成「精熟」、「基礎」、「待加強」三種等級。請問這兩種測驗結果的呈現方式在測驗上稱為什麼？這兩種測驗類型在分數的意義、測驗結果的參考依據、常見的分數（分級）類型，以及受測者數量的需求上有何不同？（20 分）

承上統計考驗結果，針對批判思考意向，其統計假設的考驗結果以及學生的學習成效為何？可能會犯那一類型錯誤及其理由為何？（15 分）

某次考試統計各類科的報考人數如表1 所示，所有考生在英文測驗上的成績分布如表2 所示：表1 各類科的報考人數考生組別行政類科商管類科法學類科技術類科總計合計 300 50 100 50 500 表2 英文測驗的成績分布分數範圍 46-50 51-55 56-60 61-65 66-70 71-75 76-80 81-85 86-90 91-95 總計合計 10 25 40 80 85 90 80 50 30 10 500 若要將表1 整理成統計圖以了解各類科占總報考人數的比例，應採用何種統計圖較為洽當？為什麼？（10 分） 為了解各分數範圍的人數變化情形，請用表2 繪出最適當的統計圖，並算出英文成績的平均數。（10 分） 如果要判斷英文測驗的成績分布是否大致符合常態分布，應該使用何種方法來進行檢驗，請描述你的檢驗程序。（10 分） 若商管類科考生的英文平均數為77 分，技術類科考生的英文平均數為74 分，並假設所有考生的英文成績屬於同一母群體，其變異數為 100 分。請使用假設考驗( 0.05)  來推估商管類科考生的英文成績是否顯著高於技術類科考生 (1 0.05) [Z 1.65]   ？（10 分）

人數（人） 10 10 20 15 20 請計算接受檢查的平均歲數及標準差。（10 分） 請找出年齡的中位數。（5 分） 請解釋為何平均數和中位數有所不同？請以資料分布的型態來說明。（10 分）四、若假設（hypothesis）之比例為6：3：1，以下是抽樣100 人對不同身分者的信賴度結果調查：專家碩士學歷者大專學歷者 52 36 12 若虛無假設為真，請問此三細格之期望值各為多少？（10 分） 卡方檢驗的自由度為多少？（5 分） 所計算出來的卡方值為多少？（10 分）

若是想要自編標準化量表，需如何進行？亦即需進行那些項目與程序以確認量表的性質與品質適合用於研究，所舉項目與程序需詳細說明之。（25 分）

現行許多量表、問卷常以電子表單進行施測，這種施測方式已漸漸地取代了紙本施測方式，試評論以電子表單施測方式的優點與缺點。（10 分）

當前有許多考試方式（如：升學考試、證照考試等），都採用申論題當作主要的考題類型之一。如果你獲邀進行閱卷，你應該遵守那些評分原則，才能確保考生的作答結果能夠獲得公平公正地評閱？請至少寫出五項原則。（25分）

為了避免一般民眾或非受過測驗專業訓練的人員誤用與濫用測驗工具，美國心理學會曾制訂一些相關規定，以作為測驗使用者都必須遵守之倫理規範。請問：為了能夠導正測驗的正常使用，那些倫理規範是測驗使用者必須遵守的一般原則？（25分）

近年來的教育改革，允許學生提供多年來的學習歷程檔案紀錄，以供大學或高中職校的入學甄審委員會評審，並作為入學管道之一。請你評論這種以檔案評量（portfolio assessment）作為升學管道之一的特色及其優缺點為何？請至少寫出五項並評述之。（25分）

過去，許多專家學者常批評傳統選擇題型的各類型試題，大多只能測量到考生較低層次的認知能力。有一種新式的選擇題型測驗試題—稱作「題組題」，卻可以用來測量考生較複雜的學習結果或較高層次的認知能力（如：分析、綜合、評鑑）。請說明：這種「題組題」的命題原則為何？（25分）

某統計學者自同一母群中隨機抽取兩組等組樣本，進行數學科成就測驗，並想進一步檢定該兩組樣本的平均成績是否有顯著差異存在。已知他獲得其中的A組有11名受試者、平均數為55分、標準差為10分，B組有11名受試者、平均數為60分、標準差為12分。後來，他發現自己登錄錯誤資料，應該是A組每位受試者各加5分、B組每位受試者各加10分的結果才是正確。請問：經校正後，這兩組樣本的平均成績之間有無顯著差異存在？請寫出你的檢定程序及結論（當 .05  時，查表臨界點 2.086 t  ）。（25分）

請利用變異數的特性，回答下列問題： 假設有N 位受試者，每個人各有兩個測量變項（X 與Y）的分數，已知其中的X 變項的平均數為10分、變異數為36分，Y 變項的平均數為 12分、變異數為16分，X 變項與Y 變項之間的相關係數為0.25。請問：若把每位受試者的這兩個變項分數先相加，使之成為一個合併變項分數，那麼，此合併變項分數的變異數是多少分？（8分） 承上一題，若把每位受試者的這兩個變項分數先相減，使之成為一個合併變項分數，那麼，此合併變項分數的變異數是多少分？（8分） 承上，如果把每位受試者的X 變項都各加4分的話，則新的X 變項的變異數是多少分？（5分） 承上，如果把每位受試者的Y 變項都各乘4分的話，則新的Y 變項的變異數是多少分？（4分）

某統計學者收集到7名受試者樣本的智力分數（X）與學業成績分數（Y），其原始資料與標準化資料如下表所示：（每小題5分，共25分）原始分數原始分數標準分數受試者 X Y X 2 Y 2 XY ZX ZY ZXZY A 74 84 5476 7056 6216 .8 1.07 .86 B 76 83 5776 6889 6308 1.12 .85 .95 C 77 85 5929 7225 6545 1.28 1.28 1.64 D 63 74 3969 5476 4662 -.96 -1.07 1.03 E 63 75 3969 5625 4725 -.96 -.85 .82 F 61 79 3721 6241 4819 -1.28 0.00 0.00 G 69 73 4761 5329 5037 0.00 -1.28 0.00 總和 483 553 33601 43841 38312 0 0 5.30 平均 69 79 4800.14 6263 5473.14 0 0 0.7571 請問：X的變異數為何？ X與Y的共變數為何？ X與Y之間的相關係數是多少？ X預測Y的標準化迴歸方程式為何？ 承上題，該迴歸方程式的決定係數為何？

某教育學者想瞭解「遠距教學的成效是否可以提高學生的學業成績」？他利用10名學生當受試者，讓他們接受為期一個學期的遠距教學試驗，並收集該批受試者於遠距教學實施前的學業成績和遠距教學實施後的學業成績，分別如下：遠距教學實施前：70，80，80，70，60，65，80，80，85，60 遠距教學實施後：90，85，80，75，80，90，75，85，90，80 請問：該教育學者的問題能否獲得實徵數據的支持？請列出整個研究問題的假設檢定步驟，並做出最後的結論。（25分）（參考資料： 9, .05 2.262 dft     ，試驗前的平均數為73、標準差為9.19，試驗後的平均數為83、標準差為5.87，兩者之間的相關係數為0.1236）

丁老師要了解甲班16 名學生的期中考國語成績平均分數82.0 分、標準差為9.6 分，是否與全校學生國語平均成績76.0 分有明顯差異，請您幫丁老師依研究問題、研究假設、選用統計方法、以.05 犯錯機率、裁決與解釋檢定結果意義等檢定步驟作答（查表值t.975, 15 = 2.131、t.975, 16 = 2.120）。（25 分）

某公司去年營運良好，醞釀加薪，提出加薪3,000 元或是15%的方案供選擇。若公司平均薪資為55,000 元，中位數為35,000 元，眾數是30,000 元。若加薪5,000 元，平均數、中位數以及眾數會如何改變？若加薪 15%，薪資的標準差與原本標準差的關係為何？如果甲的薪資等於平均數，選擇那種方案比較有利？若薪資等於眾數的話，又選擇何種方案有利？請分別說明之。（20 分）

王老師分析學生學習表現之相關因素，以積差相關進行計算。王老師統計出各變項之相關係數後，在解釋變項之間相關程度宜注意那些重點？請寫出五項重點。（25 分）

根據下述屬性，分別說明心理測驗的類別。（每小題6 分，共30 分） 測驗測量的特質 測驗分數的解釋方式 測驗實施的方式 測驗時間限制 測驗材料

問卷調查法需要設計研究工具，研究者為了避免所設計的工具信度不佳，常會以許多方法來改善。請寫出五項可以提高研究工具信度的方法。（25 分）

甲測驗的平均值為50 分，標準差10 分，小華考了60 分。假設該測驗的分數呈常態分配，則小華的百分等級為多少？T 分數又是多少？常態化標準分數為何？該測驗的信度為.91，則該測驗的測量標準誤是多少？小華分數的95%信賴區間為何？請分別說明之。（25 分）

要進行一次公平客觀的教學評量不容易，教師必須適切遵守評量的基本原則，才能發揮教學評量的功能。請舉出五項教學評量的基本原則，並說明這些原則的內容。（25 分）

已知甲校的素質較為整齊，乙校和丙校學生能力分布類似，都是能力差異大。研究者為了解A 測驗的信度，將A 測驗施測於三所學校的學生。乙校同時施測A 測驗的複本，丙校則是隔一週後才施測A 測驗的複本。 A 測驗分數的信度從甲校計算出來與從乙校計算出來，兩者大小關係為何？這是那種信度？其所關心的測量誤差是什麼？（10 分） 乙校和丙校兩次施測所得分數之相關分別是那種信度，兩者的大小關係為何？其所關心的測量誤差分別為何？（15 分）

某研究者編訂一套高中二年級的數學成就測驗，共有20 題4 選1 的選擇題，他以自己任教的明星高中學生為樣本，相隔4 週施測，得到複本信度是0.6。請問該研究者可以如何增加該高中二年級數學成就測驗的信度？請列出至少5 個方法，並說明你的理由。（25 分）

丁老師想要瞭解亞洲四小龍國二生的回家作業完成時間（以小時為單位）與數學成就差異，從TIMSS 2011 取得資料，經過分析之後結果如表所示。請回答以下問題。 四個國家國二生完成作業時間，依國名從最高到最低排列為何呢？（4 分） 丁老師運用那一種統計方法檢定呢？此方法檢定步驟為何呢？（9 分） 在完成作業時間與數學成就，四個國家是否都有明顯差異呢？為什麼？（6 分） 請解釋數學成就的事後比較一欄的意義（6 分）表：亞洲四小龍國二學生回家作業完成時間及數學成就的差異情形變項國家平均數標準差 F 值 Scheffé法事後比較完成時間臺灣(a) 2.19 0.90 F（3,20541）=589** a>b**；a<c** 南韓(b) 1.96 0.84 a<d**；b<c** 香港(c) 2.47 0.90 b<d**；c<d** 新加坡(d) 2.69 1.14 數學成就臺灣(a) 586.14 98.08 F（3,21674）=44** a<d**；b<d** 南韓(b) 587.54 82.93 c<d** 香港(c) 587.13 70.08 新加坡(d) 601.31 78.18 ** p < .01

為了了解教師能否有效運用教育知識，某縣教育局在教師甄試時，舉出教育現場常見的問題，並請與試者闡述要如何利用教育相關理論解決這些問題。請問在評閱這些試題時，該教育局可以如何增加評分的客觀性？請列出5 種方法，並說明要如何做及其理由。（25 分）

研究者想要瞭解40 位學生在學期初及學期末，對數學課喜歡程度改變情形是否具有顯著差異。學期初及學期末對40 名學生調查，得到資料如表。請依據檢定步驟，寫出研究假設、選用統計方法與計算、以α＝.05 檢定、進行裁決與解釋。（顯著水準α＝.05，自由度1、2、3、4 查表各為X2 1=3.84、X2 2=5.99、X2 3=7.81、 X2 4=9.49）。（25 分）表：學期初及學期末的40 名學生調查資料學期末喜歡不喜歡總和學期初喜歡 8 16 24 不喜歡 12 4 16 總和 20 20 40

某研究者想探究測驗焦慮、學習時數，與學業成績的關係。他施測了200 位受試者，結果發現測驗焦慮與學業成績的皮爾森積差相關為-0.56，而學習時數與學業成績的皮爾森積差相關為0.46，這二個相關都達顯著性（α = .05）。 請問根據這個結果，測驗焦慮與學習時數，何者與學業成績的相關性較高？請說明你的理由。（10 分） 請先說明相關達顯著性的意義，並用你自己的話，說明測驗焦慮與學業成績的皮爾森積差相關為-0.56 以及學習時數與學業成績的皮爾森積差相關為0.46 所代表的意義。（15 分）

問卷調查法是社會科學研究的重要方法之一。問卷調查需要設計適切的問卷題目，才能組成一份具有信度與效度的研究工具。請說明在進行社會科學研究時，編製問卷題目應掌握那些原則呢？（25 分） 107年公務人員普通考試試題全一張（背面）類科：教育行政科目：教育測驗與統計概要

某班級共有30 名學生，他們在某測驗的得分平均值為32，中位數為34，全距為26，四分差是5，標準差則是6.5。如果把每個人的分數都加10 分，請問平均值、中位數、全距、四分差及標準差會變成多少？（25 分）

請試述下列名詞之意涵：（每小題5 分，共25 分） 第二類型錯誤（Type II error） 中央極限定理（Central Limit Theorem） 變異數同質性（Homogeneity of Variance） 驗證性因素分析（confirmatory factor analysis, CFA） 中介變項（Intervening Variable）

請舉例並說明一個完整的教學歷程中，各項目與教學評量之間的關係。（25 分）

某教育學者擬發展一份10 個題目的短題本「考試焦慮量表」。他經過資料收集後，並使用SPSS 統計套裝軟體程式來分析該量表的信度，結果如下表所示： R E L I A B I L I T Y A N A L Y S I S - S C A L E （A L P H A） Item-total Statistics Items Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item- Total Correlation Squared Multiple Correlation Alpha if Item Deleted 第一題 26.3824 17.6979 .4884 .5115 .7236 第二題 26.9412 18.4207 .4475 .3673 .7307 第三題 26.9706 16.2718 .5667 .4929 .7086 第四題 26.4412 20.7389 .0197 .1837 .7838 第五題 26.3529 16.3565 .6318 .5959 .7001 第六題 27.1765 19.6043 .1541 .4809 .7700 第七題 26.8529 16.0080 .6303 .7519 .6983 第八題 26.6765 18.8316 .3354 .4104 .7437 第九題 26.8824 16.4100 .6231 .7584 .7014 第十題 25.8824 18.7130 .2957 .4507 .7499 N of Cases = 1234 Reliability Coefficients 10 items Alpha = .7535 Standardized item alpha = .7488 試問：（每小題5 分，共25 分） 該「考試焦慮量表」的信度係數是多少？ 在上表中，有那幾題是應該刪除的不良題目？ 在上表中，品質最好、鑑別度最高的優良題目是那一題？ 承上題，若你決定要刪題的話，應該優先刪除的是那一題？ 承上題，刪題後，本量表的信度係數是多少？（請接第二頁） 106年公務人員普通考試試題全三頁第二頁類科：教育行政科目：教育測驗與統計概要

客觀式選擇題可經由試題分析，獲得各題的試題難度、試題鑑別度，及選項誘答力的訊息，請分別說明試題難度、試題鑑別度、選項誘答力三者的意義和彼此間的關係。（25 分）

某教育學者分析某一題的試題分析結果如下表：選項 A B C D＊難度鑑別度選項分析高分組（選答比率） 0.0069 0.0419 0.0173 0.9336 .5094 .7768 低分組（選答比率） 0.1002 0.3392 0.4033 0.1568 註：＊表示正確選項。試問：（每小題5 分，共25 分） 請評論該題的難度指標？ 請評論該題的鑑別度指標？ 請評論該題的選項誘答力？ 請判斷該題係值得納入題庫或直接刪除？ 請綜合上述評論，判斷該題的命題品質良窳？

有五位評審委員分別為35 位參加甄試者的美術、音樂兩科的表現評分，甄試後發現這五位評審委員在美術成績一致地給分高，而在音樂成績一致地給分低，若計算這兩科成績間的相關，請問將會獲得何種結果（請在正相關、負相關、零相關、不確定四個結果中進行選擇）？並請為你的選擇結果提出解釋說明？（25 分）

某教育學者想知道「學習投入」（單位：小時）是否具有預測「學業成績」（單位：分）的效用。他根據資料分析結果，獲得下列報表： Variable B SE B Beta T Sig T 學習投入 2.75 .44 .90 6.21 .003 截距 -1.05 2.75 -.39 .702 試問：（每小題5 分，共25 分） 這整個迴歸方程式該如何表示？ 「學習投入」真的可以預測「學業成績」嗎？請解釋。 「學習投入」與「學業成績」之間的相關係數是多少？ 「學習投入」可以解釋多少百分比的「學業成績」變異量？ 每增加一小時的「學習投入」，預估可以提高多少分的「學業成績」？（請接第三頁） 106年公務人員普通考試試題全三頁第三頁類科：教育行政科目：教育測驗與統計概要

請說明電腦化適性測驗的建置方式、施測方式，以及電腦化適性測驗的優點。（25 分）

某教育學者想知道「考試焦慮」對「考試成績」的影響情形。他經過問卷調查的資料分析後，獲得下列報表：考試焦慮組別統計量依變項考試焦慮組別 N 平均數標準差平均數的標準誤考試成績高 772 153.89 52.28 1.88 低 493 163.89 61.86 2.79 獨立樣本 t 檢定基本假設變異數相等的 Levene 檢定平均數相等的 t 檢定 F檢定顯著性 t 自由度顯著性（雙尾）平均差異標準誤差異差異的 95% 下界信賴區間上界假設變異數相等 23.19 .000 -3.16 1263 .002 -10.06 3.24 -16.42 -3.71 不假設變異數相等 -1.89 920.96 .053 -10.06 5.26 -20.37 0.25 試問：（每小題5 分，共25 分） 高、低考試焦慮組別的考試成績差異多少？ 獨立樣本檢定結果的自由度為何？ 請列出上述 t 檢定結果的 95% 信賴區間？ 上述 t 檢定的變異數同質性假設，是否成立？ 高、低考試焦慮組別的考試成績，是否具有顯著差異存在？

一個已知為常態分配的母群，其平均數為25，標準差為12。若實驗樣本得到的平均數分別為(A)19 和(B)35，計算其實驗效果量並評價其大小。（10 分）

段考後，陳老師做了試題分析，他將班上40 位學生分為高分組以及低分組二組。其中有一題標準答案為C，班上學生各選項回答人數如下： A B C* D 高分組 0 11 8

某班學生的數學成績平均數為60，標準差為10.00，而英文成績平均數為40，標準差為8.00，試問該班學生的兩科目成績何者的差異較大？（25 分）

低分組 0 8 10 1 請問這一題的難度（P）多少？（5 分） 請問鑑別度（D）多少？（5 分） 請問那個選項最需要修改？為什麼？（5 分） 請問你會不會建議陳老師保留這個題目？為什麼？（10 分）二、某研究隨機抽取全國1250 名學生接受一份標準化智力測驗，小明的排名是第200 名。 請問小明的PR 值是多少？請列出算式。（10 分） 請問這份測驗如果是魏氏兒童智力量表（WISC-IV），則小明的智商是多少？如果是斯比量表第5 次修訂版（SB-5）則小明的智商應是多少？請說明你是如何計算出來的。（15 分）

某生之Z 分數為1.0，請問轉換成T 分數、AGCT 分數、CEEB 分數、離差智商（魏氏量表DIQ）以及離差智商（斯比量表DIQ）各為多少？（25 分）

下表是某項研究，男女生測驗得分情形。請問男女生的成績分布有沒有顯著差別？請寫出統計過程，以及你的結論（附卡方分配表）。（25 分）性別全部男女成績高分 78 72 150 普通 115 85 200 低分 107 43 150 全部 300 200 500

何謂信度？並說明信度的估計方法與信度大小的關係。（25 分）

下列表格為某試題的選目分析資料，請計算該試題的鑑別指數與難度指數。（25 分）組別選目 A B* C D 未答高分組 2 16 1 1 0 低分組

某教師月考後計算全班英文成績之標準差與平均值，該班學生35 人，得平均值為 62.5，標準差為7.25，中位數為65。 請問從上述數據，假設該班成績為單峰分配，你推測該班英文成績分配應呈那種偏態？為什麼？（10 分） 樣本平均數的抽樣分配之平均值與標準差各為多少？（10 分） 後來，學校認為該次月考平均分數太低，決定每個學生都加5 分，請問該班平均值與標準差會變為多少？（5 分） 105年公務人員普通考試試題全一張（背面）類科：教育行政科目：教育測驗與統計概要卡方分配表 2 α x 0 α

8 4 3 0 *表示正確答案。

回答下列有關雙向細目表的問題： 何謂雙向細目表？（10 分） 敘述雙向細目表的重要性。（5 分） 雙向細目表與測驗的效度有何關係？（5 分）

測驗編製及實施時，信度是重要的考量，請針對穩定係數、延宕複本信度、內部一致性（α）、以及評分者信度等信度估計方法來分析各種方法可能的誤差來源。此外，請說明在比較不同評量工具的信度係數時，需考量的因素有那些？（25 分）

試述信度的種類、重要性以及估計信度所使用的統計方法。（20 分）

和平國小吳老師編製了一份課堂數學評量，題型包含客觀及紙筆實作試題兩類。 請從內 content）、歷程（process）、後果（consequences）三個面向，說明吳老師應如何建立該份測驗結果的效度。（15 分） 「構念代表性不足」（ construct-underrepresentation）及「無關構念」（construct- irrelevant）是影響評量結果的兩大威脅，請解釋其意義及影響，並具體說明那些因素會造成此現象。（10 分）

103 年開始的國中教育會考對教育當局、學校、老師及學生具有那些用途？（20 分）

研究員欲了解某一課程補救教學介入程度（X，1 至4，數字愈大表愈強）對學習成績（Y）的影響。16 名學生隨機分成相同人數的四組，並接受不同程度的補救教學介入，課程結束後，16 名學生學習成績平均數Y 為68.75，而   16 1 2 453 ,4 ) ( i i Y Y 。試回答下列問題： 請利用簡單線性迴歸分析及單因子變異數分析方法，陳述研究問題與對應的研究假設（H0 & H1）。（10 分） 已知 X 與Y 的相關係數為0.831，而單因子變異數分析表中，組間的平方和為 3,237，計算兩分析方法中X 與Y 的關聯強度，並說明差異的原因。（10 分）

兩校實施標準化數學成就測驗，甲校100 人的平均數是80 分，標準差是8 分；乙校 100 人的平均數是60 分，標準差是15 分。回答下列問題： 比較兩校學生表現的特徵。（10 分） 如果你是測驗編製者，將選用那個學校的學生作為信度分析的樣本？理由何在？（5 分） 利用何種統計方法，可以檢定甲校的成績是否優於乙校？（5 分）

下圖是61 位學生在某門課上成績的莖葉圖，請根據圖回答下列問題（回答下列問題時，請將男女生的得分一併考慮）：（30 分）男生莖女生 2 1 6 3 4

假設你在本測驗得到的成績，相當於T 分數60 分。若這個測驗的平均數是60 分，標準差是20 分。回答下列問題：（每小題10 分，共20 分） 你得到的原始分數是多少？ 根據常態機率分配，在100 人中，你大概可以贏過多少人？

03 8876655320

0145566899 87665543221

0112334566677889 42 9 0023356  成績的次數分配圖會呈現何種型態？眾數和中位數各是多少？全距為何？  已知整組資料的標準差為12.45，請問變異係數（coefficient of variation）是多少？其使用時機為何？

學生能力程度類似的甲、乙兩班，因為授課教師不同，所用試卷亦不同，學期末的數學期末考試成績之描述資料如下：甲班平均數為80 分，中位數84 分，標準差5 分；乙班的平均數65 分，中位數60 分，標準差4 分。請根據這些數據回答下列問題：（每小題5 分，共25 分） 甲班林生得85 分，乙班李生得73 分，如果將林、李兩生的成績化為T 分數，則誰的T 分數較高？兩班平均數差異如此大，不以原始分數比較而以T 分數來比較，主要是建立在何種前提之下？ 若乙班張生實際得分為66 分，後來老師發現誤將張生的成績登錄為61 分，試問修正過後乙班的平均數與中位數受何影響？ 若甲班老師將每位同學的分數加5 分，則平均數與中位數有何種變化？ 若甲班林生（得分85 分）原本的百分等級為63，則加5 分之後，其百分等級有何變化？ 由所提供的數據來判斷，甲班和乙班分數之偏態有何差異？

請試述下列名詞之意涵： 標準化測驗（standardized tests）（8 分） T 分數（T-score）（8 分） 常態化標準分數（normalized standard scores）（9 分）

當我們解釋一個重要的測驗結果（例如：智力測驗得分）時，應注意那些事項？（25 分）

常模參照測驗與效標參照測驗有何不同？當一個老師說要當掉最差的10%的學生，是那一種測驗的概念？（25 分）

某輔導老師研究其針對國小高年級學生所設計的性別知識輔導方案是否能有效提高學生的性別知識。輔導老師以前測及後測的方式，收集了32 名學生輔導前及輔導後的性別知識表現。 若輔導老師以相依樣本T 檢定來檢定其問題。說明其所收集的資料需符合那些特性，以確保使用T 檢定的適當性。（10 分） 若輔導老師得到性別知識前後測進步分數的95% 信賴區間介於3.2 分與4.8 分之間，根據該區間，說明32 名學生的性別知識表現是否有顯著的進步？（5 分） 輔導老師資料收集的一個缺點為「學生性別知識表現有顯著進步未必表示該輔導方式有效」。若樣本數依然為32，建議一個資料收集方式，以改善該缺點。（10 分）

某班教師針對全班30 位學生進行考試準備時間和微積分期中考的得分進行分析，結果發現考試準備時間（小時）與考試分數之間的相關為0.6。已知30 位學生這次考試準備的平均時間為15 小時，標準差為5；微積分期中考的平均分數為52 分，標準差為16： 請算出使用考試準備時間來預測微積分期中考分數的非標準化迴歸方程式。（5 分） 某生考試準備了25 小時，你預測此人的微積分期中考分數應為多少分？（5 分） 此處迴歸情境中的估計標準誤是多大？（5 分） 針對所有準備25 小時的人，他們的微積分期中考分數95%的可能性是在幾分與幾分之間。（請以四捨五入取概數至整數即可，X 值落在 x x . σ μ 96 1 ± 之間者佔95%）（5分）

長興國中林老師編製了一份數學科的月考測驗（包含40 題對錯計分的選擇題及4 題多元計分的應用題）。下列為林老師建立這份測驗信度的方式：⑴他隨機抽取 100 位學生，在月考後1 週重新施測了一次，得到兩次測驗分數的相關為.50；⑵他分別求得選擇題及應用題的α 係數，前者為.80、後者為.40；⑶他隨機抽取50 份試卷，請兩位評分者批改多元計分的應用題，並求得兩位評分者給分的相關為.60；⑷他求得學生月考分數與上學期數學總成績的相關為.90。 請說明林老師建立課堂數學成就測驗信度的方式中有那些是不恰當的？理由為何？（10 分） 針對林老師所蒐集的適當信度係數，說明這些信度的意義及影響信度的因素，並提出提高信度的方法。（15 分）

如果你手中有某單位員工的出生地點、在家中的排行與年齡的資料， 請分別說明這三者分別屬於何種層次的變數？（10 分） 有什麼集中量數與離散量數可以用來描述這三個變數？（10 分） 這三個變數中有那些可以進行四則運算？（10 分）

請回答下列有關效標關聯效度（criterion-related validity）的敘述： 何謂效標關聯效度？（5 分） 效標關聯效度指數的高低通常用什麼統計方法計算而得？（5 分） 適合用來當作效標關聯效度的效標有那些？請舉7 個例子說明。（15 分）

Robert Linn 曾在其著作提到效度乃是一種一元論的概念，只是具有多種型式的證據，包括內容、建構、效標關聯和後果等四個面向。Linn 也提到就許多測驗與評量而言，既不實際也不需同時考量上述四個面向。試就此四面向給予簡單定義，並以教室班級評量及學術性向測驗為例，說明各所強調的主要考量效度面向為何？較次要的面向為何？（30 分）

近年來解釋型題目（interpretive exercise）的應用逐漸增多，請說明： 何謂解釋型題目？（5 分） 為何解釋型題目可以測量到比較高層次的心理能力（理解、應用、分析、評鑑）？（5 分） 解釋型題目擬題時應注意那些原則？（15 分）

利用某一「人格量表」與「教師評定」測量學生三項不同的特質：成就性（甲）、社會性（乙）及獨立性（丙）。根據資料分析所得之多重特質多重方法矩陣如附表。就表中資料，分別指出「相同方法測量相同特質」、「不同方法測量相同特質」、「相同方法測量不同特質」及「不同方法測量不同特質」的係數，並依據係數評論該人格測驗是否具有效度證據？（25 分）附表：人格量表與教師評定之多重特質多重方法矩陣人格量表教師評定甲乙丙甲乙丙人格量表成就性（甲） .71 社會性（乙） .62 .89 獨立性（丙） .92 .72 .67 教師評定成就性（甲） .79 .66 .64 .83 社會性（乙） .60 .61 .63 .80 .87 獨立性（丙） .51 .81 .85 .74 .69 .84

下表為8 位學生智商（X）與學業成績（Y）：學生 X Y A 13 15 B 15 19 C 7 12 D 19 22 E 10 16 F 8 11 G 11 14 H 14 20 請計算rxy ；a；b。（15 分） 若小華智商為16 分，請預測他的學業成績會得幾分？（10 分）

研究者想知道學生的數學自我效能對其數學學習表現的預測力，他蒐集30 名學生的數學自我效能量表分數（X）以及數學成績（Y），下表是這兩個變項的描述統計，兩者的相關係數為0.55。 請寫出以數學自我效能量表分數預測數學成績的非標準化的（unstandardized）迴歸方程式，解釋迴歸係數的意義。（15 分） 該迴歸方程式的估計標準誤為何？（5 分） X Y 平均值 35 82 標準差 2 5 102年公務人員普通考試試題類科：教育行政全一張（背面）

下表為6 位國中二年級學生在接受補救教學前（X1）與補救教學後（X2）英語科的成績表現：學生 X1 X2 A 17 21 B 19 25 C 15 14 D 21 25 E 12 19 F 15 18 請問要用什麼統計方法進行考驗？（5 分） 請列出研究假設？（5 分） 請實際計算統計考驗的值？（10 分） 請根據所計算結果之數值，檢定補救教學後學生英語科成績是否有進步 (t.95(5)=2.015)？（5 分）

(5) 5 分

某研究者想知道排行老大的智商是否高於老二，表一是15 個家庭老大與老二的智力測驗分數，請以適當的統計方法檢驗研究者的想法。請列出統計假設並詳述其檢驗步驟（α=.05）。（25 分）（附t 表如表二）家庭代碼老大老二差異 1 124 114 10 2 115 102 13 3 110 127 -17 4 139 104 35

116 91 25

88 102 -14

本頁資料來源：考選部歷屆試題·整理提供：法律人 LawPlayer· lawplayer.com