編者按:有鑑於2月考生學測成績公布後,「學測成績」是許多人關心的焦點。以下提供2篇文章〈學測、指考測驗性質之相關說明〉與〈學測與級分〉回應外界最近關心的學測成績相關議題,謹供外界參考。
張銘秋、趙珮晴
一、每年報考人數不同,各標人數必然不一樣
受到少子女化的影響,近年來學測報名人數逐年下降,如105年學測的報名人數為135,583人,較104年之146,035人減少10,452人。在到考人數不同的情形下,即使成績採用等比例計算,不同年度間各級分的人數也必然不同。從表1可知,75級分的人數年年不同,但人數比例介於0.10%到0.20%之間,相差不到0.10百分點。而歷年各考科五標變動僅在一級分之內,可謂相當穩定,詳見蕭次融和朱惠文撰寫〈學測與級分〉一文。
表1 近五年學測75級分的人數比例
年度 |
到考人數 |
75級分人數 |
75級分比例 |
105 |
133,905 |
138 |
0.10% |
104 |
144,406 |
182 |
0.13% |
103 |
146,017 |
295 |
0.20% |
102 |
148,208 |
163 |
0.11% |
101 |
152,932 |
288 |
0.19% |
二、大考中心學測和指考測驗目的為大學校系選才,較偏向於常模參照測驗
依據分數的解釋方式,可分成常模參照測驗(norm-referenced assessment)和標準參照測驗(criterion-referenced assessment),前者目的在於了解考生在團體中的相對位置,例如:某生的成績勝過全班的85%同學;後者則是將考生成績放在一個事先界定好的標準比較,例如:某生的成績為60分以上係為及格。大考中心舉辦測驗目的在於提供大學校系選才,一年一試的學測與指考較偏向於常模參照測驗,所以成績解釋係以考生在團體中的位置而有意義;以往的國中基測亦屬於常模參照測驗,以PR值來解釋考生在群體中的相對地位。一年二試的英聽則是標準參照測驗,成績等級說明描述了每個等級受試者所應具備的知識與技能;現行的國中教育會考亦屬於標準參照測驗,成績僅粗略分為精熟、基礎與待加強三等第。
表2 101-105年學測各考科內部一致性(Cronbach’s alpha)信度係數
年度 |
國文 |
英文 |
數學 |
社會 |
自然 |
105 |
.773 |
.934 |
.875 |
.876 |
.939 |
104 |
.817 |
.974 |
.871 |
.905 |
.932 |
103 |
.705 |
.940 |
.894 |
.882 |
.934 |
102 |
.774 |
.944 |
.862 |
.895 |
.917 |
101 |
.834 |
.949 |
.886 |
.875 |
.918 |
表3 101-104年指考各考科內部一致性(Cronbach’s alpha)信度係數
年度 |
國文 |
英文 |
數甲 |
數乙 |
化學 |
物理 |
生物 |
歷史 |
地理 |
公民 |
104 |
.659 |
.924 |
.736 |
.659 |
.863 |
.874 |
.907 |
.800 |
.779 |
.810 |
103 |
.696 |
.942 |
.627 |
.795 |
.852 |
.807 |
.907 |
.790 |
.768 |
.836 |
102 |
.738 |
.924 |
.751 |
.788 |
.879 |
.869 |
.919 |
.815 |
.756 |
.837 |
101 |
.694 |
.926 |
.786 |
.733 |
.872 |
.862 |
.923 |
.755 |
.784 |
.838 |
三、大考中心命題工作嚴謹為內容關連效度,也會於考後檢核內部一致性信度
就信度、效度的檢核而言,本中心以內容關連效度(content-related validity)與內部一致性信度(internal consistency reliability)作為學測、指考與英聽之信、效度證據。
各項測驗的內容關連效度係以嚴謹的命題標準作業程序來維持。首先,命題小組人員須充分了解高中課程綱要及測驗目的,依據該考科課程綱要及命題參考手冊之測驗目標、命題規準、命題注意事項並參考各版本教科書命製試題,經小組討論後確定試題,並搭配中心題庫提供之部分試題組成試卷。審題工作則由另一組大學教授擔任(稱之為命題顧問),命題顧問須逐一檢視各試題之正確性以及是否符合「不超綱、不偏本」的原則,同時,依據課程標準及測驗目標,提供命題小組修題或組卷之建議。命題小組根據修題建議修改試題後,須再次交由命題顧問檢視,重複進行試卷的修訂,直至完成入闈版的試卷。入闈之後,另由高中教師和試考生進行試題試考及審視,從高中教學的角度提出修題、組卷建議,協助完成正式試卷。至於信度方面,每次考後皆以Cronbach’ alpha係數檢核內部一致性信度;從表2和表3可知,101-105年學測和指考各考科都有不錯的內部一致性信度係數。
四、學測、指考屬高競爭、高風險之大型考試,與坊間檢定考試或多次測驗之設計不同
學測、指考的考試結果,左右著高中生選擇大學校系的機會,在臺灣稱得上是最受矚目的考試之一。它不但是屬於高競爭,同時也是最高風險等級的入學考試,因此,在無法確保試題在預試過程得以充分保密的前提下,目前尚無法貿然採用預試來取得每道試題的試題參數(item parameter)。同時,學測、指考考後必須立即公告所有試題,而無法設計等化所需的定錨試題(anchor item)。與全民英檢、托福、多益測驗等語文考試,或美國的SAT和ACT等測驗相較,學測、指考所受的限制與面臨的測驗情境並不相同,不宜相互比擬,以免顧此失彼。