字級:
小字級
中字級
大字級

高中和入學考試成績可預測大學成績嗎?

大考中心統計研究員/趙珮晴  撰
近日高等教育面臨國際競爭壓力和少子化的衝擊下,嘗試利用實際數據建立資料庫,包含:高中成績、選課資訊、學習成效、師生比例以及大學成績等,希冀可以讓決策者在招生策略、課程安排、人員聘任等方面,有所參酌並制訂正確的教學和行政政策,提高決策正確性與信心,此為高等教育的校務研究(Institutional Research)的目的(楊武勳,2014)。教育部(2015)也抱持鼓勵態度,制訂「教育部補助大學提升校務專業管理能力計畫審查作業要點」,其中以「學生學習成效」為審查和執行核心,要求收集相關資料、分析並建立評估機制。因此,臺灣也如同其他國家的高等教育機構,陸續設立相關辦公室或研究室,並著手進行校務研究分析,也開始舉辦相關研討會或工作坊,邀請國內外相關學者分享實務經驗,尤其是教育部關心的相關學習成效議題,包含:起始點(高中或大考成績)、成長進步(教學或課程設計)、就業薪資(畢業表現)等。但是,其中的高中和入學考試成績,可預測大學成績嗎?
國立政治大學就邀請美國加州大學校長辦公室校務專案主任常桐善博士,在2015年12月的工作坊發表加州大學的“綜合評價”制度研究結果,以大學第一年大學成績當成被預測變項,而高中成績和標準化考試成績則當作預測變項進行迴歸分析(常桐善,2015)。國內校務研究也依樣畫葫蘆,參考相關研究報告以校務資料進行類似迴歸和相關分析,而忽略了臺灣和美國因對成績的界定不同以及大學錄取決策的差異,可能因樣本的偏差而造成錯誤的結論。
如果臺灣某大學的某校系要進行如此分析,可能會先收集該校系學生的高中成績、大學入學成績和大一某課成績,有以下思考點:
思考1:臺灣高中A老師給90分,等於B老師給的90分嗎?
在臺灣,高中成績係授權任課教師給予分數,每位教師的評分方式要求不同,不宜放在同一量尺比較。如果要放在同一量尺上,教育當局就要像美國一樣訂定成績標準,而且每一所高中教師都要如實執行,例如:全國高中某科90分以上必須要具備何種程度的知識能力等。否則,在未有此同一量尺時,其實並沒有比較的基準點。
思考2:臺灣某大學所收集到的入學成績已經過篩選,如何進行預測?
臺灣某大學的某校系的大學入學考試成績,學測級分可作為繁星推薦或者個人申請的初步門檻;指考成績經過採計組合後,直接用於分發校系,這也不同於美國各大學以多元效標為錄取決策的做法。在臺灣,原本入學成績的分散程度,會因大學以學測或指考篩選而形成偏差樣本,意即抽取樣本時,每一個個體被抽到的機率不完全一樣(楊宏章,2015);也就是所謂的限制全距(restricted range或restriction of range)的資料和樣本,會造成相關係數降低的情況(Study.com., 2003-2016; Rice Virtual Lab in Statistics, 2016),使得變異量不足且分數範圍狹小,所得到的結果可能是機遇(chance)所致。詳如下圖所示。

限制全距的資料樣本示意圖

圖片來源:2016.4.1 Retrieved from https://en.wikiversity.org/wiki/Correlation
備註:左上角數據為Pearson/Spearman相關係數。

因此,從上述思考回到一般認知:「若指考成績愈高的同學,大學成績也愈高,也就是指考成績與大學成績高度正相關;反之,若指考成績與大學成績相關係數(correlation coefficient)很低,則用指考成績來挑選學生是不恰當的。」換句話說,以大學成績為效標(criterion),指考成績與大學成績的相關係數就是指考成績的效度(validity)。所以,如果高中在校成績與大學成績高度正相關,其相關係數甚至高於指考成績與大學成績,就會受到為何不用高中成績取代指考成績的質疑(楊宏章,2015)。
楊宏章(2015)模擬臺灣的大學資料如下圖,透過圖示可得知大學成績和指考成績的模擬分佈情形;由左而右依序為全國考生以及假設某校系大一學生A和B情形。從圖可知,最左圖是全國考生大學成績和指考成績的正相關分佈圖,如果某校系的指考最低錄取分數為40分,則會在40分形成一個切點:中間圖的A情形就是某校系大一學生錄取分數介於40~60分之間;最右圖的B情形如同A,分數介於40~60分之間,但是較多學生聚集於40分附近。

模擬大學成績和指考成績的分布圖

資料來源:楊宏章(2015)
備註:縱座標為大學成績、橫座標為指考成績,圖中各點代表每位學生。
無論是A情形或者B情形,指考成績經過校系採計分發後,大學所收集到的資料都是偏差樣本或限制全距資料樣本,因為實際模擬的情況是最左圖的正相關分佈。如此,以A情形或者B情形進行相關分析,就容易得到低相關或者無相關的結果,但這並不代表指考成績不能預測大學成績,而是因偏差樣本或限制全距資料樣本造成的錯誤解讀;值得注意的是,有些指考科目有加權計分,其偏差情形將更嚴重。郭生玉(2004)一書在效度章節中,對於效度中的效標關連效度(criterion-related validity)就指出一個好的效標必須具備適切性、可靠性、客觀性和可用性,如果會造成偏差和混淆,就不宜當作效標。
有鑑於近日偶有傳聞與研究指出就大學學生的學業表現而言,高中成績較具預測力,而指考較不具預測力;以及指考英文較具預測力而指考國文較不具預測力等說法,顯然是以偏差樣本或限制全距資料樣本進行分析得到的錯誤結論,值得識者三思。
 
 
參考文獻
Range restriction (2016). 2016.4.1 Retrieved from https://en.wikiversity.org/wiki/Correlation
Rice Virtual Lab in Statistics (2016). Restricted Range. 2016.4.1 Retrieved from http://davidmlane.com/hyperstat/A68809.html
Study.com. (2003-2016). Restriction of Range: Definition & Examples. 2016.4.1 Retrieved from http://study.com/academy/lesson/restriction-of-range-definition-and-lesson.html
常桐善(2015年12月)。大學本科招生“綜合評價”制度。余民寧(主持人)。校務研究與高等教育發展學術工作坊,國立政治大學。
教育部(2015)。教育部補助大學提升校務專業管理能力計畫審查作業要點。資料來源:http://ir.ord.ncku.edu.tw/ezfiles/387/1387/img/2316/857695165.pdf
郭生玉(2004)。教育測驗與評量。臺北市:精華書局。
楊宏章(2015)。指考成績比高中成績沒預測力?未出版之原始資料。
楊武勳(2014)。日本大學發展「校務研究」作為教學改善之探討。評鑑雙月刊,47。資料來源:http://epaper.heeact.edu.tw/archive/2014/01/01/6108.aspx
TOP