字級:
小字級
中字級
大字級

一起來認識學測與指考的試題鑑別度

本中心每年度辦理學科能力測驗(簡稱「學測」)和指定科目考試(簡稱「指考」)後,都會公告每個考科的一些統計數據,提供給關心該次考試的高中教師、家長或是各界參考。公告的資料中,有一份是「答對率及鑑別度表」,表中「答對率」說明了每個題目的考生答對情形,而「鑑別度」則解釋了每個題目能夠區分考生程度的情形。本篇文章將向讀者說明「試題鑑別度」的內涵。

鑑別度可分成兩種:(1)以「試題」為單位的試題鑑別度、(2)以「整卷」為單位的整卷鑑別度。本文將以「試題」為單位的試題鑑別度為本進行介紹。試題鑑別度指標的英文是item discrimination index,以「D」代表之。鑑別度的範圍在-1+1之間,常以小數方式呈現,本中心提供的鑑別度則以百分比呈現,以和答對率一致。

試題鑑別度是用來描述一道試題在區分不同能力組考生時所發揮的效果,數值愈高代表愈能區分不同能力組的考生。本中心目前採用兩種不同能力組的分類,一為:「高、低分組」,一為:「五種能力組」,所以鑑別度也區分為「高、低分組的試題鑑別度」以及「五種能力組的試題鑑別度」。以下分別說明兩種鑑別度,並特別提醒「解讀試題鑑別度應注意的地方」。

壹、高、低分組的試題鑑別度

假設考生的原始得分能夠代表考生的能力表現,原始得分經由高而低排序後,排在前三分之一的考生定義為高分組,排在後三分之一的考生定義為低分組。「高、低分組」的試題鑑別度(D)就是該題高分組考生答對率(Ph)減去低分組考生答對率(Pl),該指標是用來描述試題區分高能力與低能力考生所發揮的效果。良好試題的鑑別度應該要大於0,也就是高分組考生應該比低分組有較高的答對率(PhPl>0),當鑑別度愈高,表示高、低分組考生在同一道試題的答對率差距愈大,試題愈有發揮區分高、低能力考生的功能;而鑑別度愈低,就表示高、低分組考生在該試題的答對率差距愈小,區分高、低能力考生的功能較弱。

108學年度學測國文科的表格為例(請見頁面最底端),表中第16題的鑑別度(D)為57,是由高分組答對率(Ph=95)減去低分組答對率(Pl=38)而得,是整份試卷中的最大值,表示第16題和其他題目相比,最能區分高、低能力考生。第8題的鑑別度(D=17)是整份試卷中的最小值,表示相對於其他試題來說,第8題在區分高、低能力考生的功能最弱。

貳、五種能力組的試題鑑別度

本中心各科整份試卷中都包含不同難度(難、中偏難、中偏易、易)的試題,目的在區分不同能力組的考生。但是,要如何知道每道試題是在區分何種能力組的考生呢?

在答對率及鑑別度表中,除有「高、低分組」的鑑別度外,亦提供「五種能力組abcde」的鑑別度D1D2D3D4,分別對應Pa-PbPb-PcPc-PdPd-Pe五組考生兩兩答對率的差距(如下圖所示),兩組答對率差距愈大表示題目愈能區分該兩組考生的能力表現。

仔細觀察第16題在各能力組的答對率,可看到Pa(97)>Pb(89)>Pc(73)>Pd(52)>Pe(31),這是試題良好的特徵,如下圖所示。再觀察這五組答對率的兩兩差距(Pa-Pb=8Pb-Pc=16Pc-Pd=21Pd-Pe=21),這四個數值分別對應到表格的D1D2D3D4,其中恰好D3D4一樣且數值最大,分別是Pc-PdPd-Pe,表示這道試題在c組和d組之間,以及d組和e組之間考生的答對率有明顯的落差。換句話說,第16題較能區分原始得分在前41%~60%與後21%~40%之間,以及後21%~40%與後20%的考生之間。

參、解讀試題鑑別度應注意的地方

一份能夠區分考生能力的測驗,高能力考生在原始得分上應該會獲得高分,低能力考生應該會獲得低分,高、低能力考生的原始得分應該會有明顯的差距。「高、低分組的鑑別度(D)」就是用來檢視試題是否發揮區分高、低能力考生的指標,這也是測驗常使用的指標。

值得思考的是,鑑別度低是否就表示題目沒有區分考生的功能呢?造成鑑別度低的原因很多,例如,若高、低能力考生在答對率低的「難題」,或答對率高的「易題」的答對率差距不大,就會使得鑑別度的數值比較小。在整份試卷中,有些易題是希望給學生信心;有些難題,是希望鑑別更高能力的學生,換句話說,就是為了要再進一步區分總分最前段的考生,在高能力群中還能再分出極高能力的考生。

以第18題為例,該題全體到考生答對率(P)為91,甚至能力分組為a的總分前20%考生全部答對(Pa=100),屬於「易題」,而該題鑑別度為21,在整份試卷中鑑別度較低。但再看「五種能力組考生」的鑑別度(D1=1D2=2D3=5D4=23),D4的數據遠高於D1D2D3,且和其他試題的鑑別度D4相比也屬偏高,表示第18題和其他試題相比,區分原始得分後20%與後21~40%的考生效果極佳。

此外,試題的「鑑別度(D)」和「答對率(P)」一樣,僅是眾多推論試題品質好壞的指標之一,試題品質的好壞還包括檢視試題內容是否符合測驗目標。

還有哪些試題的統計分析呢?本中心所公告的學測和指考「統計資料」網頁上,還有各科選擇題選項分析,可以來看每道試題每個不正確的選項去吸引考生選答的比率。常常有試題評論者提到選擇題選項的設計「沒有誘答力」或是「很有誘答力」,如何來看呢?我們下篇《一起來認識學測與指考的試題選項分析》再與各位細談。

TOP