圖一 布魯姆分類學 在進一步討論申論題如何可以達致上述評核目標前,我們首先模擬一下本科審題委員會(Moderation Committee)如何按布魯姆分類學將一道題目修訂成為能同時考核基礎及高階能力的評核項目。設以「第一次世界大戰」為材,設計一道申論題。
第一稿:「描述第一次世界大戰的過程。」
評論:題目只要求「描述」「過程」。按題目的要求,考生只需要將已背誦好的史料默寫出來,分數的多少可能是按史實的詳略區分。換言之,題目鼓勵背誦,掌握基礎能力者已可以取得高分。若需要測考分析能力,尤其作為高中的評核項目,這並不理想。
第二稿:「列舉第一次世界大戰的成因。」
評論:「過程」改成「成因」,初步引進了歷史分析的元素。然而題目使用了「列舉」這個提問用語,「列舉」「成因」到頭來仍然只是要求考生把準確好的答案背寫出來,仍然只是屬於考核基礎能力的評核項目。
第三稿:「討論第一次世界大戰的成因。」
評論:提問用語「列舉」改成「討論」,「討論」某事的「成因」,題目要求考生作出分析的意圖較前明確。然而,舉凡任何歷史事件,尤其像第一次世界大戰般的國際事件,成因相當複雜。不同考生,在回應這道題目時,可能會討論不同數量的成因,有些只討論遠因,有些只討論近因,有些在討論時側重某些國家,有些僅進行分述,有些則進行比較,套路不一而足。換言之,試卷主席據此很難釐定考生表現的高低,就算可以把準則釐定出來,這些準則在考生作答那一刻未必能夠經由題目有限的文字向考生透露出來,因此可能會造成評分不公平。所以,題目的方向是對的,但題目的遣詞用字有未清晰之處,需要進一步斟酌。
第四稿:「討論第一次世界大戰的主因。」
評論:關鍵詞「成因」改成「主因」,題目的焦點轉而要求考生將導致第一次世界大戰爆發的成因分主次進行討論,所要求的能力較前一稿為高。然而,這一稿的文字結構,可能使題目出現歧義,存在着最少兩種解題方法:第一,題目要求考生從眾多成因中僅僅選出一個認為是主因的作出討論;第二,通過比較各個成因,推斷出第一次世界大戰的主因。題目沒有明示兩個方法孰優孰劣,原則上應該等量齊觀,但問題便出來了:第二個方法涉及「比較」,比較技巧的能力階梯較高,所花時間也較多。考生若採用第二種方法,但所得分數卻只是與採用第一種方法(不需比較)相若,會對他們構成不公平。換言之,題目的解讀若出現歧義,會影響考生審題,繼而衍生出考試公平問題。因此題目仍需再行斟酌。
第五稿:「討論第一次世界大戰成因A和成因B的相對重要性。」
評論:這一稿按第四稿修訂而成,審題委員會決定沿用第二種解題思路修訂題目的用字,推演成這一稿。題目的焦點放在「相對重要性」(relative importance)一詞上,即要求考生就第一次世界大戰的成因進行比較,以釐定所討論的成因的重要性。然而,正如前段所述,比較技巧屬較高的能力,考試/測驗時間有限,難以就某史事的所有成因逐一進行比較,所以題目僅要求就所選定的成因A和成因B進行比較,繼而釐定兩者的重要性。題目數易其稿,至此課題(第一次世界大戰)、要求的能力(比較)、能力載體(成因的相對重要性)、處理數量(兩個成因)等擬題元素均已清楚釐定,若有關題目實屬課程範圍無疑,便可推薦使用。
上項內容,粗略地模擬了審題委員會在處理稿件時的思考過程。一般情況下,由於擬題員熟悉本科的擬題要求,遞交題目稿件時會省去第一、第二、第三稿,直接從第四稿的方向開始審理題目。
按此方向設計的申論題,有以下特點:
1. 每道題目,在設計時選取一項高階能力為設計指標,但題目同時能兼容基礎能力和高階能力。能按題目要求把所需能力展現出來者,便能取得較高分數;未能按題旨展現所需能力而只能默寫出有關課題的史實者,只能取得有限分數。換言之,同一道題目,需要有足夠的分數,對考生不同能力的表現進行量化。
2. 題目不應僅僅要求憶述史實。既然每道題目都應該展現出考生的「能力光譜」(spectrum of performance),題目便不應僅僅要求考生憶述史實。例如「簡述第一次世界大戰的起因」,考生只需默寫一遍史實便能獲得相當分數。換言之,這道題目沒有設下空間讓考生展現其思維和歷史技巧。
3. 設問方法,基本上是利用歷史探究中經常使用的概念和技巧:因與果、轉變與延續、相同與相異、全部與局部、偶然與必然、史實與觀點等等。
4. 題目以能力為本,不設標準答案,評卷參考(marking scheme)也僅設答案能力等級描寫,以免學生在備試時背誦標準答案,破壞考評原意。考生在答題時亦因此有一定的答題空間,能按題旨言之成理者,便能取得一定分數。這種題目,稱為「開放式題目」(open-end questions)。
5. 香港的經驗是發展出一套「提問用語」(question words),以提示考生某題所需要的能力。例如比較能力(「相對重要性」、「較」、「最」、「甚麼程度上」等等)、轉變與延續(「轉捩點」等)、史事本質(「特徵」、「本質」、「角色」、「根本的」等)。詳見《歷史科提問用語手冊》(香港考試及評核局,2007)。
6. 申論題在具體操作時,課堂上教授的「史實」會用作「論據」(evidence),用以建構答案中的「論點」(argument)。因此,申論題的評核對象,是考生建構論點、使用和組織論據的能力和水平,不應因為寫錯字、寫錯年份、字體潦草等過份扣分。
7. 設題時,擬題者只是帶出某個歷史問題讓考生進行分析,擬題者不會也不應該預設任何立場。
8. 前述模擬審題過程中,第四稿的評論中指出了題目可能出現歧義。若開考後發現相當多考生的作答方向不同於擬題原意,便應檢視題目的文字邏輯是否容許考生的方向;若容許,便應酌量給分。
9. 題目應設計得宜,同一道題目不宜在同一群學生中多次使用。申論題之所以能夠測考學生的能力,首先在於設計得宜,其次是不應重複使用。假如學生在平時練習、測驗、考試等來來回回也只是做差不多的幾條題目,就算在設計上再高階的申論題也可能變成背默題。理想的申論題,是每次都要有所不同,讓學生和考生可以面對真正的挑戰,發揮其歷史技能,否則便難以確保題目的效度(validity),即旨在評核考生高階能力的題目未能達到考核高階能力的目的。
10. 挑戰學生的史觀。歷史研習、教科書的撰寫,往往受制於主流意識型態。為了訓練學生的批判思維,在適當時候可以讓學生將史實進行重新演繹,以評鑑某種史觀的可信性。
11. 申論題往往為選答題。若為選答題,全卷各題目的難度應該相若。
12. 當成為了一種傳統後,教師和考生都會接受,單靠死記硬背,只屬低階能力,在任何申論題中只能取得十分有限的分數。學習完基本史實後,便必須訓練邏輯推理能力,評核工作便能夠對教學造成回饋(feedback),把教學活學推向高階層次。
現在略論申論題的評卷方法。考試時,我們往往會遇到以下情況:長篇大論者得分偏低,短小精悍者卻接近滿分。這關係到申論題評卷的一個核心精神:表現的高與低不在於文字的篇幅、史實的多寡,而是能否按題目要求作出有效的討論、論點與論據是否相關和直接。以下簡論申論題的評卷特點。
1. 設題原則,即評卷原則。歷年來,不論何種程度的考試,歷史科申論題的評卷標準都是那麼三項:對題旨的理解、內容、表達。三個標準按其重要性排序。這一點相當重要,目的旨在清晰無誤地向考生傳達以下訊息:考生的表現取決於對題旨的理解;「內容」放在第二位,書寫過多與題旨不相干的史實,或者背誦範文而未能因應題旨作答者,得分便會偏低。三個標準不分別打分,而是整體給一個分數(block marking)。
2. 分層評分法:撰寫評卷參考時,僅提出所要求的技能,按層次作出描述,答卷的分數多少取決於考生能理解和完成該項目的多少。換言之,分層評分法是將布魯姆分類應用到各道題目中。評卷參考中,不應把要求寫得太死,例如學生必須在答案中提到某些史實和論點,這會對一些表現良好但僅僅沒有利用評卷參考所列史實的考生造成不公。(見附錄一)將評卷參考發給閱卷員時,會同時派發一套從真實考卷揀選出來的答題樣本,用以闡釋評卷參考所列各級水平。
3. 評卷時,首先看考生有無回應題旨。例如2004年香港高級程度會考歷史科卷一第11題要求「比較史太林和墨索里尼兩人在國內政策方面的異同」,當年的考試報告指出:「……表現較差的考生往往僅以史實分述兩人的國內政策,因而未能作出比較。」在比較題中,考生有時會取巧,將答案分為前後兩半,各分述題目的一個部分,兩個部分沒有明顯的比較痕跡。以「分述」方式處理比較題,能力較在每一段作一個有效比較明顯為低,因此「分述」的得分應該較「比較」為低。另外一個例子是2007年香港中學會考第9題:「聯合國為何較國際聯盟更能維護世界和平?」當時為此題制訂的分層評分表如下:
標準
|
最高可評等級
|
分數
|
清楚比較國際聯盟(國聯)和聯合國在維護世界和平上的強弱之處,論據充足,篇幅均衡。
|
A
|
27-30
|
能比較國聯和聯合國在維護世界和平上的強弱之處,論據合理,惟有所側重。
|
B-C
|
21-26
|
探究聯合國為何能維護世界和平,但未能與國聯作出比較。
|
D-E
|
15-20
|
討論國聯及/或聯合國的一般特徵;與維和無關的討論;或僅討論國聯的維和努力(最高12分)。
|
E/F-F
|
7-14
|
題目用了「更能維護世界和平」等字,明顯旨在考核考生的比較能力。值得注意的是,同樣沒有做比較,為何評卷參考認為僅探究聯合國能夠維和的原因,評分較僅討論國聯的維和努力為高(前者15-20分,後者最高12分)?原因是,題目的用字表明,聯合國構成了題目的中心內容。國聯在這裡的作用是突顯聯合國的維和能力,考生不應反其道而行,強調了國聯的維和努力。
4. 臨界分數:每道題目都需要一個「臨界點」(borderline),以區分能按題旨作答和不能者。這個臨界點,仍是以理解題旨的能力來劃分。現時香港中學文憑考試往往以「僅有一兩行輕輕觸及(題目所涉及技能)」作為臨界要求,即兩篇同樣以默寫史實為主的答案,若其中一篇能有一兩行涉及題目要求的技能,便表明其具有一定程度的答題意識,可考慮給予臨界分數。
5. 採用正面評分法(Positive marking)。閱卷員須在答案中搜集學生按題目回應題旨能力的證據,按此評分;寫錯字、寫錯年份、字體潦草,一般不會扣太多分。
6. 有關分數分布(mark spread),試卷主席應鼓勵閱卷員善用整個分域,而不是中間落墨。能按題旨作答、有合理史實支持者,便應給予中上分數。獲得最高分數的答卷,無須完美無瑕,內容或表達方面有輕微不足之處,亦可接受。
7. 閱卷員要放下自己的標準答案,按試卷主席的評卷標準閱卷。
申論題與歷史議題
能力主導的設題方式,意味著需要在歷史科課程內找尋可資討論、有所爭議的課題,設計成恰當的評核項目,讓考生進行分析。歷史學者在處理同一個課題時,討論路徑、視野、觀點也不盡相同。設計申論題也是建基於「讓考生做一回歷史學者」的本意,按申論題題目的要求做歷史探究。而且,歷史現場的用語和看法有時會直接入史(例如,「軍閥」、「文化大革命」、「殖民主義總是壞的」等),有時會在史實之間出現落差,甚至偏見。透過小心設計的評核項目,以歷史反思能力作為題目評核的歷史能力,既切實可行,亦饒具歷史教育意義。
歷年來本科所設計的歷史議題題目,有以下例子:
「滿清政府在中國現代化方面所付出的努力,主要是為了維持其統治,而非挽救中國。」此說能否成立?試就1860-1912年間的史實,加以評論。(2003年香港高級程度會考歷史科卷二第3題)
在什麼程度上南京政府時期(1928-37)的中國,有別於軍閥時期(1916-28)的中國?(2003年香港高級程度會考歷史科卷二第5題)
「現代」一詞在什麼程度上可用以刻劃1912-37年間的中國?(2013年香港高級程度會考歷史科卷二第3題)
為歷史議題題目評卷時,標準與其他類型的申論題沒有分別,完全視乎考生按題目建構論點、使用和組織論據的能力和水平。隨着歷史科課程越來越貼近學生的生活(例如香港中學文憑考試歷史科的課程範圍為二十世紀,下限至西元2000年),考生在回應某些題目時,可能需要運用近期社會發展的知識。設計歷史議題題目時,若能不預設任何既定立場、能使用客觀的用語、清楚釐定相關議題的時代背景和考生應作何等處理,將有助於專業地考核考生的歷史議題能力。
申論題與課程
時至今日,評核不再僅僅旨在總結學習成果(summative assessment),而更應該是促進學習的工具(formative assessment)。申論題不單是考試工具,也是有效的學習工具,它所評核的能力,應該在課程內有所闡釋,讓教師們理解課程和評核的目的,讓各種評核方法(包括申論題)有安身立命之所。
此外,課程設計也影響到申論題的操作方式。一般而言,申論題屬選答題,讓考生選取最有把握的題目進行討論。申論題的選答情況,與課程的撰寫安排有莫大關係。假設課程劃分甲、乙、丙三部,設一張考卷選答兩題申論題完卷,情況可能有以下各種:
1. 考生隨意在甲、乙、丙部選答兩題,自由度最高,但偏讀的可能性亦最高。
2. 甲、乙、丙三部,其中一部要求考生必須選答一題,其餘一題可在乙部或丙部選答。
3. 甲、乙、丙三部,考生選取其中兩部作答,每部選答一題。
申論題的選題安排必須在課程內詳細說明,[3]按課程需要進行設計,盡量在學術自由和避免偏讀之間取得平衡。
後記
上述僅就三個分題,對申論題作出初步的討論。在操作層面而言,申論題可以討論的相關範疇還有很多:教科書、設計樣本考卷、製作答題樣本、舉行教師研討會、如何就提問用語和其他用語達致共識等,都有很多討論空間,茲因時間所限,暫不贅論。申論題(或者任何一種評核工具)要取得成功,關鍵在於所有持份者(stakeholders)就關鍵理念取得共識。(1)申論題是能力為本的評核工具,旨在鼓勵高階能力,按題目展示所需能力者可以獲取較高分數,僅能表現出低階能力(如默寫已預備的答案)者,只可獲得有限分數。(2)量化考生的表現,必須按而且只能按考生根據題目要求展現出相關能力來評分。這項共識相當重要。若教師和閱卷員認為其他因素(例如作答字數、與題旨不相干的史實)也可構成評核考生表現的基礎,分域(mark range)原本所展示的「能力光譜」便會受到污染,相關分數便不能反映出考生的實際能力。
本科四十年來的考評發展,有些評核工具已經退出了歷史舞台(多項選擇題和校本評核),有新的評核工具加入並保持着生命力(歷史資料題),唯獨申論題能一枝獨秀,四十年來在本科各級考試中一直維持着重要的地位(見表一),這反映了該評核工具能夠有效考核歷史科教與學所需要的能力,如建構論點、使用和組織論據、陳述及詮釋歷史、運用基本歷史概念(因果關係、轉變與延續、相同與相異、觀點與史實等)、在討論中保持邏輯清晰和前後一致等。
參考文獻
《歷史科提問用語手冊》(香港: 香港考評及評核局,2007, 2011)
香港高級程度會考、香港高等程度會考、香港中學會考、香港中學文憑考試歷史科歷屆試題及考試報告
課程發展議會與香港考試及評核局聯合編訂,《歷史:課程及評估指引(中四至中六)》(香港:香港教育局,2007)
附錄一
5. 追溯並解釋1943-91年間美國與蘇聯的關係。(2016年香港中學文憑考試卷二)
標準
|
最高表現層級
|
分數
|
表述連貫清晰,能均衡地「追溯」及「解釋」1943-91年間美國與蘇聯的關係。追溯該關係時能夠進行分期,並為每一個分期提供相應的解釋。能以實質例證予以支持,該等事例能涵蓋有關時期的大部分。
|
A
|
14-15
|
能瞭解題旨,能大致均衡地「追溯」及「解釋」1943-91年間美國與蘇聯的關係。追溯該關係時能夠進行分期,並為每一個分期提供相應的解釋。史例能涵蓋有關時期的相當部分,惟可能有輕微偏頗。
|
B
|
12-13
|
能瞭解題旨;能「追溯」及「解釋」1943-91年間美國與蘇聯的關係,惟內容有所側重,及/或未能作出有效的分期。史例能涵蓋有關時期的不少部分,惟可能有輕微偏頗。
|
C
|
10-11
|
對題旨有一般性的了解,答案主要集中於「追溯」或「解釋」該關係;或嘗試處理兩者,惟內容粗糙。
|
D
|
8-9
|
對題旨略有了解;討論僅集中於「追溯」或「解釋」該關係,有明顯史實錯誤,或僅集中於該關係的某部分,但能夠進行追溯及解釋。
|
E
|
6-7
|
主要敘述1943-91年間美國與蘇聯的關係,惟沒有明確意圖「追溯」及「解釋」該關係。
|
E/F
|
5
|
零落地敘述1943-91年間美國與蘇聯的關係,沒有嘗試進行「追溯」及「解釋」。
|
F
|
3-4
|
對題旨幾無瞭解,未能區分相關及無關之材料。 絕少相關之史實。 組織極為紊亂,難以理解,重要人名及地名有嚴重錯別字。
|
U
|
0-2
|
附錄二
申論題種類:
1. 「傳統式」:直問直答,不注重提問用語
例題:1980年香港高級程度會考歷史科卷一第13題
Discuss the role of religion in the course of German history during the seventeenth century.(討論17世紀德意志歷史中宗教的角色)
2. 含文獻資料的申論題:1973年起,美國出現了「文獻資料題」(document-based question),即在申論題中加入歷史文獻,供考生分析使用。然而,時至今日,本科考評已設獨立考卷,以擴展回應式題目(extended-response question)設問歷史資料題,申論題設題時不再附加文獻資料。
例題:1988年香港高等程度會考歷史科第19題