Diagnosirako ebaluazio-eskalak ezin dira izan akreditaziorako berberak (Alderson, 2005). Diagnosirako egiten diren probek zenbait alderdi bereiztaile dituzte:
- zehatzagoak izan behar dute
- feedback azkarra izan behar dute
- kontuan izan behar da norainoko “presioa” duten hautagaiek proba ondo egiteko, “beren onena” emateko. Normalean diagnosirako probetan ez da tentsiorik egoten emaitzarekiko, edo presioa baxua izaten da
- indarguneak eta ahuleziak seinalatu nahi izaten dira batik bat, eta ez horrenbeste zenbaki bat edo gai/ezgai
- alde handia dago emaitzen hartzailearen arabera: ikasleak, irakasleak, administrazioa…
- elementu zehatzak ebaluatzen dira gehienetan (ahoskera, testu-mota jakin bat…)
- hiztegiak pisu txikiagoa izaten du gramatikak edo erabilera orokorrak baino
- diagnosirako probak aproposak dira ordenagailu bidez ebaluatuak izan daitezen
Diagnosirako proba prestatzean, elementu hauek izan behar dira kontuan, kontrolpean edo definiturik (McNamara, 1996):
- Ebaluazio prozesua: ebaluatzailea (e-ebaluagailua), eskala /irizpideak
- Performantzia
- Zeregina: testuingurua, zeregin-mota, jarraipideak…
- Hautagai edo proba-egilearen ezaugarriak
Eskalak
Ebaluaziorako, metodo zuzenak eta zeharkakoak erabil daitezke. Zeharkako metodoen artean, Alderson-ek (2005) DIALANG aipatzen du, 14 hizkuntza europarretarako sortutako diagnosi-testa, Europako Erreferentzia Markoan oinarriturik, baina une honetan proiektua geldirik dago eta ezin dira emaitzen datuak zerbitzaritik jaso ikerketa-helburuetarako. Nolanahi ere, zeharkako metodoak mugatuak dira eta idatzizko lanen adibideak erabiltzea da komenigarriena diagnosirako.
Idatzizko testuak ebaluatzeko eskala-mota hauek bereizten dira (Weigle, 2002):
| Eskala-mota | Zeregin jakin baterako espezifikoa | Zeregin askotarako orokortzekoa |
| Emaitza bakarra | Ezaugarri nagusia | Holistikoa |
| Askotariko emaitzak | Askotariko ezaugarriak (Weigle, 2002) | Analitikoa (Weir, 1990) |
Ikerketa honen kasuan, analitikoa da egokiena, ezaugarrien arteko alderaketak egiteko. Hala ere, kontuan hartu behar da “Askotariko ezaugarriak” eskala espezifiko hori ere, beharbada tresna informatikoak erabiltzeko irakasleak manipula dezakeen eskala eraiki bailiteke.
Irizpideak eraikitzeko erak
Eskalak eraikitzeko irizpideek oinarri desberdinak izan ohi dituzte (Knoch, 2009). Hauek dira nagusiak:
- Intuizioan oinarritutakoak (Fulcher, 2003). Halakoxeak izaten dira gehienak: adituek eraikiak, batzorde batean erabakitakoak edo esperientziaren poderioz moldatzen joan direnak.
- Teorian oinarritutakoak. Ereduak ez daude guztiz finkatuta. Lau trebetasunen eredua gainditutzat emanda, komunikazio gaitasunaren ereduak, idatzizkoaren teoriak edo ereduak (Grabe&Kaplan, 1996) eta ebaluatzailearen erabaki-hartze teoriak (Cumming et al., 2001, 2002) dira egungo ikerketen erreferentzia.
- Proba enpirikoetan oinarritutakoak (North, 1995; North & Schneider, 1998). Deskriptoreak bildu eta proban jartzen dira, ondoen bereizten dutenak hautatzeko, kategoriatan antolaturik.
Eskala egiten denean, kontuan izan behar da ebaluatzaileek bakarri bereiz dezaketela 7 mailaren artean gehi/ken 2 (Myford, 2002). Deskriptoreak edo irizpideak finkatzerakoan, garrantzi handiagoa izan dezake ebaluatzaileen esperientzia, jatorria edo jakintza, deskriptoreen egokitasuna baino eta horregatik, arretaz landu behar da eskalen fidagarritasuna eta baliozkotasuna.
(Post honetarako oharrak liburu honetatik hartu ditut: Knoch, 2009)
Erreferentziak:
Alderson (2005). Diagnosing foreign language proficiency. The interface between learning and assessment. London: Continuum
Cumming, A., Kantor, R., & Powers, D.E. (2001). Scoring TOEFL essays and TOEFL 2000 prototype writing tasks: An investigation into raters’ decision making and development of a preliminary analytic framework. TOEFL Monograph Series 22. Princeton, New Yersey: Educational Testing Service.
Cumming, A., Kantor, R., & Powers, D.E. (2002). Decision making while rating ESL/EFL writing tasks: A descriptive framework. The Modern Language Journal, 86, 67-96
Fulcher, G. (2003). Testing second language speaking. London: Pearson Longman
Grabe, W. & Kaplan, R.B. (1996). Theory and practice of writing. New York: Longman
Knock, U. (2009). Diagnostic Writing Assessment. The Development and Validation of a Rating Scale. Frankfurt: Peter Lang. (hemen deskarga daiteke: pdf, 2,8Mb)
McNamara, T. (1996). Measuring second language performance. Harlow, Essex: Pearson Education.
Myford, C.M. (2002). Investigating design features of descriptive graphic rating scales. Applied Measurement in Education, 15(2), 187-215.
North, B. (1995). The development of a common framework scale of descriptors of language proficiency based on a theory of measurement. System, 23(4), 445-465.
North, B. (2003). Scales for rating language performance: Descriptive models, formulation styles, and presentation formats. TOEFL Monograph 24. Princeton: Educational Testing Service.
North, B. & Schneider, G. (1998). Scaling descriptors for language proficiency scales. Language Testing, 15(2), 217-263.
Weigle, S.C. (2002). Assessing Writing. Cambridge: Cambridge University Press.
Weir, C.J. (1990). Communicative language testing. New Jersey: Prentice Hall Regents.
Pingback: Komunikazio gaitasuna eta idatzizkoaren ikaskuntza | Tesiseatzen