Frekvensanalyse af STX-tekster

Jeg har længe ønsket at undersøge, hvilken sværhedsgrad almindelige STX-tekster har, når man fokuserer på det frekvensbaserede ordforråd.

Med andre ord: Hvor stort et ordforråd bør eleverne have for at kunne læse og forstå disse tekster?

Nu har jeg mit 5000-ords-korpus færdigt, og jeg har derfor brugt lidt tid på at frekvens-analysere 4 tekster .

Det drejer sig om 3 almindelige STX-tekster, der ofte læses i hhv. 1g, 2g og 3g:
1g-tekst: ”Liebe auf den ersten Klick” (Patricia Mennen)
2g-tekst: „Honeckers kandierte Apfel“ (Claudia Rusch)
3g-tekst: „Sonja“ (Judith Hermann)

Derudover har jeg medtaget en lille krimi ”Sport ist Mord” (Roland Diettrich), der er udgivet med særligt henblik på sprogniveau A1/A2 – det niveau, eleverne har, når de afslutter grundskolen.

Tallene nederst på grafen viser de forskellige frekvensniveauer; dvs. 500 = de hyppigste 500 ord på tysk og 1000 er de hyppigste 1000 ord på tysk. Med 500 ord kan man således forstå hhv. 83, 77, 72 og 69 % af ordene i de 4 tekster.

Resultat

I ”Sport ist Mord” kan eleverne forstå næsten 90 % med et ordforråd på 1000 ord, og med 2000 ord er de oppe på 96 %, hvilket svarer til den dækningsgrad (coverage rage), som sprogforskere anbefaler til læsning.

Laufer and Liu and Nation have shown that unless there is at least 95 % or higher coverage rate (the percentage of the vocabulary that is known by the reader) of the running words in a text, the probability of successful guessing of unknown words will be severely reduced. Hu and Nation suggest it should be at least 98 %. This was determined by using several texts with different unknown word rates and by measuring adequate comprehension. No subject reported adequate comprehension of text with only 80 % coverage rate, but at 90 % and 95 % coverage a few did, and only at 98 % level did most subjects gain adequate comprehension.” (Waring & Nation, 2004)

Liebe auf den ersten Klick” kommer op på 91 % med et ordforråd på 3000 ord, mens de to sidste tekster “Sonja” og “Honeckers kandierte Apfel” – selv med et ordforråd på 5000 ord – ikke kommer højere op end 88 % dækningsgrad .

Hvad betyder det for os som lærere?

– vi skal acceptere, at disse tekster skal have mange gloser – med de ujævnheder i læsningen, det giver.
– vi skal acceptere, at brugen af ordbog er absolut nødvendig – med de ujævnheder i læsningen, der giver.
– vi skal acceptere, at eleven har svært ved at træne selve det at læse og at tilegne sig nye ord, når det kræver stor mental energi bare at forstå tekstens ord.

Hvor stort et ordforråd har vores elever?

Det er – så vidt jeg ved – ikke blevet undersøgt, men det er som nævnt en del af mit projekt ”Talent for tysk. Et bud vil være ca. 1500.

I flg CEFR skal en sprogelev kende mindst 2500 ord for at bevæge fra sig A2 til B1 – det er det spring, som vores elever tager i løbet af det 2 årige B-niveau (1g og 2g). I én undersøgelse af engelskelevers ordforråd kendte under halvdelene af 1g-eleverne de 2000 hyppigste ord, og det var vel at mærke på engelsk, så ca 1500 på tysk er nok et godt gæt for en typisk 1g-elev.

Hvad gør vi så?

Da en stor del af STX-læreplanen kredser omkring mødet med tysk kultur, historie og samfundsforhold, skal STX-eleverne naturligvis trænes i strategier til at møde tekster, hvor de kender under 90 % af ordene. De skal kende til gode læsestrategier, og de skal være trænede i at håndtere ordbøger samt gloser på en hensigtsmæssig måde.

Ønske 1:

Men ved siden af denne ”traditionelle” tilgang til tyske tekster på danske gymnasier kunne jeg godt ønske mig, at eleverne mødte flere tekster, der passede til deres sproglige niveau. Tekster, hvor de kan opleve glæden ved at læse; tekster, hvor de kan få konsolideret deres højfrekvente ordforråd og tekster, hvor de selv kan regne betydningen ud af de få nye ord, de møder og ikke være overvældede af, at alt for meget er nyt på én gang.

If a text contains too many unknown words, the reader must process the text intensively and slowly which changes the reading into a study activity rather than a fluency building one. Thus, without grader readers, elementary and intermediate learners would not be able to do extensive reading at the proper vocabulary levels and a very important means of reading skill development, language consolidation and vocabulary learning would not be available to them.” (Waring & Nation, 2004)

Ønske 2:

Jeg kunne også godt tænke mig et ”lextutor”værktøj, der digitalt og hurtigt kan lave en frekvensanalyse af tyske teksters ordforråd. Hvis nogen har lyst til at samarbejde omkring udviklingen af dette, er I velkomne til at kontakte mig. Det gælder naturligvis også, hvis I allerede har fundet et lignende værktøj 🙂

NB! Jeg kender til Klett Verlags LLE (Language Level Evaluator), men jeg er ikke særlig tilfreds med den – mere herom i andet indlæg.

Skriv en kommentar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

This site uses Akismet to reduce spam. Learn how your comment data is processed.