Rechtschreibtest für die Personalauswahl (R-PA)

Kersting, M. (2023). Rechtschreibtest für die Personalauswahl (R-PA). Göttingen: Hogrefe.

Mit Hilfe des Rechtschreibtests für die Personalauswahl (R-PA) ist es möglich, eine Einstufung der Rechtschreibleistung von Jugendlichen und Erwachsenen anhand einer definierten Vergleichsgruppe (Normgruppe) vorzunehmen. Der Test kann bei Personen ab 15 Jahren sowohl in der Berufseignungsdiagnostik als auch in der Förderdiagnostik sowie LRS-Diagnostik (Lese-Rechtschreibstörung) eingesetzt werden. Im R-PA werden in einem Fließtext für einzelne Zielwörter verschiedene Schreibweisen präsentiert. Nur eine ist korrekt und muss ausgewählt werden. Dieses Single -Choice-Antwortformat hat gegenüber dem bei der Messung von Rechtschreibfähigkeiten sonst üblicherweise genutzten Lückentexten zahlreiche Vorteile. Die Objektivität und die Ökonomie in der Durchführung und Auswertung sind deutlich höher. Gleichwohl werden mit dem Ankreuztest nachweislich im Wesentlichen dieselben Rechtschreibfähigkeiten erfasst, die mit einem aufwändigen Lückendiktat erfasst werden.

Der R-PA kann als Papier-Bleistift-Version oder als Computerversion durchgeführt werden.

Der Test umfasst 44 Items, die Durchführung dauert maximal 25 Minuten. (Fünf Minuten Instruktion sowie 20 Minuten Bearbeitungszeit). Die meisten Personen erleben diesen Zeitansatz als sehr reichlich und sind früher mit der Bearbeitung fertig.

Informationen auf dieser Website

Auf dieser Seite finden sich Informationen zum Rechtschreibtest R-PA.

Die folgenden Informationen sind gegenüber den Verfahrenshinweisen zum R-PA stark vereinfacht und. verkürzt. Die Website kann und soll die Lektüre der Verfahrenshinweise nicht ersetzen. Des Weiteren wird in diesem Sinne auch auf Quellenverweise und auf das Literaturverzeichnis verzichtet, die entsprechenden Angaben finden sich in den Verfahrenshinweisen. Darstellungen des R-PA sollten sich nicht auf die Kurz-Informationen der vorliegenden Website beschränken, sondern die umfassenderen und detailreicheren Verfahrenshinweise nutzen. Eine abschließende Beurteilung der Qualität des R-PA ist allein auf der Grundlage der verkürzten Informationen der vorliegenden Website nicht möglich. Hierzu bedarf es der umfassenden Informationen der Verfahrenshinweise.

Autor des Tests ist Martin Kersting, der Test wird vom Hogrefe Verlag vertrieben. Anfragen zum Kauf oder zur Nutzung im Kontext von Forschung und Lehre sind ausschließlich an den Verlag zu richten.

Wenn Sie eine Studie mit dem R-PA durchgeführt haben, besteht die Möglichkeit, im Rahmen dieser Website unter der Rubrik Aktuelles auf die Studienergebnisse aufmerksam zu machen. Des Weiteren können Sie uns gerne kontaktieren, wenn Sie Daten mit dem R-PA erhoben haben, die Sie für die Testpflege und Normierung zur Verfügung stellen wollen.

Theoretische Grundlagen als Ausgangspunkt der Testkonstruktion

Bei der rationalen Konstruktion eines Rechtschreibtests stellen sich u.a. die Fragen nach dem „Was“ und dem „Wie“: Zu klären ist sowohl, auf welche Rechtschreibregeln der Test abzielt als auch, wie (mit welchem Aufgabentypus) die Leistungserfassung erfolgten soll.

Was wird erfasst (Zielwörter)

Foto: Pixabay von Pexels

Für die Auswahl der Zielwörter des R-PA wurden zwei Strategien angewandt. Rund die Hälfte der Items des R-PA beruht auf dem bewährten Diktat „Rummelplatz“, welches eines von drei Diktaten des Rechtschreibungstests (RT) von Kersting und Althoff (2004) ist. Dieses Diktat wurde nach den Prinzipien der Technologie zur Erzeugung kontentvalider Aufgabenstichproben entwickelt und hat sich vielfach bewährt. Rund die Hälfte der Items des R-PA entspricht den „Lücken“ im genannten Diktat. Diese Teilmenge des R-PA wird als „Kurz-Version des R-PA“ bezeichnet, die allerdings – aufgrund der eingeschränkten Reliabilität – nur für Forschungszwecke bestimmt ist. Die Distraktoren des R-PA, also die angebotenen Falsch-Alternativen im Single-Choice-Item, wurden aus den Fehlern abgeleitet, die Personen im Diktat unterlaufen sind. Die Distraktoren stellen somit zum Großteil Fehlschreibungen dar, die bei der Bearbeitung des Lückendiktats tatsächlich aufgetreten sind.

Der Teil des R-PA, der den Lücken des Rummelplatz-Diktats entspricht, stellt eine isomorphe Variante der entsprechenden Abschnitte des Lückendiktats ‚Rummelplatz’ dar. Die beiden

Rund die andere Hälfte der Items des R-PA wurde neu konstruiert, um die Rechtschreibreform von 1996 sowie die Überarbeitung des Regelwerks in den Jahren 2004 und 2006 zu berücksichtigen.

Wie wird erfasst (Itemformat)

Es gibt verschiedene Formen der Rechtschreibprüfung. Das (1) „Richtig-Falsch-Format“, das (2) „Korrekturformat“ (eine spezifische Variante des Korrekturformats ist der C-Test), das (3) „Single- oder Multiple-Choice-Format“ und das (4) „Diktat“. Beim Diktat kann man unterscheiden, ob (4a) der ganze Text oder (4b) einzelne Worte („Lückendiktat“)) diktiert werden.

Foto: A.Spielhoff, CC0, via Wikimedia Commons

Besonders häufig genutzt wird das Diktat. Die Methode des Diktats überzeugt durch die aktive, freie Produktionsleistung, die Unverfälschbarkeit (Raten ist nicht möglich) und durch Alltagsnähe. Das Diktat hat allerdings auch deutliche Schwächen. Gegen Diktate spricht aus pragmatischer Sicht die Testökonomie. Alle anderen Formate, insbesondere aber das „Richtig-Falsch-Format“ sowie das „Single- oder Multiple-Choice-Format“ sind leichter zu instruieren und überzeugen durch deutlich kürzere Bearbeitungs- sowie Auswertungszeiten. Das voll­ständige Diktat ist extrem zeitaufwändig, wobei in der Regel auch eine große Menge an Wörtern diktiert wird, die für die Leistungsdifferenzierung irrelevant sind. Neben der Testökonomie sprechen vor allem Probleme der Durchführungs- und Auswertungsobjektivität gegen das Diktat. Die Durchführungsobjektivität ist gefährdet, sofern der Text von unterschiedlichen Personen unterschiedlich diktiert wird. Insbesondere Variationen im Diktiertempo sowie eine regional gefärbte Sprechweise schränken die Vergleichbarkeit der Ergebnisse ein. Beim Diktat muss der Text gehört werden, somit wird immer auch das Hörverständnis geprüft. Daher lässt sich nicht ausschließen, dass Fehler vollständig oder zum Teil auf ein mangelndes Hörverständnis und nicht auf eine mangelhafte Rechtschreibfähigkeit zurückzuführen sind. Probleme der Auswertungsobjektivität ergeben sich in dem Fall, dass das Diktat seitens der getesteten Person handschriftlich (und nicht über ein elektronisches Endgerät) erfolgt. Hier können sich Probleme bei der Interpretation der Handschrift ergeben.

Für den R-PA wurde das Single-Choice-Format realisiert. Um den Einfluss zufälliger bzw. lediglich „geratener“ Beantwortungen zu minimieren, wurde ein Format mit mehreren, vor allem aber mit solchen Distraktoren realisiert, die reale Fehlschreibweisen abbilden (siehe oben).

 Beispielaufgabe R-PA
Anweisung

In der folgenden Vorlage finden Sie einen Text, in dem für bestimmte Wörter verschiedene Schreibweisen angeboten werden.

Die korrekte Schreibweise ist die gesuchte Lösung. Kreuzen Sie das entsprechende Lösungskästchen auf dem Antwortbogen an.

Beispiel:

Einige Menschen interessieren sich für Berufe im sozialen Bereich, andere suchen

eher einen Beruf im Bereich der          

          A) Technick          B) Techniek          C) Technik            D) Technieck        E) technik

Die korrekte Schreibweise steht hinter dem Lösungsbuchstaben „C“. Deshalb ist das Lösungskästchen „C“ auf dem Antwortbogen anzustreichen.

Für die Bewertung dieses Rechtschreibtests werden die aktuell gültigen Regeln der Rechtschreibung zugrunde gelegt. Kreuzen Sie also die Variante an, die nach den aktuellen Regeln richtig geschrieben ist.

Es wird immer eine und genau eine richtige Lösung angeboten. Kreuzen Sie immer nur eine und genau eine Lösung an.

Achten Sie auch auf die Unterschiede zwischen Groß- und Kleinschreibung. Im Beispiel ist die Schreibweise hinter dem Lösungsbuchstaben „E“ falsch, weil das Wort „Technik“ hier großgeschrieben werden muss.

Der R-PA ist gedacht, um zugleich die Vorteile des Diktats als auch die Vorteile der Single-Choice-Methode zu nutzen. Durch die Tatsache, dass die Distraktoren zum Teil tatsächliche Fehlschreibweisen wiedergeben, knüpft der R-PA an die freie Produktion an. Die für den R-PA durchgeführten Validitätsanalysen zeigen, dass mit der isomorphen Single-Choice-Variante des Diktats offensichtlich nichts bedeutsam Anderes gemessen wird als mit dem Diktat selbst. Wenn die Validität gleich hoch ausfällt, können und sollten Objektivität und Ökonomie bei der Testauswahl den Ausschlag geben: Die Messung der Rechtschreibleistungen mit einem Single-Choice-Test wie dem R-PA ist wesentlich ökonomischer und objektiver als die Messung mit einem (Lücken-)Diktat.

Der Text der finalen Version des R-PA wurde von der Gesellschaft für deutsche Sprache daraufhin geprüft, ob er konform mit allen Regeln der Rechtschreibung ist. Dies ist der Fall. Bei allen Items gibt es eine und nur eine eindeutig korrekte Lösung.

Interpretation anhand von Normwerte

Die Interpretation der Testleistung im R-PA kann über den Vergleich der Leistung einer Person mit der Leistung einer so genannten Referenzgruppe (auch Normierungsgruppe oder Eichstichprobe genannt) erfolgen. Der Normwert (Standardwert, SW) ermöglicht die Bestimmung der relativen Position einer Einzelleistung in der Rangfolge der tatsächlichen Leistungen der definierten Referenzgruppe. Die Gewinnung solcher Normen bezeichnet man auch als Testeichung.

Für den R-PA stehen drei Normgruppen (Vergleichsgruppen) zur Verfügung (siehe Kasten). Zwei Gruppen sind bildungsspezifisch, eine Gruppe orientiert sich hinsichtlich der Schulbildung an der Gesamtbevölkerung. Für die Interpretation ist zu beachten, dass ausschließlich Personen getestet wurden, die Deutsch auf Muttersprache-Niveau sprechen (Selbsteinschätzung).

Die drei Normgruppen des R-PA
1.      bildungsspezifische Normen für Personen ohne (angestrebte) (Fach-)Hochschulreife (n = 578)

2.      bildungsspezifische Normen für Personen mit (angestrebter) (Fach-)Hochschulreife (n = 771)

3.      Gesamtgruppe (ohne Differenzierung der Schulbildung, 40 % (Fach-)Hochschulreife, 60 % keine (Fach-)Hochschulreife; die entsprechenden Daten wurden durch Stratifizierung erzeugt (n = 963))

Für die Interpretation der R-PA Werte werden bildungsspezifische Normen angeboten, weil sich statistisch bedeutsame Leistungsunterschiede zu Lasten der Personen ohne (angestrebte) (Fach-)Hochschulreife gezeigt haben und Fälle denkbar sind, bei denen man die Leistungen um den Bildungseffekt bereinigen möchte.

Altersspezifische Normen wurden nicht berechnet, weil sich keine altersspezifischen Leistungseffekte gezeigt haben. Beim R-PA wurde darauf geachtet, dass in beiden Bildungsgruppen alle Altersstufen gleich häufig vertreten sind. Möglicherweise ist es aus diesem Grunde gelungen zu zeigen, dass die Rechtschreibleistungen ab dem Alter von 15 Jahren nicht mehr systematisch steigt oder abnimmt. Da die Leistungen in der untersuchten Gruppe nicht in Abhängigkeit vom Alter variieren, kann man mit einiger Wahrscheinlichkeit davon ausgehen, dass die Normen auch für lebensältere passen (untersucht wurden aber nur Personen bis maximal 24 Jahren), auch wenn eine diesbezügliche Prüfung aussteht.

Für den R-PA werden keine geschlechtsspezifischen Normen angeboten, gleichwohl Frauen im Durchschnitt statistisch bedeutsam besser im Test abschneiden). Ein „Bonus“ für Männer durch geschlechtsspezifische Normen erscheint nicht angemessen. Das Geschlecht ist, anderes als die Bildung, ein stabiles Merkmal.

Empirische Kennwerte als Grundlage der Qualitätssicherung und -beurteilung

Die Qualität eines Tests lässt sich nur dann vollständig erschließen, wenn aus empirischen Studien gewonnene Kennwerte vorliegen (https://kersting-internet.de/qualitaetssicherung/testbeurteilung/). In der DIN 33430 (DIN, 2016) ist konkret ausgeführt, welche Informationen für die Qualitätsbeurteilung von Tests relevant sind. Hierzu zählen beispielsweise empirisch ermittelten Werte zur Zuverlässigkeit (Reliabilität) und Gültigkeit (Validität). Die konkreten Informations-Anforderungen an Fragebogen und Tests wurden von Kersting (2018) zu einer Checkliste „Anforderungen an Verfahrenshinweise“ zusammengefasst. Die Checkliste gilt offiziell als „Standard zur Information und Dokumentation von Instrumenten zur Erfassung menschlichen Erlebens und Verhaltens des Diagnostik- und Testkuratoriums (DTK) der Föderation Deutscher Psychologenvereinigungen“, sie steht zum freien Download bereit (https://kersting-internet.de/qualitaetssicherung/din-33430-buch/din-screen/).

Das Testbeurteilungssystem des Diagnostik- und Testkuratoriums (DTK, 2018) sieht vor, dass jedes veröffentlichte Testmanual (Testhandbuch, Verfahrenshinweise) eine Tabelle umfasst, in der verzeichnet ist, in welchem Abschnitt der vorliegenden Verfahrenshinweise diese Informationen zum Test, die laut dem genannten Standard notwendigerweise vorliegen müssen, zu finden sind. Dies ist die so genannte Übersichts-Tabelle zur „DIN SCREEN Checkliste 1“. Das Vorhandensein oder Fehlen dieser Tabelle in einem Testmanual ist ein erster Indikator für die Qualität eines Tests. Für den R-PA liegt diese Tabelle vor, sie ist Bestandteil der Verfahrenshinweise.

Da beim R-PA Informationen zu allen „Muss-Forderungen“ der Checkliste vorliegen, erfüllen die Verfahrenshinweise zum R-PA den Qualitätsanspruch des Diagnostik- und Testkuratoriums (DTK) an Information und Dokumentation von Instrumenten zur Erfassung menschlichen Erlebens und Verhaltens. Das DKT hat für das Verfahren das so genannte „TBS-DTK-Transparenz-Zertifikat“ ausgestellt. Dies bedeutet, dass das Verfahren nach Ansicht des DTK die Voraussetzungen erfüllt, um einer Qualitätskontrolle unterzogen zu werden. Diese Qualitätskontrolle selbst hat das DTK für den R-PA nicht vorgenommen.

Empirische Studien mit dem R-PA

Um die Qualität des R-PA zu bestimmen und zu sichern, wurden mehrere empirische Studien mit insgesamt 3209 Personen durchgeführt.

Itemkennwerte

Um die Schwierigkeit gibt den Prozentsatz der Personen der Normierungsgruppe an, die das Item gelöst haben, also die korrekte Schreibweise gewählt haben. Ein Test wie der R-PA sollte über das gesamte Merkmalsspektrum differenzieren, die Items sollten Schwierigkeitsindizes in allen Schwierigkeitsgraden aufweisen und gleichmäßig über den Bereich von .05 bis .95 verteilt sein. Dies ist beim R-PA der Fall, der sowohl einige wenige sehr leichte (im Extremfall .91, Item 4) als auch einige wenige sehr schwere Items (im Extremfall .07, Item 14) vorsieht. Durch die sehr leichten und sehr schwierigen Items wird eine Differenzierung auch in den Randbereichen gewährleistet. Obwohl es einige hinsichtlich der Schwierigkeit extreme Items für die Differenzierung benötigt, sollen die Items ansonsten über den gesamten Bereich streuen und im Durchschnitt im Idealfall im mittleren Bereich liegen – dies ist beim R-PA mit einer mittleren Itemschwierigkeit von .54 der Fall. Boden- und Deckeneffekte werden so vermieden.

Als Trennschärfe bezeichnet man die Korrelation eines Items mit der Gesamtleistung im Test. Die Gesamtleistung im Test (der Gesamtwert wird dabei um den Beitrag des Items vermindert). Als Maßzahl für die Trennschärfe wird der Korrelationskoeffizient genutzt, der zwischen – 1.0 und + 1.0 variieren kann. Items mit einer hohen Trennschärfe erlauben es besonders gut, zwischen Personen mit höheren Leistungen (in der Rechtschreibung) und Personen mit niedrigeren Leistungen zu unterscheiden. Insgesamt 86 % aller Items im R-PA weisen eine Trennschärfe über .20, 75 % eine Trennschärfe über .30 auf.

Reliabilität

Ein Test soll reliabel sein, also zuverlässig messen. D. h. er soll eine hohe Messgenauigkeit aufweisen, die Testergebnisse sollen mit einem geringen Messfehler behaftet sein. Die Reliabilität wird über verschiedene Methoden geschätzt. Ein verbreitetes Maß zur Schätzung der Reliabilität ist Cronbachs Alpha, das bei Tests bestimmt werden kann, bei denen alle Items ein (und nur ein) gemeinsames Merkmal (im Falle des R-PA die Rechtschreibfähigkeit) messen. Der R-PA erzielt in allen Normungsgruppen ein Cronbachs Alpha in Höhe von mindestens .85, für die stratifizierte Gesamtgruppe beträgt die so gemessene interne Konsistenz .89.

Validität

Validität (Gültigkeit) ist dann gegeben, wenn intendierte Interpretationen der Messwerte durch theoretische und empirische Belege gerechtfertigt werden können. Durch die Validitätsbelege lässt sich die Anwendung des Verfahrens rechtfertigen. Dabei können unterschiedliche Argumente die Interpretation untermauern. Bei der „Kontentvalidierung“ trifft man einen Schluss auf Verhalten außerhalb des Tests, welches dem Testverhalten unmittelbar ähnlich ist (z.B. die Anzahl der Rechtschreibfehlerleistung in einer E-Mail). Bei der „Kriteriumsvalidierung“ schließt man auf Verhalten außerhalb des Tests, welches mit dem Testverhalten unter Umständen keine offensichtliche Ähnlichkeit aufweist, aber erwartbar in Zusammenhang steht, etwa der Schul- oder Berufserfolg. Bei der „Konstruktvalidierung“ wird auf ein so genanntes latentes Merkmal geschlossen. Um die Interpretation der aus dem R-PA abgeleiteten Ergebnisse abzusichern, wurden alle drei Validierungsstrategien angewendet.

Kontentvalidität

Auf den ersten Blick scheint die Kontentvalidität eines Rechtschreibtests außer Frage zu stehen, weil damit ein Verhalten erfasst wird, das unmittelbar dem Verhalten außerhalb des Tests (der Rechtschreibung in nicht-Testsituationen) ähnlich ist. Strenggenommen stellt sich bei der Kontentvalidierung eines Rechtschreibtests aber die Frage, welche Rechtschreibregeln im Test repräsentiert sind und welche nicht. Wie oben ausgeführt wurde, wurde ein Teil der Zielwörter des R-PA wurde dem Lückendiktat „Rummelplatz“ aus dem RT (Kersting und Althoff, 2004) entnommen, das seinerseits Kontentvalidität beansprucht (siehe Abschnitt 4.1). Die Konstruktion des anderen R-PA-Teils orientierte sich an den Regeln, die im Zuge der Rechtschreibreform neu eingeführt wurden (siehe ebenfalls Abschnitt 4.1).

Die Frage der Kontentvalidität bezieht sich auch auf das Antwortformat. Im Alltag ist häufig das aktive Schreiben gefragt – diese Fähigkeit wird mit einem Diktat und einem Lückendiktat abgebildet. Im R-PA muss eine Person aber nichts schreiben, sondern sie kreuzt lediglich die richtige Schreibweise an. Wird mit dem Single-Choice-Test dasselbe erfasst wie mit dem Lücken-Diktat? Dazu wurden mehrere empirische Prüfungen durchgeführt, die belegen, dass mit dem R-PA Kurztest im Single-Choice Format im Wesentlichen dieselben Rechtschreibfähigkeiten erfasst werden wie mit den entsprechenden Items im aufwändigen Lückendiktat RT.

Kriteriumsvalidität

Eine Testung erfolgt nicht zum Selbstzweck. Häufig möchte man vom Testergebnis auf Verhalten außerhalb der Testsituation schließen. Der Nachweis der Kriteriumsvalidität rechtfertigt einen solchen Schluss und damit den Einsatz des R-PA. Zur Kriteriumsvalidierung des R-PA wurden in verschiedenen Studien die Schulnoten des letzten Zeugnisses in ausgewählten Fächern abgefragt. Es konnten substanzielle Zusammenhänge zwischen den Leistungen im R-PA und ausgewählten Schulleistungen (insbesondere mit den Noten in den Fächern Deutsch und Englisch sowie mit einer Gesamtnote) aufgezeigt werden.

Zur Kriteriumsvalidierung wurden außerdem bereichsspezifische Selbsteinschätzungen herangezogen. Personen sind in der Lage, ihre Leistungsfähigkeit differenziert und zutreffend zu beurteilen. Die vor der Bearbeitung des R-PA eingeholte Selbsteinschätzung der Rechtschreibleistung korrelierte substanziell mit der tatsächlichen Leistung im R-PA.

Konstruktvalidierung

Mit den Studien zur Konstruktvalidierung soll empirisch geprüft werden, ob es zulässig ist, von den Ergebnissen im R-PA auf die Ausprägung des latenten Merkmals „Rechtschreibfähigkeit“ zu schließen. Konkret geht es im Rahmen der konvergenten Konstruktvalidierung nach DIN 33430 (DIN, 2016) darum, aufgrund von inhaltlichen Überlegungen und empirischen Ergebnissen darzulegen, wie sich das fragliche Konstrukt zu ähnlichen Konstrukten verhält (konvergente Gültigkeit). Aus der bisherigen Theorie und Empirie zur Rechtschreibfähigkeiten lässt sich ableiten, dass Rechtschreibleistungen mit Intelligenzleistungen, mit Leistungen in einer Fremdsprache sowie mit Interpunktionsleistungen korrelieren sollten. Dies wurde für den R-PA geprüft. Dabei hat sich in mehreren empirischen Studien gezeigt, dass die Leistungen im R-PA konstruktvalide interpretiert werden können.

Akzeptanz

Tests sollten aus Sicht der getesteten Personen akzeptabel sein. Um die Akzeptanz zu messen, wurde bei einer Studie mit 185 Personen im Anschluss an den R-PA der Fragebogen Akzept-L von Kersting (2008) eingesetzt (https://kersting-internet.de/testentwicklungen/akzept-fragebogen/). Allerdings fehlte bei dieser Studie aufgrund einer Panne die Akzept-L-Skala zur Kontrollierbarkeit. Der R-PA wurde in allen geprüften Akzeptanzdimensionen mit einem Wert größer als 3.0 (Skala von 1, negativ, bis 6, positiv) und somit positiv bewertet. Im individuellen Akzeptanz-Stärken-Schwächen Profil erfährt der Aspekt der Belastungsfreiheit eine besonders positive Bewertung (der Test wird als wenig belastend wahrgenommen) während die Augenscheinvalidität – wie bei den meisten Tests – kritischer gesehen wird. Anwenderinnen und Anwender sollten den getesteten Personen erläutern, warum sie die Testung der Rechtschreibung für die jeweilige diagnostische Fragestellung für notwendig erachten.

Aktuelles

Wenn Sie eine Studie mit dem R-PA durchgeführt haben, besteht die Möglichkeit, im Rahmen dieser Website unter der Rubrik „Aktuelles „auf die Studienergebnisse aufmerksam zu machen.

Weiterentwicklungen und Kooperationen

Der R-PA ist ein ausgereifter messtheoretisch fundierter Test. Wie für jedes Verfahren sind aber auch für den R-PA weitere Erkenntnisse wünschenswert, die auch durch Kooperationen zwischen Anwenderinnen / Anwendern und Testentwicklerinnen / -entwickler generiert werden könnten.

Forschungs- und Entwicklungsbedarf

Die ältesten der im Rahmen der Normierungsstudien mit dem R-PA getesteten Personen waren 24 Jahre alt. In der Gruppe der untersuchten 15 bis 24-Jährigen zeigten sich keine systematischen Alterstrends, was zu der Annahme führt, dass die Normen auch für Lebensältere passen. Diese Annahme muss empirisch geprüft werden. Falls Sie eine Möglichkeit haben, eine größere Gruppe Lebensälterer zu testen, melden Sie sich bitte für eine Kooperation.

Forschungsbedarf besteht hinsichtlich des Zusammenhangs zwischen den Fähigkeiten zur Rechtschreibung einerseits und zur Zeichensetzung andererseits. Diese Forschung setzt das Vorhandensein valider Messinstrumente zur Interpunktionsfähigkeit von Erwachsenen voraus, an denen es aktuell mangelt.

Wünschenswert ist eine Studie zur Retest-Reliabilität. Zwar wurde eine kleine Studie dazu durchgeführt, deren Aussagekraft ist aber zu hinterfragen, da die Methodik nicht optimal war. Die Bestimmung der Stabilität der Messung setzt die Stabilität des Merkmals voraus. In der vorliegenden Studie konnte nicht ausgeschlossen werden, dass ein Teil der Stichprobe zwischendurch – ggf. angeregt durch die Testung zum ersten Messzeitpunkt – hinsichtlich der Rechtschreibung gelernt hat. Eine erneute Studie müsste unter Bedingungen stattfinden, die das Lernen kontrollieren, indem z.B. alle an einem Rechtschreibtraining teilnehmen. Falls Sie eine Möglichkeit haben, mit eine größere Gruppe von Personen eine Retest-Studie zum R-PA durchzuführen, melden Sie sich bitte für eine Kooperation.

Es wäre auch interessant eine Studie zur Intervention durchzuführen. Durch eine Testung mit dem R-PA vor und nach einem Rechtschreibtraining könnte geprüft werden, ob der R-PA, wie zu erarten, die erzielten Lerngewinne valide abbildet.

Bei der Studie zur Akzeptanz fehlte die Akzept-L-Skala zur Kontrollierbarkeit (Kersting, 2008). Insge­samt sind weitere Akzeptanzstudien erstrebenswert. Dabei wäre es insbesondere interessant zu erfahren, wie der R-PA im Kontext einer realen diagnostischen Situation, z.B. einer Personalauswahl­situation, eingeschätzt wird. Falls Sie eine Möglichkeit haben, einer größeren Gruppe von Personen, die den R-PA im Bewerbungskontext bearbeitet haben, anschließend den Akzept-Fragebogen (https://kersting-internet.de/testentwicklungen/akzept-fragebogen/) bearbeiten zu lassen, melden Sie sich bitte für eine Kooperation. Vor allem wären Studien wünschenswert, bei denen Personen im Within-Subject-Design die Akzeptanz des R-PA im Vergleich zu anderen Rechtschreibtests bzw. anderen diagnostischen Verfahren beurteilen.

Neben dem grundsätzlichen Ausbau der Kriteriumsvalidierung wären vor dem Hintergrund der geschlechtsspezifischen Leistungsunterschiede insbesondere Studien zur differentiellen Kriteriumsvalidität interessant. An solchen Studien besteht insgesamt ein großer Bedarf.

Schließlich sind Studien zur diskriminanten Konstruktvalidierung wünschenswert. Dabei könnte z.B. der Nachweis erbracht werden, dass der R-PA nicht mit konstruktirrelevanten Merkmalen, wie z.B. der Testängstlichkeit, korreliert.

Kooperation

Die oben genannten Forschungs- und Entwicklungsbedarfe ergeben sich aus den Ausführungen im vorliegenden Manual. Weitere Fragen von Forscherinnen / Forschern und Anwenderinnen / Anwendern sind überaus willkommen.

Ein Teil der oben genannten Fragen lässt sich bereits durch die Erfahrungen beantworten, die in der Praxis mit dem R-PA gesammelt werden. Es wäre sehr wertvoll, wenn Anwenderinnen / Anwender ihre Erfahrungen mit dem R-PA mitteilen und damit die Testpflege unterstützen würden. Diese Unterstützung könnte in Form von einem Erfahrungsbericht über konkrete Anregungen und Kritik bis hin zur Bereitstellung von (anonymisierten) Daten oder der gemeinschaftlichen Planung von Datenerhebungen stattfinden. Bitte kommen Sie (via E-Mail) auf uns zu!