Einleitung: Warum Kritik an Auswahlverfahren wichtig bleibt
-
Warum stoßen Personalauswahlverfahren seit über 100 Jahren auf grundsätzliche Kritik?
-
Welche Zielstellung hat dieser Überblick?
Seit Beginn des 20. Jahrhunderts gibt es den Versuch, berufliche Eignung mit Tests, Interviews und Simulationen möglichst objektiv vorherzusagen. Gleichzeitig ziehen sich Zweifel durch die gesamte Forschungsgeschichte: Lässt sich Eignung überhaupt zuverlässig messen? Welche Grenzen sind prinzipiell nicht überwindbar? Dieser Artikel fasst die zentralen Kritiken zur Personalauswahl aus den letzten 100 Jahren zusammen und bewertet ihre heutige Relevanz.
Frühe Kritik an Tests und subjektiven Urteilen
-
Warum wurden Intelligenztests schon in den 1920er Jahren als reduktionistisch kritisiert?
-
Was zeigte Paul Meehl über die Überlegenheit statistischer Modelle gegenüber menschlichen Urteilen?
Walter Lippmann argumentierte bereits 1922, dass Intelligenztests Menschen auf Zahlen reduzierten und kulturell verzerrt seien. Tatsächlich zeigen aktuelle Studien, dass Intelligenztests nur 10–15 % der Unterschiede in Berufserfolg erklären. Paul Meehl belegte 1954 empirisch, dass subjektive Urteile unzuverlässig sind und statistische Modelle deutlich überlegen. Diese beiden Linien – Reduktionismus-Kritik einerseits und die Forderung nach mehr Struktur und Objektivität andererseits – markieren den Beginn der modernen Eignungsdiagnostik.
Persönlichkeit, Verhalten und das Kriteriumsproblem
-
Welche Rolle spielen Persönlichkeitstests und wie wurde ihre Aussagekraft kritisiert?
-
Warum ist Verhalten stärker kontextabhängig, als es Tests abbilden können?
-
Worin besteht das Kriteriumsproblem?
Guion & Gottier kritisierten 1965, dass Persönlichkeitstests kaum valide seien. Erst mit den Big Five zeigten sich kleine bis moderate Zusammenhänge, insbesondere über Gewissenhaftigkeit. Walter Mischel machte 1968 deutlich, dass Verhalten stark situationsabhängig ist, sodass Traits nur bedingt Prognosekraft besitzen. Ergänzend wies Austin & Villanova 1992 auf das „Kriteriumsproblem“ hin: Berufserfolg ist multidimensional, instabil und daher schwer eindeutig messbar. Diese Grundkritik bleibt bis heute bestehen – jede Validierungsstudie hängt davon ab, welches Erfolgskriterium überhaupt zugrunde gelegt wird.
Neue Verfahren und Revisionen: Von ACs bis Meta-Analysen
-
Welche Schwächen zeigen sich bei Assessment-Centern und Persönlichkeitstests?
-
Warum mussten Meta-Analysen zu Validitäten revidiert werden?
-
Gibt es ein „bestes Verfahren“?
Morgeson et al. (2007) stellten fest, dass Persönlichkeitstests nur geringe Anteile der Leistung erklären und zudem leicht verfälscht werden können. Lance et al. (2011) zeigten, dass Assessment-Center eher Übungseffekte als stabile Eigenschaften messen. Besonders einschneidend ist die Revision durch Sackett et al. (2022/23): Validitäten liegen niedriger als lange angenommen, auch Kombinationen erklären nur 10–15 % der Varianz. Damit ist klar: Es gibt kein überlegenes Einzelverfahren, sondern nur multimodale Ansätze mit begrenzter Prognosekraft.
Schlussfolgerung: Was bedeutet das für die Praxis und den Empfehlungsbund?
-
Welche Lehren sollten Unternehmen aus 100 Jahren Kritik ziehen?
-
Warum reicht es nicht, nur auf einzelne Verfahren zu setzen?
-
Wie ergänzt der Empfehlungsbund klassische Auswahlmethoden?
Die Geschichte zeigt: Kritik an Auswahlverfahren ist keine Randnotiz, sondern ein notwendiges Korrektiv. Sie verdeutlicht, dass Personalauswahl helfen kann, Fehler zu reduzieren – aber nie perfekte Vorhersagen liefert. Unternehmen sollten Verfahren kombinieren, die Grenzen offen kommunizieren und zusätzliche Wege nutzen, um Talente zu finden. Hier setzt der Empfehlungsbund an: Neben klassischen Methoden ermöglicht er einen Peer-Review-Ansatz, bei dem Kandidaten von unabhängigen Kollegen aus der gleichen Branche empfohlen werden. So entsteht ein praxisnahes Korrektiv, das die bekannten Grenzen psychologischer Tests sinnvoll ergänzt.

Quellen
-
Lippmann, W. (1922/23): Critique of Intelligence Tests. Artikelreihe in The New Republic.
-
Meehl, P. E. (1954): Clinical vs. Statistical Prediction. Minneapolis: University of Minnesota Press.
-
Guion, R. M., & Gottier, R. F. (1965): Validity of Personality Inventories in Personnel Selection. In: Personnel Psychology, 18(2)
-
Mischel, W. (1968): Personality and Assessment. New York: Wiley.
-
Gould, S. J. (1981): The Mismeasure of Man. New York: Norton.
-
Kompa, H. (1990): Assessment-Center: Ritual statt Validität. Wiesbaden: Gabler.
-
Neuberger, O. (1989): Macht und Karriere. Stuttgart: Enke.
-
Austin, J. T., & Villanova, P. (1992): The Criterion Problem: 1917–1992. In: Journal of Applied Psychology, 77(6)
-
Morgeson, F. P., Campion, M. A., Dipboye, R. L., Hollenbeck, J. R., Murphy, K., & Schmitt, N. (2007): Reconsidering the Use of Personality Tests in Personnel Selection Contexts. In: Personnel Psychology, 60(3), 683–729.
-
Lance, C. E., Foster, M. R., Gentry, W. A., & Thoresen, J. D. (2011): The Structure of Assessment Center Dimensions: A New Synthesis. In: Organizational Psychology Review, 1(2)
-
Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2022/23): Revisiting Meta-Analytic Estimates of Validity in Personnel Selection: Addressing Systematic Overcorrection. In: Journal of Applied Psychology, 107(12)
-
Murphy, K. R. (2023): The Validity of Selection Tests Revisited. In: Industrial and Organizational Psychology
