Eine kleine Statistik zum Korrekturlesen

Kein Korrektor findet alle Fehler in einem Text, oder anders gesagt: 100% fehlerfrei gibt es nicht. Auf dieser Überlegung gründet sich die folgende, in Lehrbüchern der Statistik gern gebrachte Abschätzung der Gesamtfehlerzahl in einem Manuskript.

Zwei Korrektoren lesen dasselbe Manuskript. Korrektor 1 findet n1, Korrektor 2 findet n2 Fehler. Von diesen Fehlern werden n12 Fehler durch beide Korrektoren gefunden. Daraus lässt sich die Gesamtzahl N der Fehler im Manuskript abschätzen.

Man nimmt dazu an, dass die beiden Korrektoren unabhängig voneinander arbeiten, dass es recht viele Fehler im Manuskript gibt und dass jeder Fehler im Manuskript von Korrektor 1 bzw. von Korrektor 2 mit einer gewissen Wahrscheinlichkeit p1 bzw. p2 gefunden wird.

Von den n2 Fehlern, die Korrektor 2 gefunden hat, hat Korrektor 1 gerade n12 Fehler gefunden. Ein guter Näherungswert für die Wahrscheinlichkeit p1, dass Korrektor 1 einen Fehler findet, ist also n12/n2. Weil Korrektor 1 aber alles in allem n1 von den insgesamt N Fehlern im Manuskript gefunden hat, kann man die Wahrscheinlichkeit p1 auch als n1/N angeben. Damit kann man (näherungsweise) gleichsetzen: n12/n2n1/N oder Nn1·n2/n12.

Beispiel: Korrektor 1 findet 10 und Korrektor 2 findet 13 Fehler, 8 Fehler werden von beiden Korrektoren gefunden (mathematisch: n1 = 10, n2 = 13, n12 = 8). Damit kann man die Gesamtfehlerzahl in dem Manuskript abschätzen zu 10·13/8 = 16.

Mit einigen mathematischen Klimmzügen lässt sich die Gesamtfehlerzahl N auch abschätzen, wenn mehr als zwei Korrektoren gearbeitet haben, aber das würde hier zu weit führen.