Eine kleine Statistik zum Korrekturlesen

Kein Korrektor findet alle Fehler in einem Text, oder anders gesagt: 100% fehlerfrei gibt es nicht. Auf dieser Überlegung gründet sich die folgende, in Lehrbüchern der Statistik gern gebrachte Abschätzung der Gesamtfehlerzahl in einem Manuskript.

Zwei Korrektoren lesen dasselbe Manuskript. Korrektor 1 findet n₁, Korrektor 2 findet n₂ Fehler. Von diesen Fehlern werden n₁₂ Fehler durch beide Korrektoren gefunden. Daraus lässt sich die Gesamtzahl N der Fehler im Manuskript abschätzen.

Man nimmt dazu an, dass die beiden Korrektoren unabhängig voneinander arbeiten, dass es recht viele Fehler im Manuskript gibt und dass jeder Fehler im Manuskript von Korrektor 1 bzw. von Korrektor 2 mit einer gewissen Wahrscheinlichkeit p₁ bzw. p₂ gefunden wird.

Von den n₂ Fehlern, die Korrektor 2 gefunden hat, hat Korrektor 1 gerade n₁₂ Fehler gefunden. Ein guter Näherungswert für die Wahrscheinlichkeit p₁, dass Korrektor 1 einen Fehler findet, ist also n₁₂/n₂. Weil Korrektor 1 aber alles in allem n₁ von den insgesamt N Fehlern im Manuskript gefunden hat, kann man die Wahrscheinlichkeit p₁ auch als n₁/N angeben. Damit kann man (näherungsweise) gleichsetzen: n₁₂/n₂ ≈ n₁/N oder N ≈ n₁·n₂/n₁₂.

Beispiel: Korrektor 1 findet 10 und Korrektor 2 findet 13 Fehler, 8 Fehler werden von beiden Korrektoren gefunden (mathematisch: n₁ = 10, n₂ = 13, n₁₂ = 8). Damit kann man die Gesamtfehlerzahl in dem Manuskript abschätzen zu 10·13/8 = 16.

Mit einigen mathematischen Klimmzügen lässt sich die Gesamtfehlerzahl N auch abschätzen, wenn mehr als zwei Korrektoren gearbeitet haben, aber das würde hier zu weit führen.

AUS DEM BLOG