Smits Paradoxon

From Wikipedia, the free encyclopedia

In der klassischen mathematischen Statistik gilt, salopp formuliert: Je größer die Stichprobe, desto besser die Schätzung (genauer siehe Hauptsatz der mathematischen Statistik). In der Statistik zufälliger Prozesse ist es jedoch möglich – und wird dann in der Regel als paradox empfunden –, dass eine Schätzung durch Vergrößerung des Stichprobenumfangs schlechter wird. S. J. Wilenkin war der erste, dem das 1959 auffiel,[1] doch waren in seiner Arbeit Fehler, so dass J. C. Smit 1961[2] der Namensgeber des Paradoxons wurde.

Das Paradoxon

Sei ein schwach stationärer zufälliger Prozess mit unbekanntem konstanten Erwartungswert und (bekannter) Kovarianzfunktion . Der Prozess kann für beobachtet werden. Seien (diskrete) Beobachtungen und die kontinuierliche Beobachtung des Prozesses über das gesamte . Dann sind

erwartungstreue Schätzungen für . Intuitiv scheint klar zu sein, dass besser ist als , weil es mehr Informationen ausnutzt, nämlich Informationen aus ganz , während nur punktuelle Informationen nutzt. Doch schon für einfache Spezialfälle zeigt sich das Gegenteil: ist besser als , wenn man die Varianz der Schätzer als Kriterium nimmt:

Beispiel

Sei , d. h. diskrete Beobachtungsstellen. Dann ergibt sich sowie , d. h. ist besser als . Wenn man weitere Beobachtungen zwischen den bisherigen Stellen mit einbezieht, d. h. bei , dann verschlechtert sich die Varianz von von auf , d. h., eine „Verdichtung“ der Beobachtungen führt zu einem schlechteren Ergebnis.

Auflösung des Paradoxons

Die Schätzung ist für nicht die beste lineare erwartungstreue Schätzung (englisch Best Linear Unbiased Estimator, kurz BLUE), wird also mit einer nicht-optimalen Schätzung verglichen. Die BLUE für ergibt sich nach einem Satz von Grenander[3] in Form eines Stieltjesintegrales als Lösung der Integralgleichung mit .

Fortsetzung Beispiel

Siehe auch.[4] Mit den gleichen Setzungen wie in obigem Beispiel ergibt sich

.

legt im Gegensatz zu Extragewichte auf den Rand des Beobachtungsintervalles (). Die diskrete Fünf-Punkte-Schätzung approximiert diese Randgewichtung besser als und ist damit auf natürliche Weise der bessere Schätzer.

Praktische Bedeutung

Das für stochastische Prozesse geschilderte Phänomen gilt auch für zufällige Felder. Insbesondere in der Geostatistik ist es wichtig zu wissen, dass eine Netzverdichtung in Geoinformationssystemen keineswegs automatisch zu besseren Schätzergebnissen führt.[5]

Einzelnachweise

Related Articles

Wikiwand AI