Dominierte Verteilungsklasse

Eine dominierte Verteilungsklasse ist in der mathematischen Statistik eine Menge von Wahrscheinlichkeitsmaßen, die alle absolut stetig bezüglich eines Maßes sind. Statistische Modelle mit dominierten Verteilungsklassen sind einfacher zu handhaben als solche ohne, da die Existenz einer Wahrscheinlichkeitsdichte garantiert ist und damit Methoden wie die Maximum-Likelihood-Methode angewandt werden können. Außerdem existieren für dominierte Verteilungsklassen gut handhabbare Kriterien für Suffizienz und Minimalsuffizienz.

Definition

Gegeben sei ein Messraum ( Ω , Σ ) {\displaystyle (\Omega ,\Sigma )} sowie eine Menge P {\displaystyle {\mathcal {P}}} von Wahrscheinlichkeitsmaßen auf diesem Messraum. Die Menge P {\displaystyle {\mathcal {P}}} heißt dann eine dominierte Verteilungsklasse, wenn ein σ-endliches Maß μ {\displaystyle \mu } existiert, so dass für alle P P {\displaystyle P\in {\mathcal {P}}} gilt, dass

P μ {\displaystyle P\ll \mu }

gilt. Jedes P {\displaystyle P} ist also absolut stetig bezüglich μ {\displaystyle \mu } , das heißt für alle A Σ {\displaystyle A\in \Sigma } mit μ ( A ) = 0 {\displaystyle \mu (A)=0} gilt auch P ( A ) = 0 {\displaystyle P(A)=0} . Dies wird dann auch mit P μ {\displaystyle {\mathcal {P}}\ll \mu } notiert.

Beispiele

  • Per Definition ist die Exponentialfamilie eine dominierte Verteilungsklasse, da sie als genau die Verteilungsklasse definiert ist, die eine vorgegebene Dichte bezüglich eines Maßes hat.
  • Definiert man als Verteilungsklasse P {\displaystyle {\mathcal {P}}} genau diejenigen Wahrscheinlichkeitsmaße auf R {\displaystyle \mathbb {R} } , die eine Wahrscheinlichkeitsdichte besitzen, so ist auch dies eine dominierte Verteilungsklasse. Dominierendes Maß ist hier das Lebesgue-Maß.
  • Ist C {\displaystyle C} die Cantor-Verteilung und definiert man mit obigem P {\displaystyle {\mathcal {P}}} die neue Verteilungsklasse als P = P C {\displaystyle {\mathcal {P}}^{*}={\mathcal {P}}\cup C} , so ist per se nicht klar, ob P {\displaystyle {\mathcal {P}}^{*}} eine dominierte Verteilungsklasse ist oder nicht. P {\displaystyle {\mathcal {P}}^{*}} wird jetzt nicht mehr durch das Lebesque-Maß dominiert, da die Cantor-Verteilung keine Dichte bezüglich des Lebesgue-Maßes hat. Nicht klar ist aber, ob es ein anderes σ-endliches Maß gibt, dass P {\displaystyle {\mathcal {P}}^{*}} dominiert, oder ob ein solches Maß nicht existieren kann und damit die Verteilungsklasse zu einer nicht dominierten Verteilungsklasse macht.

Eigenschaften

  • Ist P {\displaystyle {\mathcal {P}}} eine dominierte Verteilungsklasse, so wird diese Klasse auch immer durch ein Wahrscheinlichkeitsmaß dominiert. Denn ist μ σ {\displaystyle \mu _{\sigma }} ein σ-endliches Maß, das die Verteilungsklasse dominiert, so lässt sich durch
μ W ( A ) := n = 1 1 2 n μ σ ( A n A ) μ σ ( A n ) {\displaystyle \mu _{W}(A):=\sum _{n=1}^{\infty }{\frac {1}{2^{n}}}{\frac {\mu _{\sigma }(A_{n}\cap A)}{\mu _{\sigma }(A_{n})}}}
ein Wahrscheinlichkeitsmaß definieren, das die Verteilungsklasse dominiert. Dabei sind die A n {\displaystyle A_{n}} eine Zerlegung von Ω {\displaystyle \Omega } mit 0 < μ σ ( A n ) < {\displaystyle 0<\mu _{\sigma }(A_{n})<\infty } , wie in der Definition des σ-endlichen Maßes gefordert wird.
  • Ist P {\displaystyle {\mathcal {P}}} eine dominierte Verteilungsklasse, so existiert immer ein P {\displaystyle P^{*}} , so dass N P = N P {\displaystyle {\mathcal {N}}_{\mathcal {P}}={\mathcal {N}}_{P^{*}}} und P {\displaystyle P^{*}} eine abzählbare Konvexkombination mit echt positiven Koeffizienten von Elementen aus P {\displaystyle {\mathcal {P}}} ist. Es gilt also
P = i = 1 α i P i  mit  α i > 0  und  i = 1 α i = 1 {\displaystyle P^{*}=\sum _{i=1}^{\infty }\alpha _{i}P_{i}{\text{ mit }}\alpha _{i}>0{\text{ und }}\sum _{i=1}^{\infty }\alpha _{i}=1} .
Dabei bezeichnet N P {\displaystyle {\mathcal {N}}_{\mathcal {P}}} die Menge aller P {\displaystyle {\mathcal {P}}} -Nullmengen. Dieses P {\displaystyle P^{*}} spielt eine wichtige Rolle im Satz von Halmos-Savage und einigen aus ihm abgeleiteten Ergebnissen.
  • Ist P {\displaystyle {\mathcal {P}}} eine dominierte Verteilungsklasse und ist P n {\displaystyle {\mathcal {P}}^{\otimes n}} die Klasse der n-fachen Produktmaße, so ist auch P n {\displaystyle {\mathcal {P}}^{\otimes n}} dominiert.
  • Ist P {\displaystyle {\mathcal {P}}} dominiert durch μ {\displaystyle \mu } und ist f {\displaystyle f} eine messbare Funktion und sind alle Bildmaße P f {\displaystyle P_{f}} unter f {\displaystyle f} σ-endlich, so ist auch die Verteilungsklasse der Bildmaße P f {\displaystyle {\mathcal {P}}_{f}} dominiert von μ f {\displaystyle \mu _{f}} .
  • Ist P {\displaystyle {\mathcal {P}}} separabel bezüglich der Totalvariationsmetrik, so ist P {\displaystyle {\mathcal {P}}} dominiert.
  • Ist P L {\displaystyle {\mathcal {P}}_{L}} die von P {\displaystyle P} erzeugte Lokationsklasse, so ist P L {\displaystyle {\mathcal {P}}_{L}} genau dann eine dominierte Verteilungsklasse, wenn P {\displaystyle P} dominiert ist.
  • Ist die σ-Algebra A {\displaystyle {\mathcal {A}}} des statistischen Modells separabel und die Verteilungsklasse dominiert, so ist die Verteilungsklasse separabel bezüglich der Totalvariationsmetrik.

Verwendung

Nach dem Satz von Radon-Nikodým existieren für dominierte Verteilungsklassen immer Wahrscheinlichkeitsdichten bezüglich des dominierenden Maßes. Diese Existenzaussage ermöglicht bei stochastischen Modellen, die mit einer dominierten Verteilungsklasse ausgestattet sind, die Anwendung von Methoden, die auf Wahrscheinlichkeitsdichten beruhen. Ein Beispiel hierfür ist die Maximum-Likelihood-Methode.

Außerdem existieren bei dominierten Verteilungsklassen Kriterien, welche die Überprüfung der Suffizienz von σ-Algebren und Suffizienz von Statistiken erleichtern. Die meisten dieser Kriterien bauen auf dem Satz von Halmos-Savage unter Verwendung des oben konstruierten Maßes P {\displaystyle P^{*}} auf. Eines dieser Kriterien ist das Neyman-Kriterium, das beispielsweise die Suffizienz der Exponentialfamilie liefert.

Aus dem Satz von Halmos-Savage lässt sich auch ableiten, dass für dominierte Verteilungsklassen immer eine minimalsuffiziente σ-Algebra existiert. Sie wird von den Dichten der P {\displaystyle P} bezüglich P {\displaystyle P^{*}} erzeugt.

Literatur

  • Ludger Rüschendorf: Mathematische Statistik. Springer Verlag, Berlin Heidelberg 2014, ISBN 978-3-642-41996-6, doi:10.1007/978-3-642-41997-3.