next up previous
Nächste Seite: -Verteilung Aufwärts: Zur zeitlichen Analyse von Vorherige Seite: Transformation der Verteilungen

$\chi ^{2}$-Verteilung

Die Summe von $f$ unabhängigen quadrierten normalverteilten Zufallsvariablen
\begin{displaymath}
Y= \sum\limits_{i=1}^{f} X_{i}^{2}
\end{displaymath} (3)

ist $\chi ^{2}$-verteilt mit $f$ Freiheitsgraden. Für den Fall $f=1$ soll nun die Wahrscheinlichkeitsdichte von $Y$ hergeleitet werden. Es gilt also $Y=g(X)=X^{2}$. Diese Abbildung ist nicht bijektiv, so daß die oben angegebene Gleichung (2) nicht verwendet werden kann. Als Verallgemeinerung von Gleichung (2) kann man in diesem Fall aber schreiben
\begin{displaymath}
F_{y}(y')=P(y\le y')=P(-\sqrt{y'}\le x\le\sqrt{y'})
=F_{x}(\sqrt{y'})-F_{x}(-\sqrt{y'}),
\end{displaymath} (4)

d.h. die Wahrscheinlichkeit dafür, daß $Y<y'$ ist, ist gleich der Wahrscheinlichkeit dafür, daß $x$ zwischen $\pm\sqrt{y'}$ liegt. Dann gilt weiter
\begin{displaymath}
\begin{array}{rcl}
f_{y}(y') & = &
\frac{d}{d\, y}F_{x}(...
...[
f_{x}(\sqrt{y'}+f_{x}(-\sqrt{y'})
\right].
\end{array}
\end{displaymath} (5)

Für eine Gauß-verteilte Variable $X$ ist $f_{x}(x')$ nun symmetrisch und es gilt

\begin{displaymath}
f_{x}(x')=\frac{1}{\sqrt{2\,\pi}} \exp\left(\frac{-\,x^{2}}{2}\right).
\end{displaymath}

Dann folgt für die $\chi ^{2}$-verteilte Variable mit einem Freiheitsgrad
\begin{displaymath}
f_{y}(y) = \frac{1}{\sqrt{y}} f_{x}(\sqrt{y}) =
\frac{1}{\sqrt{2\,\pi\,y}} \exp\left(\frac{-\,y}{2}\right).
\end{displaymath} (6)

Für die $\chi ^{2}$-Verteilung mit mehreren Freiheitsgraden kann man auf ähnliche Weise die Form der Wahrscheinlichkeitsdichte herleiten. Sie soll hier aber nur als Ergebnis dargestellt werden. Für $f$ Freiheitsgrade hat die $\chi ^{2}$-Verteilung (Wahrscheinlichkeitsdichte) die Form
\begin{displaymath}
f_{\chi^{2}}(x)=\frac{1}{2^{\frac{f}{2}}\,\Gamma\left(\frac{f}{2}\right)}\,
x^{\frac{f}{2}-1} \,e^{\frac{-x}{2}}.
\end{displaymath} (7)

Die Werte der Gamma-Funktion folgen dabei aus den drei Gleichungen

\begin{displaymath}
\begin{array}{rcl}
\Gamma\left(\frac{1}{2}\right) & = & \s...
...ox{ und} \\
\Gamma(n) & = & (n-1) \Gamma(n-1).
\end{array}
\end{displaymath}

Um nun die $\chi ^{2}$-Verteilung bei beliebig vielen Freiheitsgraden mit der Gauß-Verteilung vergleichen zu können, benötigen wir noch die Momente der Verteilung. Für das $r$-te Moment $E(X^{r})$ der $\chi ^{2}$-Verteilung gilt allgemein
\begin{displaymath}
E(X^{r})= \int\limits_{0}^{\infty} \frac{1}{2^{\frac{f}{2}}...
...left(\frac{f}{2}+r\right)}{\Gamma\left(\frac{f}{2}\right)}.
\end{displaymath} (8)

Für den Erwartungswert $E(X)$ und die Varianz $V(X)$ gilt
\begin{displaymath}
\begin{array}{rcl}
E(X) & = & \int\limits_{0}^{\infty} x\,f(x)\,dx \\
V(X) & = & E(X^{2}) - E(X)^{2}.
\end{array}
\end{displaymath} (9)

Dann folgt mit Gleichung(8) für den Erwartungswert
\begin{displaymath}
E(X)=2 \frac{\Gamma\left(\frac{f}{2}+1\right)}{\Gamma\left(...
...}\right)}{\Gamma\left(\frac{f}{2}\right)} \,\frac{f}{2} =f.
\end{displaymath} (10)

Für das zweite Moment der $\chi ^{2}$-Verteilung folgt
\begin{displaymath}
E(X^{2})=4\, \frac{\Gamma\left(\frac{f}{2}+2\right)}{\Gamma...
...
=4 \left(\frac{f}{2}+1\right)\,\frac{f}{2} = f^{2} +2\,f.
\end{displaymath} (11)

Damit folgt für die Varianz der $\chi ^{2}$-Verteilung
\begin{displaymath}
V(X)= 2\,f.
\end{displaymath} (12)

Durch die Kenntnis von Erwartungswert und Varianz der $\chi ^{2}$-Verteilung für beliebige Freiheitsgrade sind wir in der Lage, diese mit der Gauß-Verteilung bei gleichem Mittelwert und gleicher Varianz optisch zu vergleichen. Dazu sind in Abbildung 1 sowohl die $\chi ^{2}$-Verteilung, als auch die Gauß-Verteilung mit gleichem Mittelwert und gleicher Varianz für 10, 20 und 30 Freiheitsgrade eingezeichnet.

Abbildung: Vergleich von $\chi ^{2}$-Verteilung (durchgezogene Linie) und Gauß-Verteilung (unterbrochene Linie) mit gleichem Mittelwert und gleicher Varianz bei 10, 20 und 30 Freiheitsgraden.
\begin{figure}
\centerline{\hbox{
\psfig{figure=chi1.eps,width=120mm,height=120mm}}}
\end{figure}

Zwar sieht man in Abb. 1, daß die $\chi ^{2}$-Verteilung mit zunehmenden Freiheitsgraden der Gauß-Verteilung immer ähnlicher wird3, aber dennoch sieht man auch bei 30 Freiheitsgraden noch deutliche Unterschiede. In einem nächsten Schritt geht es nun darum, ein Maß für den Unterschied zu finden. Dazu wird verglichen, ob Schiefe $Sf$ und Exzeß $Ex$ der $\chi ^{2}$-Verteilung mit $f$ Freiheitsgraden, sich signifikant von der Schiefe und dem Exzess der zugeordneten Gauß-Verteilung unterscheiden. Der Erwartungswert der Schiefe und des Exzesses ist bei der Gauß-Verteilung gleich null. Analysiert man eine Gauß-verteilte Zeitreihe, so erhält man allerdings von null abweichende Werte. Die Standardabweichung der Streuung der Schätzwerte von Schiefe und Exzeß einer Gauß-verteilten Variable hängt dabei von der Zeitreihenlänge $N$ ab und geht für große $N$ gegen null. Es gilt
\begin{displaymath}
\sigma(Sf)=\sqrt{\frac{6}{N}}
\end{displaymath} (13)

und
\begin{displaymath}
\sigma(Ex)=\sqrt{\frac{24}{N}}.
\end{displaymath} (14)

Dabei konvergieren die Schätzer für Schiefe und Exzeß selbst gegen Gauß-verteilte Variable. Wir sind damit in der Lage für beliebige Zeitreihenlängen Konfidenzintervalle für $Sf$ und $Ex$ anzugeben. Werden diese von einem Schätzwert überschritten, so hat man die Wahrscheinlichkeit dafür, daß die Zeitreihe nicht aus einer Gauß-verteilten Variable stammt. Mit Hilfe der Gleichung (10) und den Definitionen von Schiefe und Exzeß
\begin{displaymath}
\begin{array}{rcl}
Sf & = & \frac{E\left[(X-E(X))^{3}\righ...
...frac{E\left[(X-E(X))^{4}\right]}{\sigma^{4}}-3
\end{array}
\end{displaymath} (15)

folgt
\begin{displaymath}
\begin{array}{rcl}
Sf(\chi^{2}) & = & \sqrt{\frac{8}{f}}\\ [2ex]
Ex(\chi^{2}) & = & \frac{12}{f}.
\end{array}
\end{displaymath} (16)

Wir sind nun in der Lage, zu testen, ob sich Schiefe und Exzeß einer $\chi ^{2}$-verteilten Zufallsvariable mit $f$ Freiheitsgraden signifikant von Schiefe und Exzeß einer Gauß-verteilten Zeitreihe der Länge $N$ unterscheidet. Damit kann die Frage geklärt werden, ob sich eine Zeitreihe von berechneten Varianzen signifikant von einer gleichlangen Gauß-verteilten Zeitreihe unterscheidet. Die Freiheitsgrade $f$ sind dabei die Anzahl der Werte die in die Berechnung der Varianz eingehen. Abbildung 2 zeigt den Verlauf von Schiefe und Exzeß einer $\chi ^{2}$-verteilten Zufallsvariable in Abhängigkeit von den Freiheitsgraden und den Verlauf von Konfidenzintervallen von Schiefe und Exzeß einer Gauß-verteilten Zeitreihe in Abhängigkeit von der Länge der Zeitreihe.

Abbildung: a) Schiefe (durchgezogene Linie) und Exzeß (unterbrochene Linie) einer $\chi ^{2}$verteilten Zufallsvariable in Abhängigkeit von der Anzahl der Freiheitsgrade. b) Verlauf des 50% (durchgezogene Linie) , 90% (unterbrochene Linie) und 95% Konfidenzintervalls (gepunktete Linie) der Schiefe einer Gauß-verteilten Zeitreihe in Abhängigkeit von deren Länge. c) Verlauf des 50% (durchgezogene Linie), 90% (unterbrochene Linie) und 95% Konfidenzintervalls (gepunktete Linie) des Exzesses einer Gauß-verteilten Zeitreihe in Abhängigkeit von deren Länge.
\begin{figure}
\centerline{\hbox{
\psfig{figure=chi2.eps,width=120mm,height=120mm}}}
\end{figure}

Mit Hilfe der Gleichungen (13) und (14) und der Annahme, daß Schiefe und Exzeß Gaußverteilte Schätzer sind, folgt das 90%-Konfidenzintervall durch Multiplikation der Standardabweichung dieser Schätzer mit $K_{90}=1.645$ und das 95%-Konfidenzintervall durch den Faktor $K_{95}=1.96$. Man kann nun fragen, wie kurz eine Reihe von $\chi ^{2}$-verteilten Werten mit $f$ Freiheitsgraden sein muß, um noch nicht von einer Gauß-verteilten Variable unterscheidbar zu sein. Dazu kann die Schiefe der $\chi ^{2}$-Verteilung mit dem Konfidenzintervall der Schiefe der Gauß-Verteilung gleichgesetzt werden. Man erhält für das 90%-Niveau
\begin{displaymath}
\sqrt{\frac{8}{f}}=K_{90}\cdot\sqrt{\frac{6}{N}}
\end{displaymath} (17)

und demnach
\begin{displaymath}
N=\frac{3}{4}\, K_{90}^{2}\,f.
\end{displaymath} (18)

Analog erhält man für den Exzeß
\begin{displaymath}
N=K_{90}^{2}\,\frac{f^{2}}{6}.
\end{displaymath} (19)

Für $f=30$ Freiheitsgrade unterscheidet sich die Schiefe einer $\chi ^{2}$-verteilten Variable schon ab 61 Werten signifikant von einer gleichlangen Gauß-Verteilung. Der Exzeß ist erst ab 406 Werten signifikant zu unterscheiden. Daraus muß geschlossen werden, daß die Analyse von Zeitreihen gleitender Varianzen nicht mit der Methode der kleinsten Quadrate durchgeführt werden kann, denn man muß einerseits über einen möglichst großen Zeitraum mitteln (z.B. $f=30$), darf aber andererseits auch damit keine langen Zeitreihen gleitender Varianzen erzeugen, da diese signifikant schief wären. Daher kommt die $\chi ^{2}$-Verteilung für die Bearbeitung der Fragestellung nicht in Frage. Die Schätzung der Varianz führt durch das Quadrieren zu vielen sehr kleinen Werten und wenigen sehr großen. Je länger der Mittelungszeitraum ist, desto eher wird dieser Effekt weggemittelt, wodurch aber zeitlich lokale Information ebenso verlorengeht. Wir benötigen demnach eine Variable, die mit zunehmenden Freiheitsgraden rascher gegen die Gauß-Verteilung konvergiert, als die $\chi ^{2}$-Verteilung. Da, wie wir gesehen haben, die Schiefe der $\chi ^{2}$-Verteilung der limitierende Faktor ist, die wiederum ein Resultat des Quadrierens ist, bietet es sich an die Wurzel aus der $\chi ^{2}$-verteilten Variable zu untersuchen. Die dadurch entstehende Variable ist die Standardabweichung, die $\chi $-verteilt ist. Die Untersuchung der Konvergenz der $\chi $-Verteilung gegen die Gauß-Verteilung ist Inhalt des folgenden Abschnitts.
next up previous
Nächste Seite: -Verteilung Aufwärts: Zur zeitlichen Analyse von Vorherige Seite: Transformation der Verteilungen
ich 2000-01-25