next up previous
Nächste Seite: Ein Beispiel Aufwärts: Hauptkomponentenanalyse Vorherige Seite: Einleitung

Transformationsstrategie

Gegeben sei eine Matrix $Z(t,x)$ mit $t=1,\cdots ,n$ und $x=1,\cdots , p$, die aus den $p$ Zeitreihen der Länge $n$ besteht:
\begin{displaymath}
Z=\left(\begin{array}{llcl}
z_{1,1} & z_{1,2} & \cdots & z...
...
z_{n,1} & z_{n,2} & \cdots & z_{n,p}\\
\end{array}\right)
\end{displaymath} (1)

Zunächst wird von jeder Zeitreihe der Mittelwert dieser Reihe abgezogen. Damit sind die Spaltensummen und v.a. die Gesamtsumme gleich null und man hat den Koordinatenursprung in den Schwerpunkt der Punktwolke gesetzt. Im folgenden werden also nur noch die Abweichungen vom Mittel untersucht. Die wesentliche Information darüber, wie das System zu drehen ist, steckt in der Kovarianzmatrix. Die Drehung soll so stattfinden, daß zwischen den gedrehten Koordinaten keine Kovarianz mehr besteht. Das bedeutet, das die entstehenden Reihen linear unabhängig werden. Dies ist gleichbedeutend mit der Forderung der effektivsten Darstellung. Jede neue Koordinate enthält nur linear unabhängige neue Information. Die Forderung, daß zwischen den neuen Koordinaten keine Korrelation mehr bestehen soll, läßt sich dadurch erreichen, daß die Kovarianzmatrix diagonalisiert wird. Die zur diagonalisierten Kovarianzmatrix gehörenden Eigenvektoren sind eine Linearkombination der alten Basisvektoren, und drücken damit den Zusammenhang zwischen den alten und den neuen Zeitreihen aus. Die Eigenwerte der Kovarianzmatrix (die Diagonalen der diagonalisierten Kovarianzmatrix) geben die Varianz in dieser (neuen) Koordinatenrichtung an. Konkret müssen zunächst also die Eigenwerte $\lambda$ der Kovarianzmatrix $\Sigma$ gefunden werden. Dies geschieht durch Lösen der folgenden Gleichung:
\begin{displaymath}
\det(\Sigma - \lambda \mbox{I})=0.
\end{displaymath} (2)

Dabei stellt I die Einheitsmatrix dar. Da $\Sigma$ eine $p\times p$ Matrix ist, existieren $p$ Eigenwerte. Da $\Sigma$ außerdem noch reell und symmetrisch ist, sind die Eigenwerte alle reell und positiv semidefinit. Zusätzlich folgt daraus schon, daß die Matrix der Eigenvektoren orthogonal ist. Hat man die Eigenwerte nach Glg. (2) bestimmt, so kann man mit
\begin{displaymath}
(\Sigma - \lambda_{i} \mbox{I}) \cdot \vec{e_{i}}=0
\end{displaymath} (3)

den $i$-ten Eigenvektor $\vec{e_{i}}$ bestimmen. Die $x$-te Komponente des $i$-ten Eigenvektors ist dann das Gewicht, mit dem die $x$-te Originalzeitreihe in die $i$-te Zeitreihe des gedrehten Systems eingeht.
next up previous
Nächste Seite: Ein Beispiel Aufwärts: Hauptkomponentenanalyse Vorherige Seite: Einleitung
ich 2000-01-24