next up previous
Nächste Seite: Korrelationen Aufwärts: Hauptkomponentenanalyse Vorherige Seite: Nomenklatur

Streumatrix

Die Matrix $Z$ stellt $n$ Punkte im $p$-dimensionalen Raum dar. Jeder Punkt ist dabei ein Zeitpunkt (man könnte das durchaus auch umgekehrt definieren). In dem $p$-dimensionalen Raum kann durch die Basisvektoren $\vec{e}_{1}; \vec{e}_{2}; \cdots ;\vec{e}_{p}$ eine beliebige Basis definiert werden.
\begin{displaymath}
\vec{z_{x}}^{T}(t)\cdot \vec{e}_{j} = \vec{e}_{j}^{T}\cdot \vec{z_{x}}(t)
=\sum\limits_{x=1}^{p} z(t,x)  e_{j}(x)
\end{displaymath} (13)

ist dann die Projektion der durch $Z$ beschriebenen Punktwolke in die Richtung von $\vec{e}_{j}$. Als Streuung (Scatter) in Richtung von $\vec{e}_{j}$ bezeichnet man dann
\begin{displaymath}
\Psi(\vec{e}_{j}) \equiv \sum\limits_{t=1}^{n}
\left[\vec...
...\right]
\left[\vec{e}_{j}^{T}\cdot \vec{z_{x}}(t)\right].
\end{displaymath} (14)

Das ist $n-1$ mal die Varianz der Projektion der Punktwolke auf die Achse mit der Richtung $\vec{e}_{j}$. Gleichung (14) kann leicht umgeformt werden zu
\begin{displaymath}
\Psi(\vec{e}_{j}) = \vec{e}_{j}^{T}
\left[ \sum\limits_{t...
...n}
\vec{z_{x}}(t)  \vec{z_{x}}^{T}(t)\right]
\vec{e}_{j}
.\end{displaymath} (15)

Der Term in den eckigen Klammern in Glg. (15) ist die Streu- bzw. Scattermatrix. Sie ist $n-1$ mal die Kovarianzmatrix. Für die Elemente $s_{x,x'}$ der Scattermatrix gilt:
\begin{displaymath}
s(x,x') = \sum\limits_{t=1}^{n} z(t,x)  z(t,x').
\end{displaymath} (16)

In Matrixschreibweise bedeutet dies:
\begin{displaymath}
S= Z^{T} Z.
\end{displaymath} (17)

Die Eigenwerte der Streumatrix sind dann gegeben durch
\begin{displaymath}
S  \vec{e}_{j} =\lambda  \vec{e}_{j}    ,\mbox{ f\uml {u}r alle } j.
\end{displaymath} (18)

Das zu lösende Gleichungssystem ist demnach
\begin{displaymath}
\sum\limits_{x'=1}^{p} s(x,x')  \vec{e}_{j}(x') = \lambda_{j}  
\vec{e}_{j}(x)    ,\mbox{ f\uml {u}r alle } x.
\end{displaymath} (19)

Mit den Matrixdarstellungen $E \equiv [\vec{e}_{1}, 
\vec{e}_{2}, \cdots  ,\vec{e}_{p}]$ und $L=diag[\lambda_{1},\lambda{2},\cdots,\lambda_{p}]$ und $\lambda_{1}\ge\lambda_{2}\ge\cdots\ge\lambda_{p}\ge 0$ folgt die Matrixnotation:
\begin{displaymath}
S E = E L.
\end{displaymath} (20)

Nun kann man die Punktwolke $Z$ im Eigenvektorsystem $E$ ausdrücken. Dann ist
\begin{displaymath}
Z=\sum\limits_{j=1}^{p} \vec{a}_{j}  \vec{e}_{j}^{T}.
\end{displaymath} (21)

Dabei sind die Amplitudenvektoren $\vec{a}_{j}$ die PC-Zeitreihen $\vec{a}_{j}= [a_{j}(1),a_{j}(2),\cdots,a_{j}(n)]^{T}$. Damit folgt
\begin{displaymath}
z(t,x) = \sum\limits_{j=1}^{p} a_{j}(t)  e_{j}(x)
\end{displaymath} (22)

Die Einführung neuer normalisierter Amplituden $\alpha_{j}(t)
\equiv a_{j}(t) / \lambda_{j}^{1/2}$ führt zu der Singular-Value-Decomposition:
\begin{displaymath}
z(t,x) = \sum\limits_{j=1}^{p} \lambda_{j}^{1/2}  \alpha_{j}(t)  e_{j}(x)
\end{displaymath} (23)

mit der Matrixschreibweise
\begin{displaymath}
Z  =  A'  L^{1/2}  E^{T}.
\end{displaymath} (24)


next up previous
Nächste Seite: Korrelationen Aufwärts: Hauptkomponentenanalyse Vorherige Seite: Nomenklatur
ich 2000-01-24