Nächste Seite: Wie erkennt man stochastische
Aufwärts: Stochastische Zusammenhänge zweier Zufallsvariablen
Vorherige Seite: Einleitung
  Inhalt
Man kann sich leicht vorstellen, daß man von
Menschen sowohl ihre Körpergröße
, als auch ihr Gewicht
mißt. Weiterhin kann man sich leicht vorstellen, daß
diese beiden Größen nicht unabhängig voneinander sind. Die Abhängigkeit gilt aber
nur im Mittel, denn man kann zwar erwarten, daß eine große Person schwerer ist als
ein kleine, aber das Umgekehrte ist im Einzelfall immer möglich. In diesem Beispiel,
wo man den Zusammenhang sofort einsieht, braucht man natürlich nicht mehr zu testen,
ob die Daten einen Zusammenhang suggerieren, sondern kann gleich nach dessen
Stärke und nach optimalen Approximationen dieses Zusammenhangs fragen. Anders
sieht die Situation aus wenn man als Wissenschaftler Neuland betritt, d.h. nach
Zusammenhängen sucht, wo man nicht von vornherein weiß, daß zumindest
stochastisch ein Zusammenhang besteht. Zunächst müssen wir klar sehen, was mit
stochastischem Zusammenhang gemeint ist. Die wichtigste Einschränkung, die hier
gemacht wird, ist, daß die Realisationen von
und
nur paarweise untersucht
werden, d.h. daß jeder Realisation von
genau ein
zugeordnet wird und
umgekehrt. Bei dem oben gegebenen Beispiel ist das klar: einer Messung ist eine
Realisierung von einer Körpergröße und einem Gewicht zugeordnet. Ganz anders ist
es aber z.B. bei einer Zeitreihe, die die Realisation des folgenden Prozesses ist:
Bei diesem Prozess gibt es einen deterministischen Zusammenhang zwischen
,
und
und einen zwischen
und
und
. Damit
hängen sowohl
als auch
von der gemeinsamen Vergangenheit ab. Sie
hängen damit also von den vorhergehenden Werten der Zeitreihen selbst ab. Demnach
ist die Information
über den Zusammenhang vollständig
in den Zeitreihen vorhanden.
Bei der Analyse von Paaren der Art
und
muß er aber nicht
sichtbar werden.
Da der Prozess rekursiv ist, liegt ein Teil der Information
über die Realisation von
zur Zeit
möglicherweise (das hängt von der konkreten Gestalt von
und
ab)
in der Realisation von
und/oder
zu viel früheren Zeiten. Die Dynamik könnte
konkret so aussehen, daß man in einer endlichen Realisatin (Zeitreihe)
keine signifikante
stochastische Abhängigkeit zu irgendeinem der
vorherigen Werte der beiden Variablen finden kann. Man muß dann die Variablen
stochastisch unabhängig nennen. Das zeigt, daß stochastische Unabhängigkeit nicht
ausschließt, daß die beobachteten Größen sogar völlig deterministisch voneinander
abhängen.
Nach dieser Warnung nun zur konkreten Definition von stochastischer Unabhängigkeit:
Wir betrachten
und
als Zufallsvariable, da es für uns zunächst zufällig
erscheint ob große oder kleine Werte realisiert werden. Die Frage ist nun, ob die
Wahrscheinlichkeit dafür, daß für die Variable
der Zahlenwert
realisiert wird, davon
abhängt, daß für das zugeordnete
der Wert
realisiert wird. Diese bedingte
Wahrscheinlichkeit [2] nennen wir
oder kürzer
. Falls die Realisation
von
nicht von der Realisation von
abhängt, muß gelten:
 |
(1) |
und umgekehrt auch
 |
(2) |
Dabei stellen die Terme ganz rechts wieder nur verkürzte Schreibweisen dar.
Die nächste wichtige Größe ist die Wahrscheinlichkeit dafür, daß das
Verbundereignis
und
eintritt. Diese Verbundwahrscheinlichkeit nennen wir
, oder kurz
. Man kann sich nun durch kurzes
Überlegen klar
machen, daß bei stochastischer Unabhängigkeit, d.h. wenn die Gleichungen
(1) und (2) gelten, die Verbundwahrscheinlichkeit
gleich dem
Produkt der Einzelwahrscheinlichkeiten
und
sein muß.
Kennt man also die Verbundwahrscheinlichkeit und die Einzelwahrscheinlichkeiten, so
kann man die stochastische Unabhängigkeit sofort erkennen. Nun ist es aber so, daß
man diese im allgemeinen nicht kennt, sondern schätzen muß. Selbst wenn man sie
wüßte, gäbe es noch das Problem, daß eine endliche Realisierung immer auch durch
Zufall mal ein sehr seltenes Ereignis sein kann. Der im nächsten Abschnitt vorgestellte
Test, berechnet nun gerade, wie unwahrscheinlich das geschätzte
unter der
Annahme
ist.
und
können dabei sehr verschiedene Arten von Zufallsvariablen sein. Z.B.
können die Variablen nominal skaliert sein, wie es bei
Farbe des Apfels und
Geschmack des Apfels der Fall wäre. Sie müssen nur in disjunkte Klassen
eingeteilt sein, d.h. ein Apfel kann nicht gleichzeitig grün und rot sein. Die Variablen
können auch ordinal skaliert sein, wie es zum Beispiel die Wettereinteilung in sehr
schlecht über mittel bis sehr gut ist.
In diesem Fall ist eine
Klasseneinteilung vorgegeben. Hat man metrische Variablen, z.B. Körpergröße in
oder Temperaturen in
, so muß man diese selbst in Ereignisklassen
einteilen und daraus die Wahrscheinlichkeit für das Eintreten eines Ereignisses einer
bestimmten Klasse schätzen.
Zum Schluß dieses Abschnittes soll nicht unerwähnt bleiben, daß man das Konzept
der stochastischen Abhängigkeit bei Zeitreihen auch selbstbezüglich und
über Kreuz
anwenden kann. Man erhält dann stochastische Auto-Abhängigkeit bzw.
stochastische Kreuzabhängigkeit.
Nächste Seite: Wie erkennt man stochastische
Aufwärts: Stochastische Zusammenhänge zweier Zufallsvariablen
Vorherige Seite: Einleitung
  Inhalt
ich
2000-01-25