Nächste Seite: Spezielle statistische Methoden
Aufwärts: Analyse und Interpretation dendrochronologischer
Vorherige Seite: Literatur
  Inhalt
Was bedeutet stochastische Unabhängigkeit?
Man kann sich leicht vorstellen, daß man von Menschen sowohl ihre
Körpergröße , als auch ihr Gewicht mißt. Weiterhin kann man
sich leicht vorstellen, daß diese beiden Größen nicht unabhängig
voneinander sind. Die Abhängigkeit gilt aber nur im Mittel, denn man kann
zwar erwarten, daß eine große Person schwerer ist als
ein kleine, aber das Umgekehrte ist im Einzelfall immer möglich.
In diesem Beispiel, wo man den Zusammenhang sofort einsieht, braucht man
natürlich nicht mehr zu testen, ob die Daten einen Zusammenhang suggerieren,
sondern kann gleich nach dessen Stärke und nach optimalen Approximationen
dieses Zusammenhangs fragen. Anders sieht die Situation aus wenn man als
Wissenschaftler Neuland betritt, d.h. nach Zusammenhängen sucht, und
nicht von vornherein weiß, ob zumindest stochastisch ein Zusammenhang
besteht. Zunächst müssen wir klar sehen, was mit stochastischem
Zusammenhang gemeint ist. Die wichtigste Einschränkung, die hier gemacht
wird, ist, daß die Realisationen von und nur paarweise untersucht
werden, d.h. daß jeder Realisation von genau ein zugeordnet wird und
umgekehrt. Bei dem oben gegebenen Beispiel ist das klar: einer Messung ist
eine Realisierung von einer Körpergröße und einem Gewicht zugeordnet.
Ganz anders ist es aber z.B. bei einer Zeitreihe, die die Realisation des
folgenden Prozesses ist:
Bei diesem Prozess gibt es einen deterministischen Zusammenhang zwischen
, und und einen zwischen und
und . Damit hängen sowohl als auch von der
gemeinsamen Vergangenheit ab. Sie hängen damit also von den vorhergehenden
Werten der Zeitreihen selbst ab. Demnach ist die Information über den
Zusammenhang vollständig in den Zeitreihen vorhanden. Bei der
Analyse von Paaren der Art und muß er aber nicht sichtbar
werden. Da der Prozess rekursiv ist, liegt ein Teil der Information über
die Realisation von zur Zeit möglicherweise (das hängt von der
konkreten Gestalt von und ab) in der Realisation von und/oder
zu viel früheren Zeiten. Die Dynamik könnte konkret so aussehen, daß
man in einer endlichen Realisation (Zeitreihe) keine signifikante
stochastische Abhängigkeit zu irgendeinem der vorherigen Werte der beiden
Variablen finden kann. Man muß dann die Variablen stochastisch unabhängig
nennen. Das zeigt, daß stochastische Unabhängigkeit nicht ausschließt,
daß die beobachteten Größen sogar völlig deterministisch voneinander
abhängen.
Nach dieser Warnung nun zur
konkreten Definition von stochastischer Unabhängigkeit:
Wir betrachten und als Zufallsvariable, da es für uns zunächst
zufällig erscheint ob große oder kleine Werte realisiert werden. Die Frage
ist nun, ob die Wahrscheinlichkeit dafür, daß für die Variable der
Zahlenwert realisiert wird, davon abhängt, daß für das zugeordnete
der Wert realisiert wird. Diese bedingte Wahrscheinlichkeit
[3] nennen wir oder kürzer . Falls die
Realisation von nicht von der Realisation von abhängt, muß gelten:
|
(5.1) |
und umgekehrt auch
|
(5.2) |
Dabei stellen die Terme ganz rechts wieder nur verkürzte Schreibweisen dar.
Die nächste wichtige Größe ist die Wahrscheinlichkeit dafür, daß das
Verbundereignis und eintritt. Diese Verbundwahrscheinlichkeit
nennen wir , oder kurz . Man kann sich nun durch kurzes
Überlegen klar machen, daß bei stochastischer Unabhängigkeit, d.h. wenn
die Gleichungen (A.1) und (A.2) gelten, die
Verbundwahrscheinlichkeit gleich dem Produkt der
Einzelwahrscheinlichkeiten und sein muß.
Kennt man also die Verbundwahrscheinlichkeit und die
Einzelwahrscheinlichkeiten, so kann man die stochastische Unabhängigkeit
sofort erkennen. Nun ist es aber so, daß man diese im allgemeinen nicht
kennt, sondern schätzen muß. Selbst wenn man sie wüßte, gäbe es noch
das Problem, daß eine endliche Realisierung immer auch durch Zufall mal ein
sehr seltenes Ereignis sein kann. Der im nächsten Abschnitt vorgestellte
Test, berechnet nun gerade, wie unwahrscheinlich das geschätzte
unter der Annahme
ist.
und können dabei sehr verschiedene Arten von Zufallsvariablen sein.
Zum Beispiel können die Variablen nominal skaliert sein, wie es bei Farbe des
Apfels und Geschmack des Apfels der Fall wäre. Sie müssen nur in
disjunkte Klassen eingeteilt sein, d.h. ein Apfel kann nicht gleichzeitig
grün und rot sein. Die Variablen können auch ordinal skaliert sein, wie
es zum Beispiel die Wettereinteilung in sehr schlecht über
mittel bis sehr gut ist. In diesem Fall ist eine
Klasseneinteilung vorgegeben. Hat man metrische Variablen, z.B.
Körpergröße in oder Temperaturen in , so muß man diese
selbst in Ereignisklassen einteilen und daraus die Wahrscheinlichkeit für
das Eintreten eines Ereignisses einer bestimmten Klasse schätzen.
Zum Schluß dieses Abschnittes soll nicht unerwähnt bleiben, daß man das
Konzept der stochastischen Abhängigkeit bei Zeitreihen auch selbstbezüglich
und über Kreuz anwenden kann. Man erhält dann stochastische
Auto-Abhängigkeit bzw. stochastische Kreuzabhängigkeit.
Nächste Seite: Spezielle statistische Methoden
Aufwärts: Analyse und Interpretation dendrochronologischer
Vorherige Seite: Literatur
  Inhalt
ich
2000-01-24