Statistische Kennzahlen
Erster Teil der dritten Vorlesung: Was für Kennzahlen gibt es?
Mittelwert / Durchschnitt
Der Mittelwert ist der Durchschnitt von allen vorliegenden Daten. Berechnet wird er, indem man alle vorliegenden Kennzahlen addiert und das Ergebnis anschließend durch die Anzahl der Kennzahlen teilt.
Dargestellt wird er mit einem Strich über der jeweiligen Variable:
Beispiel:
| Periode i | 1 | 2 | 3 | 4 | 5 | Summe |
|---|---|---|---|---|---|---|
| Rendite x_i | 1,0% | -2,5% | 3,5% | -2,0% | 1,5% | 1,5% |
Nehmen wir als Daten doch einfach mal die Renditen einer Aktie pro Woche (wie kreativ).
Alle Werte aus der Reihe x zusammengerechnet ergeben 1,5%. Bei 5 Werten heißt es jetzt das durch 5 zu teilen:
Zusammenfassung:
Mittelwert = (Summe aller Werte) / Anzahl Werte
Darstellung im "Koordinatensystem"
Hat man 2 verschiedene Datensätze (Tabellenzeilen) vorliegen kann man diese grafisch darstellen:
| Periode i | 1 | 2 | 3 | 4 | 5 | Summe |
|---|---|---|---|---|---|---|
| Rendite x_i | 1,0% | -2,5% | 3,5% | -2,0% | 1,5% | 1,5% |
| Rendite y_i | -1,0% | -3,0% | 2,5% | 0,0% | 3,5% | 2,0% |
Mittelwert x: ; Mittelwert y:

Nimmt man die Renditen/Kennzahlen jeweils als x- bzw. y-Koordinate kann man sie in ein Koordinatensystem einzeichnen.
Der Mittelwert wird bei diesen grafischen Darstellungen nachher noch wichtig.
Das Quadrat in dem Bild (mit den Rechnungen) dient zur grafischen Darstellung des Abstandes zwischen den Punkten und dem Mittelwert
Empirische Varianz
Die (empirische) Varianz beschreibt den durchschnittlichen Abstand der Punkte/Werte in dem Koordinatensystem/Datensatz vom Mittelwert. Das Darstellungssymbol ist .
Wichtig: Dadurch, dass das Ergebnis eine Quadratzahl ist werden auch die Einheiten der Ergebnisse (m, kg, %, €, etc.) als Quadrat angegeben, auch wenn es manchmal etwas affig aussieht:
Berechnet wird sie wie folgt:
(geht natürlich mit jeder Variable)
Soll heißen:
- Alle vorliegenden Werte jeweils einzeln quadrieren
- Die Ergebnisse zusammenzählen
- Die Summe durch die Anzahl der Werte teilen
minus
den Mittelwert zum Quadrat.
Beispiel:
| Periode i | 1 | 2 | 3 | 4 | 5 | Summe |
|---|---|---|---|---|---|---|
| Rendite x_i | 1,0% | -2,5% | 3,5% | -2,0% | 1,5% | 1,5% |
| Rendite y_i | -1,0% | -3,0% | 2,5% | 0,0% | 3,5% | 2,0% |
| x^2_i | 1,0%^2 | 6,25%^2 | 12,25%^2 | 4,0%^2 | 2,25%^2 | 25,75%^2 |
| y^2_i | 1,0%^2 | 9,0%^2 | 6,25%^2 | 0,0%^2 | 12,25%^2 | 28,5%^2 |
Varianzen:
Dieses Ding taugt aber eigentlich nur für mehr Mathe oder für den nächsten Punkt:
Empirische Standardabweichung
Ist die Varianz mit "normaler" Einheit, damit können wir das, was die Varianz aussagen sollte - den durchschnittlichen Abstand der tatsächlichen Werte vom Mittelwert - auch öffentlich darstellen, ohne zu fragwürdigen Konstruktionen zu greifen (). Dargestellt durch .
Berechnung:
Einfach die Wurzel aus der Varianz ziehen:)
Beispiel:
Die Einheit am Ende nicht vergessen! Wir ziehen die Wurzel ja eigentlich nur deswegen:)
Mittlere Werte / Veränderungen je Periode
(Achtung: Das hier ist nicht noch ein Mittelwert.)
Was ist denn, wenn uns aus irgendeinem Grund die prozentuale Veränderung zwischen den jeweiligen Perioden interessiert?
Die Formel hierzu lautet:
(Neuer Wert - Alter Wert) / Alter Wert
Am Besten wir machen wieder ein Beispiel.
Beispiel:
Nehmen wir uns mal folgende Werte:
| Woche i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Aktie X | 38 | 40 | 42 | 39 | 41 | 45 | 41 | 46 | 40 | 49 | 45 | 55 |
| Aktie Y | 33 | 32 | 34 | 38 | 34 | 37 | 39 | 38 | 40 | 38 | 39 | 41 |
Warum mache ich mir eigentlich die ganze Mühe die Skript-Tabellen abzutippen?
Die ganzen Zahlen sind jetzt einfach mal die Kurse von 2 verschiedenen Aktien im Laufe von ein paar Wochen.
Am Anfang ("Woche 0") steht Aktie X bei 38 und Aktie Y bei 33.
In der ersten Woche stehen sie jeweils bei 40 und 32. Wie stark sind die Aktien gestiegen bzw. gefallen?
Aktie X:
Aktie Y:
Das Ganze dann immer so weiter: Den "alten" Wert von dem "neuen" abziehen und das Ergebnis nochmal durch den alten Wert teilen.
Sieht komplett dann so aus:
| Woche i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Aktie X | 38 | 40 | 42 | 39 | 41 | 45 | 41 | 46 | 40 | 49 | 45 | 55 |
| Rendite x_i | N/A | 0,053 | 0,05 | -0,071 | 0,051 | 0,098 | -0,089 | 0,122 | -0,130 | 0,225 | -0,082 | 0,222 |
| Aktie Y | 33 | 32 | 34 | 38 | 34 | 37 | 39 | 38 | 40 | 38 | 39 | 41 |
| Rendite y_i | N/A | -0,03 | 0,063 | 0,118 | -0,105 | 0,088 | 0,054 | -0,026 | 0,053 | -0,050 | 0,026 | 0,051 |
(Kann man natürlich auch in Prozent schreiben).
Und jetzt haben wir basierend auf gegeben Daten deutlich mehr Daten produziert. Willkommen in der Welt der Statistik:)
Wozu taugen diese Veränderungen jetzt?:
Mittlere Portfoliorendite
Nehmen wir mal an, dass wir jetzt die Renditen/Veränderungen/was-auch-immer aus miteinander kombinieren möchten um eine gemeinsame Veränderungskennzahl zu bilden. Nur: Wie kann man die einzelnen Datensätze unterschiedlich stark gewichten (Bspw.: 60 Prozent auf Aktie X, 40 Prozent auf Aktie Y)?
In diesem Zusammenhang bekommen wir eine neue Variable:
w = Gewichtung von x / der ersten Datenreihe
Die Formel für die Berechnung lautet:
bzw. für den gesamten Zeitraum:
Beispiel:
Nehmen wir doch nochmal die Rendite-Kennzahlen von eben:
| Periode i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | Summe |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Rendite x_i | 0,053 | 0,05 | -0,071 | 0,051 | 0,098 | -0,089 | 0,122 | -0,130 | 0,225 | -0,082 | 0,222 | 0,449
= 44,9% |
| Rendite y_i | -0,03 | 0,063 | 0,118 | -0,105 | 0,088 | 0,054 | -0,026 | 0,053 | -0,050 | 0,026 | 0,051 | 0,242
=24,2% |
Über den Gesamtzeitraum haben wir also bei Aktie X eine Rendite von 44,9% und bei Aktie Y 24,2%.
Berechnen wir doch erst einmal den Mittelwert:
Aktie X:
Aktie Y:
Angenommen, die Gewichtung liegt zu 60% bei Aktie X und zu 40% bei Aktie Y:
Empirische Kovarianz
Die Kovarianz ist eine Kennzahl der Korrelation. Soll heißen, wieder auf unsere Datensätze bezogen: Wie verhalten die sich zueinander? Steigen/fallen sie gemeinsam, umgekehrt proportional zueinander oder verhalten sie sich völlig unabhängig voneinander?
Das Darstellungssymbol ist .
Die empirische Kovarianz sagt dabei Folgendes aus:
- Ist sie positiv verlaufen die Daten/Werte/Zahlen/Aktien proportional zueinander
- Ist sie negativ verlaufen die Daten umgekehrt proportional zueinander
- Ist sie nahe oder genau 0 korrelieren die Daten nicht
Berechnet wird die Kovarianz mir der folgenden Formel:
Rechenweg:
- Man multipliziert die x- und y-Werte in den jeweiligen Perioden miteinander (Achtung: Ergebnisse in Einheit zum Quadrat!)
- Die Ergebnisse aufaddieren
- Durch die Anzahl der Perioden teilen
minus
Die Mittelwerte der beiden Datensätze miteinander multipliziert
Beispiel:
Nehmen wir doch noch einmal die Tabelle aus unserem ersten Beispiel:
| Periode i | 1 | 2 | 3 | 4 | 5 | Summe |
|---|---|---|---|---|---|---|
| Rendite x_i | 1,0% | -2,5% | 3,5% | -2,0% | 1,5% | 1,5% |
| Rendite y_i | -1,0% | -3,0% | 2,5% | 0,0% | 3,5% | 2,0% |
| x^2_i | 1,0%^2 | 6,25%^2 | 12,25%^2 | 4,0%^2 | 2,25%^2 | 25,75%^2 |
| y^2_i | 1,0%^2 | 9,0%^2 | 6,25%^2 | 0,0%^2 | 12,25%^2 | 28,5%^2 |
| x_i * y_i | -1,0%^2 | 7,5%^2 | 8,75%^2 | 0,0%^2 | 5,25%^2 | 20,5%^2 |
Mittelwerte:
Varianzen:
Empirische Kovarianz:
Die Kovarianz ist an sich aufgrund des manchmal sehr schwankenden Ergebnisses nur begrenzt interpretierbar. Sie dient aber als Basis für eine Kennzahl die das ist:
Empirischer Korrelationskoeffizient
Der Korrelationskoeffizient macht im Prinzip das Gleiche wie die Kovarianz, nur das das Ergebnis (meistens) zwischen -1 und 1 liegt. Dadurch sind 2 Korrelationskoeffizienten besser miteinander vergleichbar als 2 Kovarianzen.
Bei der Berechnung fließt - anders als bei der Kovarianz - die Standardabweichung mit ein:
Beispiel:
Arbeiten wir nochmal mit den Daten von der Kovarianz:
| Periode i | 1 | 2 | 3 | 4 | 5 | Summe |
|---|---|---|---|---|---|---|
| Rendite x_i | 1,0% | -2,5% | 3,5% | -2,0% | 1,5% | 1,5% |
| Rendite y_i | -1,0% | -3,0% | 2,5% | 0,0% | 3,5% | 2,0% |
| x^2_i | 1,0%^2 | 6,25%^2 | 12,25%^2 | 4,0%^2 | 2,25%^2 | 25,75%^2 |
| y^2_i | 1,0%^2 | 9,0%^2 | 6,25%^2 | 0,0%^2 | 12,25%^2 | 28,5%^2 |
| x_i * y_i | -1,0%^2 | 7,5%^2 | 8,75%^2 | 0,0%^2 | 5,25%^2 | 20,5%^2 |
Varianzen:
Standardabweichungen:
Kovarianz:
Korrelationskoeffizient:
Eventuelle Einheiten kürzen sich raus.
Portfoliorisiko
So wie sich die gemeinsamen Renditen eines Portfolios berechnen lassen lässt sich auch das gemeinsame Risiko berechnen.
Basis hierfür ist die Standardabweichung - also wie weit die einzelnen Datenpunkte durchschnittlich vom Mittelwert entfernt sind. Das Portfoliorisiko macht hierbei das Gleiche wie die Portfoliorendite: Es kombiniert die jeweiligen Werte von 2 Datensätzen (vielleicht unterschiedlich gewichteten) Datensätzen in eine Gesamt-Standardabweichung, die dann zwecks Risikominimierung hoffentlich geringer ist als die einzelnen Standardabweichungen.
Gesetzt natürlich dem Fall, dass wir dem recht dogmatischen Ansatz "Volatilität = Risiko" folgen.
Die Formel zur Berechnung lautet:
Yikes. Kurz zur Erklärung:
Wir haben hier die quadrierte Formel für die Portfoliorendite - was die erste binomische Formel auslöst, deshalb der letzte Teil mit 2*w*... - unter einer Wurzel, um der X^2-Einheit ausweichen zu können.
Beispiel:
Angenommen wir nehmen nochmal die Rendite-Tabelle:
| Woche i | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Aktie X | 38 | 40 | 42 | 39 | 41 | 45 | 41 | 46 | 40 | 49 | 45 | 55 |
| Rendite x_i | N/A | 0,053 | 0,05 | -0,071 | 0,051 | 0,098 | -0,089 | 0,122 | -0,130 | 0,225 | -0,082 | 0,222 |
| Aktie Y | 33 | 32 | 34 | 38 | 34 | 37 | 39 | 38 | 40 | 38 | 39 | 41 |
| Rendite y_i | N/A | -0,03 | 0,063 | 0,118 | -0,105 | 0,088 | 0,054 | -0,026 | 0,053 | -0,050 | 0,026 | 0,051 |
Standardabweichung:
Kovarianz:
Beachten: Während % = 1/100 ist %^2 = 1/10000
Nehmen wir zusätzlich ein gleich gewichtetes Portfolio an (50% Aktie X, 50% Aktie Y): w = 0,5
Portfoliorisiko:
Wie man sehen kann ist das Portfoliorisiko geringer als beide Standardabweichungen -> Durch Diversifikation wurde das Gesamtrisiko reduziert.