Übungsblatt 3

Aufgabe 10

Gegeben sei das kardinalskalierte Merkmal (und die zugehörige Klassierung) aus Aufgabe 6.

  1. Berechnen Sie aus den klassierten Daten die empirische Varianz sowie die empirische Standardabweichung. Wie groß sind die relativen Abweichungen von den aus der Urliste bestimmten Werten \(s^2=269.212\) bzw. \(s=16.408\)?
    Lösung einblenden
    Klassierung aus Aufgabe 6:
    Nr.

    \(j\)
    Klasse
    \(K_j=\)
    \((k_{j-1},k_j]\)
    Klassen-
    breite
    \(b_j\)
    Klassen-
    mitte
    \(m_j\)
    absolute
    Häufigkeit
    \(h_j\)
    relative
    Häufigkeit
    \(r_j=\frac{h_j}{n}\)
    Häufigkeits-
    dichte
    \(f_j=\frac{r_j}{b_j}\)
    Verteilungs-
    funktion
    \(F(k_j)\)
    \(1\) \(( 0, 8]\) \(8\) \(4.0\) \(3\) \(0.0600\) \(0.0075\) \(0.0600\)
    \(2\) \(( 8, 16]\) \(8\) \(12.0\) \(11\) \(0.2200\) \(0.0275\) \(0.2800\)
    \(3\) \(( 16, 24]\) \(8\) \(20.0\) \(11\) \(0.2200\) \(0.0275\) \(0.5000\)
    \(4\) \(( 24, 32]\) \(8\) \(28.0\) \(7\) \(0.1400\) \(0.0175\) \(0.6400\)
    \(5\) \(( 32, 40]\) \(8\) \(36.0\) \(6\) \(0.1200\) \(0.015\) \(0.7600\)
    \(6\) \(( 40, 50]\) \(10\) \(45.0\) \(7\) \(0.1400\) \(0.014\) \(0.9000\)
    \(7\) \(( 50, 65]\) \(15\) \(57.5\) \(3\) \(0.0600\) \(0.004\) \(0.9600\)
    \(8\) \(( 65, 80]\) \(15\) \(72.5\) \(2\) \(0.0400\) \(0.002\overline{6}\) \(1.0000\)
    Aus Aufgabe 6: Mittelwert (näherungsweise): \(\overline{x} = \sum_{j=1}^{8} r_j\cdot m_j = 28.17\)
    \(\Rightarrow\) Empirische Varianz (näherungsweise): \[ s^2=\sum_{j=1}^{8} r_j\cdot (m_j - \overline{x})^2 = 0.06 \cdot (4-28.17)^2 + 0.22 \cdot (12-28.17)^2 + \cdots + 0.04 \cdot (72.5-28.17)^2 = 284.496 \] oder alternativ mit Verschiebungssatz:
    \(\overline{x^2}=\sum_{j=1}^{8} r_{j}\cdot m_{j}^2 = 0.06 \cdot 4^2 + 0.22 \cdot 12^2 + \cdots + 0.04 \cdot 72.5^2 = 1078.045\)
    \(\Rightarrow s^2 = 1078.045 - 28.17^2 = 284.496\)
    Rel. Abweichung vom exakten Wert: \(\displaystyle\frac{284.496-269.212}{269.212} = 0.05677\) bzw. 5.677%
    Empirische Standardabweichung (näherungsweise): \(\sqrt{284.496}=16.867\)
    Rel. Abweichung vom exakten Wert: \(\displaystyle \frac{16.867-16.408}{16.408} = 0.02797\) bzw. 2.797%
  2. Ermitteln Sie unteres Quartil, Median und oberes Quartil des Merkmals sowohl (exakt) aus der Urliste als auch (approximativ mit Hilfe der empirischen Verteilungsfunktion) aus den klassierten Daten. Berechnen Sie auch die zugehörigen Interquartilsabstände.
    Lösung einblenden
    Quantile und Interquartilsabstände (exakt):
    1. unteres Quartil (\(0.25\)-Quantil):
      \(n\cdot p = 50 \cdot 0.25 = 12.5 \notin \mathbb{N} \Rightarrow x_{0.25} = x_{(13)} = 14.19\)
    2. Median (\(0.5\)-Quantil):
      \(n\cdot p = 50 \cdot 0.5 = 25 \in \mathbb{N} \Rightarrow x_{0.5} = \frac{1}{2}\cdot\left(x_{(25)} + x_{(26)}\right) = \frac{1}{2}\cdot\left(23.23+24.23\right) = 23.73\)
    3. oberes Quartil (\(0.75\)-Quantil):
      \(n\cdot p = 50 \cdot 0.75 = 37.5 \notin \mathbb{N} \Rightarrow x_{0.75} = x_{(38)} = 36.25\)
    4. Interquartilsabstand: \(x_{0.75}-x_{0.25}=36.25-14.19=22.06\)
    Quantile und Interquartilsabstände (näherungsweise) aus (Näherung der) emp. Verteilungsfunktion (aus Aufgabe 6): \[ F(x) = \left\{\begin{array}{ccl} 0 & \mbox{für} & x \le 0 \\[0.3em] 0.0075\cdot (x- 0) & \mbox{für} & 0 < x \le 8 \\[0.3em] 0.06 + 0.0275\cdot (x- 8) & \mbox{für} & 8 < x \le 16 \\[0.3em] 0.28 + 0.0275\cdot (x- 16) & \mbox{für} & 16 < x \le 24 \\[0.3em] 0.50 + 0.0175\cdot (x- 24) & \mbox{für} & 24 < x \le 32 \\[0.3em] 0.64 + 0.015\cdot (x- 32) & \mbox{für} & 32 < x \le 40 \\[0.3em] 0.76 + 0.014\cdot (x- 40) & \mbox{für} & 40 < x \le 50 \\[0.3em] 0.90 + 0.004\cdot (x- 50) & \mbox{für} & 50 < x \le 65 \\[0.3em] 0.96 + 0.002\overline{6}\cdot (x- 65) & \mbox{für} & 65 < x \le 80 \\[0.3em] 1 & \mbox{für} & x > 80 \\ \end{array}\right. \] Gleichung \(F(x_p)=p\) für \(p\in\{0.25,0.5,0.75\}\) nach \(x_p\) auflösen und IQA wie oben als \(x_{0.75}-x_{0.25}\) berechnen:
    1. unteres Quartil (\(0.25\)-Quantil):
      Es gilt \(p = 0.25 \in ( 0.06, 0.28) = (F( 8),F( 16))\) und damit \(x_{0.25}\in ( 8, 16)\).
      \(\displaystyle\begin{array}{crcl} \Rightarrow & F(x_{0.25}) = 0.06 + 0.0275 \cdot \left(x_{0.25} - 8\right) & \stackrel{!}{=} & 0.25 \\[0.15cm] \Leftrightarrow & x_{0.25} & = & \frac{0.25 - 0.06}{ 0.0275} +8\\[0.15cm] \Leftrightarrow & x_{0.25} & = & 14.\overline{90}\\ \end{array}\)
    2. Median (\(0.5\)-Quantil):
      \(p = 0.50 = F( 24)\quad \Rightarrow\quad x_{0.5}= 24\)
    3. oberes Quartil (\(0.75\)-Quantil):
      Es gilt \(p = 0.75 \in ( 0.64, 0.76) = (F( 32),F( 40))\) und damit \(x_{0.75}\in ( 32, 40)\).
      \(\displaystyle\begin{array}{crcl} \Rightarrow & F(x_{0.75}) = 0.64 + 0.015 \cdot \left(x_{0.75} - 32\right) & \stackrel{!}{=} & 0.75 \\[0.15cm] \Leftrightarrow & x_{0.75} & = & \frac{0.75 - 0.64}{ 0.015} +32\\[0.15cm] \Leftrightarrow & x_{0.75} & = & 39.\overline{3}\\ \end{array}\)
    4. Interquartilsabstand: \(x_{0.75}-x_{0.25} = 39.\overline{3} - 14.\overline{90} = 24.\overline{42}\)
    Zusammenfassung der Ergebnisse:
    \(p=0.25\) \(p=0.5\) \(p=0.75\) IQA
    Exakt \(14.19\) \(23.73\) \(36.25\) \(22.06\)
    Approx. \(14.\overline{90}\) \(24\) \(39.\overline{3}\) \(24.\overline{42}\)

Erklär-Video zu Aufgabe 10

Aufgabe 11

Zu den 16 Bundesländern der Bundesrepublik Deutschland wurden von den Statistischen Ämtern für 2009 unter anderem die durchschnittlichen Bruttolöhne/-gehälter je geleisteter Arbeitsstunde (in €) mit der (zur Vereinfachung bereits sortierten) Urliste

16.01, 16.26, 16.56, 16.87, 17.06, 19.67, 20.48, 20.51, 20.59, 21.06, 21.73, 21.91, 22.19, 22.84, 23.32, 23.76

sowie die Einwohnerzahlen (in 1000) mit der (ebenfalls sortierten) Urliste

660.1, 1025.5, 1656.8, 1778.1, 2257.1, 2367.6, 2515.7, 2830.1, 3431.7, 4018.9, 4177.4, 6059.6, 7945.2, 10747.9, 12497.1, 17893.2

erhoben.

  1. Berechnen Sie jeweils das arithmetische Mittel und die empirische Standardabweichung.
    Lösung einblenden
    Arithmetisches Mittel, emp. Standardabweichung:
    1. Für die durchschnittlichen Bruttolöhne/-gehälter erhält man mit \[ \overline{x}=\frac{1}{16}\sum_{i=1}^{16} x_{i} = \frac{1}{16}\left(16.01 + 16.26 + \cdots + 23.76\right) = 20.05125 \] und \[ \overline{x^2}=\frac{1}{16}\sum_{i=1}^{16} x_{i}^2 = \frac{1}{16}\left(16.01^2 + 16.26^2 + \cdots + 23.76^2\right) = 408.73223 \] unter Verwendung des Verschiebungssatzes die empirische Varianz \[ s^2 = \overline{x^2}-{\overline{x}}^2 = 408.73223 - 20.05125^2 = 6.6796 \] und die empirische Standardabweichung \(s=\sqrt{s^2}=\sqrt{6.6796}=2.584\).
    2. Für die Einwohnerzahlen (in 1000) erhält man mit \[ \overline{x}=\frac{1}{16}\sum_{i=1}^{16} x_{i} = \frac{1}{16}\left(660.1 + 1025.5 + \cdots + 17893.2\right) = 5116.375 \] und \[ \overline{x^2}=\frac{1}{16}\sum_{i=1}^{16} x_{i}^2 = \frac{1}{16}\left(660.1^2 + 1025.5^2 + \cdots + 17893.2^2\right) = 48094841.744 \] unter Verwendung des Verschiebungssatzes die empirische Varianz \[ s^2 = \overline{x^2}-{\overline{x}}^2 = 48094841.744 - 5116.375^2 = 21917548.6 \] und die empirische Standardabweichung \(s=\sqrt{s^2}=\sqrt{ 21917548.6}=4681.618\).
      Zusammenfassung der Ergebnisse:
      \(\overline{x}\) \(s\)
      Durchschn. Stundenlohn/-gehalt \(20.051\) \(2.584\)
      Einwohner \(5116.375\) \(4681.618\)
  2. Ermitteln Sie (unter Verwendung der aus der Vorlesung bekannten Konvention zur eindeutigen Bestimmung bei stetigen Merkmalen) jeweils das untere Quartil, den Median, das obere Quartil sowie den Interquartilsabstand der beiden Merkmale.
    Lösung einblenden

    Quantile und Interquartilsabstände:

    Durchschn. Stundenlohn/-gehalt
    1. unteres Quartil (\(0.25\)-Quantil):
      \(n\cdot p = 16 \cdot 0.25 = 4 \in \mathbb{N} \Rightarrow x_{0.25} = \frac{1}{2}\cdot\left(x_{(4)} + x_{(5)}\right) = \frac{1}{2}\cdot\left(16.87+17.06\right) = 16.965\)
    2. Median (\(0.5\)-Quantil):
      \(n\cdot p = 16 \cdot 0.5 = 8 \in \mathbb{N} \Rightarrow x_{0.5} = \frac{1}{2}\cdot\left(x_{(8)} + x_{(9)}\right) = \frac{1}{2}\cdot\left(20.51+20.59\right) = 20.55\)
    3. oberes Quartil (\(0.75\)-Quantil):
      \(n\cdot p = 16 \cdot 0.75 = 12 \in \mathbb{N} \Rightarrow x_{0.75} = \frac{1}{2}\cdot\left(x_{(12)} + x_{(13)}\right) = \frac{1}{2}\cdot\left(21.91+22.19\right) = 22.05\)
    4. Interquartilsabstand: \(x_{0.75}-x_{0.25}=22.05-16.965=5.085\)
    Einwohner
    1. unteres Quartil (\(0.25\)-Quantil):
      \(n\cdot p = 16 \cdot 0.25 = 4 \in \mathbb{N} \Rightarrow x_{0.25} = \frac{1}{2}\cdot\left(x_{(4)} + x_{(5)}\right) = \frac{1}{2}\cdot\left(1778.1+2257.1\right) = 2017.6\)
    2. Median (\(0.5\)-Quantil):
      \(n\cdot p = 16 \cdot 0.5 = 8 \in \mathbb{N} \Rightarrow x_{0.5} = \frac{1}{2}\cdot\left(x_{(8)} + x_{(9)}\right) = \frac{1}{2}\cdot\left(2830.1+3431.7\right) = 3130.9\)
    3. oberes Quartil (\(0.75\)-Quantil):
      \(n\cdot p = 16 \cdot 0.75 = 12 \in \mathbb{N} \Rightarrow x_{0.75} = \frac{1}{2}\cdot\left(x_{(12)} + x_{(13)}\right) = \frac{1}{2}\cdot\left(6059.6+7945.2\right) = 7002.4\)
    4. Interquartilsabstand: \(x_{0.75}-x_{0.25}=7002.4-2017.6=4984.8\)
    Zusammenfassung der Ergebnisse:
    \(p=0.25\) \(p=0.5\) \(p=0.75\) IQA
    Durchschn. Stundenlohn/-gehalt \(16.965\) \(20.55\) \(22.05\) \(5.085\)
    Einwohner \(2017.6\) \(3130.9\) \(7002.4\) \(4984.8\)
  3. Bei den Box-Plots zu beiden Merkmalen fehlt die Beschriftung der Achsen. Können Sie auf Grundlage der bereits berechneten Kennzahlen dennoch eine eindeutige Zuordnung der Box-Plots zum jeweiligen Merkmal treffen? Begründen Sie Ihre Antwort!
    Lösung einblenden
    Boxplot A: Einwohner, Boxplot B: Durchschn. Stundenlohn/-gehalt

Erklär-Video zu Aufgabe 11

Aufgabe 12

Beweisen Sie den Verschiebungssatz:
Seien \(x_1,\ldots,x_n\) die Urliste zu einem kardinalskalierten Merkmal \(X\), \(\overline{x}\) das arithmetische Mittel und \(s^2\) die empirische Varianz von \(X\). Dann gilt \[ s^2 = \frac{1}{n} \sum_{i=1}^n x_i^2 - \overline{x}^2 \]

Lösung einblenden
Beweis des Verschiebungssatzes (Satz 3.1): \[ \begin{split} s^2 &= \frac{1}{n}\sum_{i=1}^n (x_i-{\overline{x}})^2 = \frac{1}{n}\sum_{i=1}^n (x_i^2-2{\overline{x}}x_i+{\overline{x}}^2) \\ &= \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - \frac{1}{n}\cdot 2{\overline{x}}\cdot\underbrace{\sum_{i=1}^n x_i}_{=n\cdot{\overline{x}}} + \frac{1}{n}\underbrace{\sum_{i=1}^n{\overline{x}}^2}_{=n\cdot{\overline{x}}^2} \\ &= \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - 2{\overline{x}}^2 + {\overline{x}}^2 = \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - {\overline{x}}^2 \end{split} \]

Erklär-Video zu Aufgabe 12

Aufgabe 13

Kreuzen Sie jeweils an, auf welche Merkmalseigenschaften die folgenden Box-Plots bzw. Histogramme am ehesten hindeuten (genau 1 Kreuz ist jeweils richtig):

    • [ ] leptokurtisch und rechtssteil
    • [ ] leptokurtisch und linkssteil
    • [ ] platykurtisch und rechtssteil
    • [ ] platykurtisch und linkssteil
Lösung einblenden

  • [ ] leptokurtisch und rechtssteil
  • [X] leptokurtisch und linkssteil
  • [ ] platykurtisch und rechtssteil
  • [ ] platykurtisch und linkssteil
    • [ ] leptokurtisch und rechtssteil
    • [ ] leptokurtisch und linkssteil
    • [ ] platykurtisch und rechtssteil
    • [ ] platykurtisch und linkssteil
Lösung einblenden

  • [ ] leptokurtisch und rechtssteil
  • [ ] leptokurtisch und linkssteil
  • [X] platykurtisch und rechtssteil
  • [ ] platykurtisch und linkssteil
    • [ ] leptokurtisch und rechtssteil
    • [ ] leptokurtisch und linkssteil
    • [ ] platykurtisch und rechtssteil
    • [ ] platykurtisch und linkssteil
Lösung einblenden

  • [X] leptokurtisch und rechtssteil
  • [ ] leptokurtisch und linkssteil
  • [ ] platykurtisch und rechtssteil
  • [ ] platykurtisch und linkssteil
    • [ ] leptokurtisch und rechtssteil
    • [ ] leptokurtisch und linkssteil
    • [ ] platykurtisch und rechtssteil
    • [ ] platykurtisch und linkssteil
Lösung einblenden

  • [ ] leptokurtisch und rechtssteil
  • [ ] leptokurtisch und linkssteil
  • [ ] platykurtisch und rechtssteil
  • [X] platykurtisch und linkssteil

Erklär-Video zu Aufgabe 13