Übungsblatt 3
Aufgabe 10
Gegeben sei das kardinalskalierte Merkmal (und die zugehörige Klassierung) aus Aufgabe 6.
- Berechnen Sie aus den klassierten Daten die empirische Varianz sowie
die empirische Standardabweichung. Wie groß sind die relativen Abweichungen
von den aus der Urliste bestimmten Werten \(s^2=269.212\) bzw.
\(s=16.408\)?
Lösung einblenden
Klassierung aus Aufgabe 6:
Nr.
\(j\)Klasse
\(K_j=\)
\((k_{j-1},k_j]\)Klassen-
breite
\(b_j\)Klassen-
mitte
\(m_j\)absolute
Häufigkeit
\(h_j\)relative
Häufigkeit
\(r_j=\frac{h_j}{n}\)Häufigkeits-
dichte
\(f_j=\frac{r_j}{b_j}\)Verteilungs-
funktion
\(F(k_j)\)\(1\) \(( 0, 8]\) \(8\) \(4.0\) \(3\) \(0.0600\) \(0.0075\) \(0.0600\) \(2\) \(( 8, 16]\) \(8\) \(12.0\) \(11\) \(0.2200\) \(0.0275\) \(0.2800\) \(3\) \(( 16, 24]\) \(8\) \(20.0\) \(11\) \(0.2200\) \(0.0275\) \(0.5000\) \(4\) \(( 24, 32]\) \(8\) \(28.0\) \(7\) \(0.1400\) \(0.0175\) \(0.6400\) \(5\) \(( 32, 40]\) \(8\) \(36.0\) \(6\) \(0.1200\) \(0.015\) \(0.7600\) \(6\) \(( 40, 50]\) \(10\) \(45.0\) \(7\) \(0.1400\) \(0.014\) \(0.9000\) \(7\) \(( 50, 65]\) \(15\) \(57.5\) \(3\) \(0.0600\) \(0.004\) \(0.9600\) \(8\) \(( 65, 80]\) \(15\) \(72.5\) \(2\) \(0.0400\) \(0.002\overline{6}\) \(1.0000\)
\(\Rightarrow\) Empirische Varianz (näherungsweise): \[ s^2=\sum_{j=1}^{8} r_j\cdot (m_j - \overline{x})^2 = 0.06 \cdot (4-28.17)^2 + 0.22 \cdot (12-28.17)^2 + \cdots + 0.04 \cdot (72.5-28.17)^2 = 284.496 \] oder alternativ mit Verschiebungssatz:
\(\overline{x^2}=\sum_{j=1}^{8} r_{j}\cdot m_{j}^2 = 0.06 \cdot 4^2 + 0.22 \cdot 12^2 + \cdots + 0.04 \cdot 72.5^2 = 1078.045\)
\(\Rightarrow s^2 = 1078.045 - 28.17^2 = 284.496\)
Rel. Abweichung vom exakten Wert: \(\displaystyle\frac{284.496-269.212}{269.212} = 0.05677\) bzw. 5.677%
Empirische Standardabweichung (näherungsweise): \(\sqrt{284.496}=16.867\)
Rel. Abweichung vom exakten Wert: \(\displaystyle \frac{16.867-16.408}{16.408} = 0.02797\) bzw. 2.797% - Ermitteln Sie unteres Quartil, Median und oberes Quartil des Merkmals sowohl
(exakt) aus der Urliste als auch (approximativ mit Hilfe der empirischen
Verteilungsfunktion) aus den klassierten Daten. Berechnen Sie auch die
zugehörigen Interquartilsabstände.
Lösung einblenden
Quantile und Interquartilsabstände (exakt):
- unteres Quartil (\(0.25\)-Quantil):
\(n\cdot p = 50 \cdot 0.25 = 12.5 \notin \mathbb{N} \Rightarrow x_{0.25} = x_{(13)} = 14.19\) - Median (\(0.5\)-Quantil):
\(n\cdot p = 50 \cdot 0.5 = 25 \in \mathbb{N} \Rightarrow x_{0.5} = \frac{1}{2}\cdot\left(x_{(25)} + x_{(26)}\right) = \frac{1}{2}\cdot\left(23.23+24.23\right) = 23.73\) - oberes Quartil (\(0.75\)-Quantil):
\(n\cdot p = 50 \cdot 0.75 = 37.5 \notin \mathbb{N} \Rightarrow x_{0.75} = x_{(38)} = 36.25\) - Interquartilsabstand: \(x_{0.75}-x_{0.25}=36.25-14.19=22.06\)
- unteres Quartil (\(0.25\)-Quantil):
Es gilt \(p = 0.25 \in ( 0.06, 0.28) = (F( 8),F( 16))\) und damit \(x_{0.25}\in ( 8, 16)\).
\(\displaystyle\begin{array}{crcl} \Rightarrow & F(x_{0.25}) = 0.06 + 0.0275 \cdot \left(x_{0.25} - 8\right) & \stackrel{!}{=} & 0.25 \\[0.15cm] \Leftrightarrow & x_{0.25} & = & \frac{0.25 - 0.06}{ 0.0275} +8\\[0.15cm] \Leftrightarrow & x_{0.25} & = & 14.\overline{90}\\ \end{array}\) - Median (\(0.5\)-Quantil):
\(p = 0.50 = F( 24)\quad \Rightarrow\quad x_{0.5}= 24\) - oberes Quartil (\(0.75\)-Quantil):
Es gilt \(p = 0.75 \in ( 0.64, 0.76) = (F( 32),F( 40))\) und damit \(x_{0.75}\in ( 32, 40)\).
\(\displaystyle\begin{array}{crcl} \Rightarrow & F(x_{0.75}) = 0.64 + 0.015 \cdot \left(x_{0.75} - 32\right) & \stackrel{!}{=} & 0.75 \\[0.15cm] \Leftrightarrow & x_{0.75} & = & \frac{0.75 - 0.64}{ 0.015} +32\\[0.15cm] \Leftrightarrow & x_{0.75} & = & 39.\overline{3}\\ \end{array}\) - Interquartilsabstand: \(x_{0.75}-x_{0.25} = 39.\overline{3} - 14.\overline{90} = 24.\overline{42}\)
\(p=0.25\) \(p=0.5\) \(p=0.75\) IQA Exakt \(14.19\) \(23.73\) \(36.25\) \(22.06\) Approx. \(14.\overline{90}\) \(24\) \(39.\overline{3}\) \(24.\overline{42}\) - unteres Quartil (\(0.25\)-Quantil):
Erklär-Video zu Aufgabe 10
Aufgabe 11
Zu den 16 Bundesländern der Bundesrepublik Deutschland wurden von den Statistischen Ämtern für 2009 unter anderem die durchschnittlichen Bruttolöhne/-gehälter je geleisteter Arbeitsstunde (in €) mit der (zur Vereinfachung bereits sortierten) Urliste
16.01, 16.26, 16.56, 16.87, 17.06, 19.67, 20.48, 20.51, 20.59, 21.06, 21.73, 21.91, 22.19, 22.84, 23.32, 23.76
sowie die Einwohnerzahlen (in 1000) mit der (ebenfalls sortierten) Urliste
660.1, 1025.5, 1656.8, 1778.1, 2257.1, 2367.6, 2515.7, 2830.1, 3431.7, 4018.9, 4177.4, 6059.6, 7945.2, 10747.9, 12497.1, 17893.2
erhoben.
- Berechnen Sie jeweils das arithmetische Mittel und die empirische
Standardabweichung.
Lösung einblenden
Arithmetisches Mittel, emp. Standardabweichung:
- Für die durchschnittlichen Bruttolöhne/-gehälter erhält man mit \[ \overline{x}=\frac{1}{16}\sum_{i=1}^{16} x_{i} = \frac{1}{16}\left(16.01 + 16.26 + \cdots + 23.76\right) = 20.05125 \] und \[ \overline{x^2}=\frac{1}{16}\sum_{i=1}^{16} x_{i}^2 = \frac{1}{16}\left(16.01^2 + 16.26^2 + \cdots + 23.76^2\right) = 408.73223 \] unter Verwendung des Verschiebungssatzes die empirische Varianz \[ s^2 = \overline{x^2}-{\overline{x}}^2 = 408.73223 - 20.05125^2 = 6.6796 \] und die empirische Standardabweichung \(s=\sqrt{s^2}=\sqrt{6.6796}=2.584\).
- Für die Einwohnerzahlen (in 1000) erhält man mit
\[
\overline{x}=\frac{1}{16}\sum_{i=1}^{16} x_{i} = \frac{1}{16}\left(660.1 + 1025.5 + \cdots + 17893.2\right) = 5116.375
\]
und
\[
\overline{x^2}=\frac{1}{16}\sum_{i=1}^{16} x_{i}^2 = \frac{1}{16}\left(660.1^2 + 1025.5^2 + \cdots + 17893.2^2\right) = 48094841.744
\]
unter Verwendung des Verschiebungssatzes die empirische Varianz
\[
s^2 = \overline{x^2}-{\overline{x}}^2 = 48094841.744 - 5116.375^2 = 21917548.6
\]
und die empirische Standardabweichung \(s=\sqrt{s^2}=\sqrt{ 21917548.6}=4681.618\).
Zusammenfassung der Ergebnisse:\(\overline{x}\) \(s\) Durchschn. Stundenlohn/-gehalt \(20.051\) \(2.584\) Einwohner \(5116.375\) \(4681.618\)
- Ermitteln Sie (unter Verwendung der aus der Vorlesung bekannten Konvention
zur eindeutigen Bestimmung bei stetigen Merkmalen) jeweils das untere Quartil,
den Median, das obere Quartil sowie den Interquartilsabstand der beiden Merkmale.
Lösung einblenden
Quantile und Interquartilsabstände:
Durchschn. Stundenlohn/-gehalt- unteres Quartil (\(0.25\)-Quantil):
\(n\cdot p = 16 \cdot 0.25 = 4 \in \mathbb{N} \Rightarrow x_{0.25} = \frac{1}{2}\cdot\left(x_{(4)} + x_{(5)}\right) = \frac{1}{2}\cdot\left(16.87+17.06\right) = 16.965\) - Median (\(0.5\)-Quantil):
\(n\cdot p = 16 \cdot 0.5 = 8 \in \mathbb{N} \Rightarrow x_{0.5} = \frac{1}{2}\cdot\left(x_{(8)} + x_{(9)}\right) = \frac{1}{2}\cdot\left(20.51+20.59\right) = 20.55\) - oberes Quartil (\(0.75\)-Quantil):
\(n\cdot p = 16 \cdot 0.75 = 12 \in \mathbb{N} \Rightarrow x_{0.75} = \frac{1}{2}\cdot\left(x_{(12)} + x_{(13)}\right) = \frac{1}{2}\cdot\left(21.91+22.19\right) = 22.05\) - Interquartilsabstand: \(x_{0.75}-x_{0.25}=22.05-16.965=5.085\)
- unteres Quartil (\(0.25\)-Quantil):
\(n\cdot p = 16 \cdot 0.25 = 4 \in \mathbb{N} \Rightarrow x_{0.25} = \frac{1}{2}\cdot\left(x_{(4)} + x_{(5)}\right) = \frac{1}{2}\cdot\left(1778.1+2257.1\right) = 2017.6\) - Median (\(0.5\)-Quantil):
\(n\cdot p = 16 \cdot 0.5 = 8 \in \mathbb{N} \Rightarrow x_{0.5} = \frac{1}{2}\cdot\left(x_{(8)} + x_{(9)}\right) = \frac{1}{2}\cdot\left(2830.1+3431.7\right) = 3130.9\) - oberes Quartil (\(0.75\)-Quantil):
\(n\cdot p = 16 \cdot 0.75 = 12 \in \mathbb{N} \Rightarrow x_{0.75} = \frac{1}{2}\cdot\left(x_{(12)} + x_{(13)}\right) = \frac{1}{2}\cdot\left(6059.6+7945.2\right) = 7002.4\) - Interquartilsabstand: \(x_{0.75}-x_{0.25}=7002.4-2017.6=4984.8\)
\(p=0.25\) \(p=0.5\) \(p=0.75\) IQA Durchschn. Stundenlohn/-gehalt \(16.965\) \(20.55\) \(22.05\) \(5.085\) Einwohner \(2017.6\) \(3130.9\) \(7002.4\) \(4984.8\) - unteres Quartil (\(0.25\)-Quantil):
- Bei den Box-Plots zu beiden Merkmalen fehlt die Beschriftung der Achsen.
Können Sie auf Grundlage der bereits berechneten Kennzahlen dennoch eine
eindeutige Zuordnung der Box-Plots zum jeweiligen Merkmal treffen?
Begründen Sie Ihre Antwort!
Lösung einblenden
Boxplot A: Einwohner, Boxplot B: Durchschn. Stundenlohn/-gehalt
Erklär-Video zu Aufgabe 11
Aufgabe 12
Beweisen Sie den Verschiebungssatz:
Seien \(x_1,\ldots,x_n\) die Urliste zu einem kardinalskalierten Merkmal \(X\),
\(\overline{x}\) das arithmetische Mittel und \(s^2\) die empirische Varianz von
\(X\). Dann gilt
\[
s^2 = \frac{1}{n} \sum_{i=1}^n x_i^2 - \overline{x}^2
\]
Lösung einblenden
Beweis des Verschiebungssatzes (Satz 3.1): \[ \begin{split} s^2 &= \frac{1}{n}\sum_{i=1}^n (x_i-{\overline{x}})^2 = \frac{1}{n}\sum_{i=1}^n (x_i^2-2{\overline{x}}x_i+{\overline{x}}^2) \\ &= \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - \frac{1}{n}\cdot 2{\overline{x}}\cdot\underbrace{\sum_{i=1}^n x_i}_{=n\cdot{\overline{x}}} + \frac{1}{n}\underbrace{\sum_{i=1}^n{\overline{x}}^2}_{=n\cdot{\overline{x}}^2} \\ &= \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - 2{\overline{x}}^2 + {\overline{x}}^2 = \left(\frac{1}{n}\sum_{i=1}^n x_i^2\right) - {\overline{x}}^2 \end{split} \]
Erklär-Video zu Aufgabe 12
Aufgabe 13
Kreuzen Sie jeweils an, auf welche Merkmalseigenschaften die folgenden Box-Plots bzw. Histogramme am ehesten hindeuten (genau 1 Kreuz ist jeweils richtig):
- [ ] leptokurtisch und rechtssteil
- [ ] leptokurtisch und linkssteil
- [ ] platykurtisch und rechtssteil
- [ ] platykurtisch und linkssteil
Lösung einblenden
- [ ] leptokurtisch und rechtssteil
- [X] leptokurtisch und linkssteil
- [ ] platykurtisch und rechtssteil
- [ ] platykurtisch und linkssteil
- [ ] leptokurtisch und rechtssteil
- [ ] leptokurtisch und linkssteil
- [ ] platykurtisch und rechtssteil
- [ ] platykurtisch und linkssteil
Lösung einblenden
- [ ] leptokurtisch und rechtssteil
- [ ] leptokurtisch und linkssteil
- [X] platykurtisch und rechtssteil
- [ ] platykurtisch und linkssteil
- [ ] leptokurtisch und rechtssteil
- [ ] leptokurtisch und linkssteil
- [ ] platykurtisch und rechtssteil
- [ ] platykurtisch und linkssteil
Lösung einblenden
- [X] leptokurtisch und rechtssteil
- [ ] leptokurtisch und linkssteil
- [ ] platykurtisch und rechtssteil
- [ ] platykurtisch und linkssteil
- [ ] leptokurtisch und rechtssteil
- [ ] leptokurtisch und linkssteil
- [ ] platykurtisch und rechtssteil
- [ ] platykurtisch und linkssteil
Lösung einblenden
- [ ] leptokurtisch und rechtssteil
- [ ] leptokurtisch und linkssteil
- [ ] platykurtisch und rechtssteil
- [X] platykurtisch und linkssteil
Erklär-Video zu Aufgabe 13