Übungsblatt 2

Aufgabe 5

Bei 6 aufeinanderfolgenden Tankvorgängen hat ein Autofahrer die Angaben für die seit der letzten Betankung gefahrenen Kilometer sowie den durchschnittlichen Verbrauch (in Litern pro 100 Kilometer) aus dem Bordcomputer seines PKWs wie folgt notiert:

Tankvorgang 1 2 3 4 5 6
gefahrene Strecke [km] 612 672 772 561 770 783
Durchschnittsverbrauch [l/100 km] 7.8 7.8 6.6 6.9 6.9 7.9
  1. Berechnen Sie den zugehörigen durchschnittlichen Verbrauch des Fahrzeugs.
    Lösung einblenden
    Der durchschnittliche Verbrauch berechnet sich als \[\frac{\mbox{Gesamtverbrauch (in [l])}}{\mbox{Gesamtstrecke (in [100 km])}}\ .\]
    • Gesamtstrecke (in [km]):
      \(612 + 672 + 772 + 561 + 770 + 783 = 4170\)
      \(\leadsto\) Gesamtstrecke \(41.7\) (in [100 km]).
    • Gesamtverbrauch (in [l]):
      \(6.12 \cdot 7.8 + 6.72 \cdot 7.8 + 7.72 \cdot 6.6 + 5.61 \cdot 6.9 + 7.7 \cdot 6.9 + 7.83 \cdot 7.9 = 304.8\)
      \(\leadsto\) Durchschnittlicher Verbrauch: \(\displaystyle\frac{304.8\mbox{ [l]}} {41.7\mbox{ [100 km]}} = 7.309\mbox{ [l/100 km]}\)
  2. Um welche Art von Mittelwert handelt es sich?
    Lösung einblenden
    Es handelt sich offensichtlich um einen gewichteten arithmetischen Mittelwert. Die Gewichte sind vorgegeben durch die relativen Anteile der zwischen den einzelnen Tankvorgängen zurückgelegten Strecken an der Gesamtstrecke von 4170 Kilometern: \[ \frac{612}{4170} \cdot 7.8 + \frac{672}{4170} \cdot 7.8 + \frac{772}{4170} \cdot 6.6 + \frac{561}{4170} \cdot 6.9 + \frac{770}{4170} \cdot 6.9 + \frac{783}{4170} \cdot 7.9 = 7.309 \]

Erklär-Video zu Aufgabe 5

Aufgabe 6

Zu einem kardinalskalierten Merkmal sei die folgende (zur einfacheren Bearbeitung der Aufgabe bereits sortierte) Urliste der Länge \(n=50\) gegeben:

5.30, 7.10, 7.49, 8.53, 8.91, 10.06, 11.78, 12.05, 13.16, 13.37, 13.64, 13.87, 14.19, 15.82, 16.20, 16.47, 17.58, 17.83, 18.68, 19.03, 19.46, 19.67, 20.51, 21.93, 23.23, 24.23, 25.41, 27.09, 27.31, 27.93, 28.19, 31.90, 33.40, 33.52, 33.62, 33.76, 34.25, 36.25, 41.23, 41.35, 45.46, 45.96, 46.32, 47.64, 48.49, 53.42, 55.36, 61.36, 68.54, 71.32

  1. Führen Sie eine Klassierung der erhobenen Daten auf Grundlage der Klassen

    \({K_{1}=(0,8]}\), \({K_{2}=(8,16]}\), \({K_{3}=(16,24]}\), \({K_{4}=(24,32]}\), \({K_{5}=(32,40]}\), \({K_{6}=(40,50]}\), \({K_{7}=(50,65]}\), \({K_{8}=(65,80]}\)

    durch. Geben Sie insbesondere die jeweiligen Klassenbreiten, Klassenmitten, absoluten und relativen Klassenhäufigkeiten, Häufigkeitsdichten sowie die Werte der empirischen Verteilungsfunktion an den Klassengrenzen an.
    Lösung einblenden
    Nr.

    \(j\)
    Klasse
    \(K_j=\)
    \((k_{j-1},k_j]\)
    Klassen-
    breite
    \(b_j\)
    Klassen-
    mitte
    \(m_j\)
    absolute
    Häufigkeit
    \(h_j\)
    relative
    Häufigkeit
    \(r_j=\frac{h_j}{n}\)
    Häufigkeits-
    dichte
    \(f_j=\frac{r_j}{b_j}\)
    Verteilungs-
    funktion
    \(F(k_j)\)
    \(1\) \(( 0, 8]\) \(8\) \(4.0\) \(3\) \(0.0600\) \(0.0075\) \(0.0600\)
    \(2\) \(( 8, 16]\) \(8\) \(12.0\) \(11\) \(0.2200\) \(0.0275\) \(0.2800\)
    \(3\) \(( 16, 24]\) \(8\) \(20.0\) \(11\) \(0.2200\) \(0.0275\) \(0.5000\)
    \(4\) \(( 24, 32]\) \(8\) \(28.0\) \(7\) \(0.1400\) \(0.0175\) \(0.6400\)
    \(5\) \(( 32, 40]\) \(8\) \(36.0\) \(6\) \(0.1200\) \(0.015\) \(0.7600\)
    \(6\) \(( 40, 50]\) \(10\) \(45.0\) \(7\) \(0.1400\) \(0.014\) \(0.9000\)
    \(7\) \(( 50, 65]\) \(15\) \(57.5\) \(3\) \(0.0600\) \(0.004\) \(0.9600\)
    \(8\) \(( 65, 80]\) \(15\) \(72.5\) \(2\) \(0.0400\) \(0.002\overline{6}\) \(1.0000\)
  2. Zeichnen Sie das zugehörige Histogramm.
    Lösung einblenden
  3. Berechnen Sie aus den klassierten Daten den (approximativen) arithmetischen Mittelwert der Daten. Wie groß ist die relative Abweichung vom tatsächlichen (aus der Urliste bestimmten) Mittelwert von \(27.783\)?
    Lösung einblenden
    Mittelwert (näherungsweise): \[ \sum_{j=1}^{8} r_j\cdot m_j = 0.06 \cdot 4 + 0.22 \cdot 12 + 0.22 \cdot 20 + 0.14 \cdot 28 + 0.12 \cdot 36 + 0.14 \cdot 45 + 0.06 \cdot 57.5 + 0.04 \cdot 72.5 = 28.17 \] relative Abweichung vom exakten Wert: \(\displaystyle\frac{28.17-27.783}{27.783} = 0.0139\) bzw. 1.39%
  4. Stellen Sie die (approximative) empirische Verteilungsfunktion des Merkmals aus der Klassierung der Daten auf.
    Lösung einblenden
    \[ {F}(x) = \left\{\begin{array}{ccl} 0 & \text{für} & x \le k_0 \\[0.3em] F(k_{j-1}) + f_j\cdot (x-k_{j-1}) & \text{für} & k_{j-1} < x \le k_j,\ j\in\{1,\ldots,l\} \\[0.3em] 1 & \text{für} & x > k_l \\ \end{array}\right. \] Hier: \[ F(x) = \left\{\begin{array}{ccl} 0 & \mbox{für} & x \le 0 \\[0.3em] 0.0075\cdot (x- 0) & \mbox{für} & 0 < x \le 8 \\[0.3em] 0.06 + 0.0275\cdot (x- 8) & \mbox{für} & 8 < x \le 16 \\[0.3em] 0.28 + 0.0275\cdot (x- 16) & \mbox{für} & 16 < x \le 24 \\[0.3em] 0.50 + 0.0175\cdot (x- 24) & \mbox{für} & 24 < x \le 32 \\[0.3em] 0.64 + 0.015\cdot (x- 32) & \mbox{für} & 32 < x \le 40 \\[0.3em] 0.76 + 0.014\cdot (x- 40) & \mbox{für} & 40 < x \le 50 \\[0.3em] 0.90 + 0.004\cdot (x- 50) & \mbox{für} & 50 < x \le 65 \\[0.3em] 0.96 + 0.002\overline{6}\cdot (x- 65) & \mbox{für} & 65 < x \le 80 \\[0.3em] 1 & \mbox{für} & x > 80 \\ \end{array}\right. \]
  5. Bestimmen Sie (aus der Urliste) die Anzahl von Merkmalswerten zwischen 20 und 40. Welche Näherung für diese Anzahl können Sie aus der in Teil d. aufgestellten empirischen Verteilungsfunktion berechnen?
    Lösung einblenden
    Anzahl (aus Urliste): 16
    Mit emp. Verteilungsfunktion genäherte Anzahl:
    \[ n \cdot (F(40)-F(20)) = 50 \cdot (0.76-0.39) = 50 \cdot 0.37 = 18.5 \]

Erklär-Video zu Aufgabe 6

Aufgabe 7

Gegeben sei das folgende Histogramm zur Klassierung einer Urliste der Länge \(n=50\):

  1. Rekonstruieren Sie die Klassierung der Daten aus dem Histogramm. Geben Sie insbesondere die jeweiligen Klassenbreiten, Klassenmitten, absoluten und relativen Klassenhäufigkeiten, Häufigkeitsdichten sowie die Werte der empirischen Verteilungsfunktion an den Klassengrenzen an.
    Lösung einblenden
    Nr.

    \(j\)
    Klasse
    \(K_j=\)
    \((k_{j-1},k_j]\)
    Klassen-
    breite
    \(b_j\)
    Klassen-
    mitte
    \(m_j\)
    absolute
    Häufigkeit
    \(h_j\)
    relative
    Häufigkeit
    \(r_j=\frac{h_j}{n}\)
    Häufigkeits-
    dichte
    \(f_j=\frac{r_j}{b_j}\)
    Verteilungs-
    funktion
    \(F(k_j)\)
    \(1\) \(( 0, 10]\) \(10\) \(5\) \(5\) \(0.1000\) \(0.010\) \(0.1000\)
    \(2\) \(( 10, 20]\) \(10\) \(15\) \(17\) \(0.3400\) \(0.034\) \(0.4400\)
    \(3\) \(( 20, 30]\) \(10\) \(25\) \(9\) \(0.1800\) \(0.018\) \(0.6200\)
    \(4\) \(( 30, 50]\) \(20\) \(40\) \(14\) \(0.2800\) \(0.014\) \(0.9000\)
    \(5\) \(( 50, 70]\) \(20\) \(60\) \(4\) \(0.0800\) \(0.004\) \(0.9800\)
    \(6\) \(( 70, 90]\) \(20\) \(80\) \(1\) \(0.0200\) \(0.001\) \(1.0000\)
  2. Wie viele Merkmalswerte sind größer als 20, aber nicht größer als 50? Können Sie die Anzahl exakt angeben?
    Lösung einblenden
    Anzahl: \(n \cdot (F(50)-F(20)) = 50 \cdot (0.9-0.44) = 50 \cdot 0.46 = 23\)
    Die Anzahl ist exakt, da sowohl 20 als auch 50 auf Intervallgrenzen der Klassierung fallen und die empirische Verteilungsfunktion aus der Klassierung dort mit der exakten empirischen Verteilungsfunktion (aus der Urliste) übereinstimmt.
  3. Wie groß ist der (näherungsweise zu bestimmende) Anteil der Merkmalswerte, die zwischen 8 und 30 liegen?
    Lösung einblenden

    Das Intervall \([8,30]\) überdeckt die Klassen 2 und 3 komplett sowie \(\frac{1}{5}\) von Klasse 1. Den gewünschten Anteil erhält man also als

    \[ \frac{1}{5}\cdot r_1 + r_2 + r_3 = \frac{1}{5}\cdot 0.1 + 0.34 + 0.18 = 0.54 = 54\%\ . \] Alternativ über Verteilungsfunktion: \(F(30)-F(8) = 0.62-0.08 = 0.54\) bzw. 54%

Erklär-Video zu Aufgabe 7

Aufgabe 8

Gegeben sei die folgende Häufigkeitsverteilung eines statistischen Merkmals:

\(a_j\) \(3\) \(4\) \(5\) \(\Sigma\)
\(h(a_j)\) \(4\) \(3\) \(3\) \(10\)
\(r(a_j)\) \(0.4\) \(0.3\) \(0.3\) \(1\)

Geben Sie den (die) Modalwert(e) sowie den Median an und berechnen Sie den arithmetischen, geometrischen und harmonischen Mittelwert.

Lösung einblenden

  • Modalwert(e): \(a_{\mbox{mod}} = 3\)

  • Median: durch Rekonstruktion der sortierten Urliste: \[ x_{(1)} = 3, x_{(2)} = 3, x_{(3)} = 3, x_{(4)} = 3, x_{(5)} = 4, x_{(6)} = 4, x_{(7)} = 4, x_{(8)} = 5, x_{(9)} = 5, x_{(10)} = 5 \] Alles zwischen \(x_{(5)}\) und \(x_{(6)}\) ist Median, alternativ (hier gleichbedeutend) Verwendung der Konvention zur eindeutigen Festlegung: \[ x_{\mbox{med}} = \frac{1}{2}\cdot(x_{(5)}+x_{(6)}) = \frac{1}{2}\cdot(4+4) = 4 \]

  • arithmetisches Mittel: \(\overline{x} = \sum_{j=1}^m r(a_j)\cdot a_j = 0.4\cdot3 + 0.3\cdot4 + 0.3\cdot5 = 3.9\)

  • geometrisches Mittel: \(\overline{x}^{(g)} = \prod_{j=1}^m a_j^{r(a_j)} = 3^{0.4} \cdot 4^{0.3} \cdot 5^{0.3} = 3.812\)

  • harmonisches Mittel: \(\displaystyle\overline{x}^{(h)} = \frac{1}{\sum_{j=1}^m\frac{r(a_j)}{a_j}} = \frac{1}{ \frac{0.4}{3} + \frac{0.3}{4} + \frac{0.3}{5} } = 3.727\)

Erklär-Video zu Aufgabe 8

Aufgabe 9

Zeigen Sie: Für das arithmetische Mittel \(\overline{x}\) eines Merkmals \(X\) mit den \(n\) Merkmalswerten \(x_1,\ldots,x_n\) gilt:

  1. \(\displaystyle\sum_{i=1}^n (x_i-\overline{x}) = 0\)
    Lösung einblenden
    Es gilt \[ \sum_{i=1}^n (x_i-\overline{x}) = \left(\sum_{i=1}^n x_i\right) - n\cdot\underbrace{\overline{x}}_{\displaystyle=\frac{1}{n}\sum_{i=1}^n x_i} = \left(\sum_{i=1}^n x_i\right) - \left(\sum_{i=1}^n x_i\right) = 0 \]
  2. \(\displaystyle\sum_{i=1}^n (x_i-\overline{x})^2 \le \sum_{i=1}^n (x_i-t)^2\) für alle \(t\in\mathbb{R}\)
    Lösung einblenden
    Die Behauptung ist offensichtlich korrekt, falls \(\overline{x}\) die Minimumstelle der Funktion \(f(t):=\sum_{i=1}^n (x_i-t)^2\) ist. Nullsetzen der 1. Ableitung \[ f'(t) = -2\sum_{i=1}^n (x_i-t) = -2\underbrace{\left(\sum_{i=1}^n x_i\right)}_{\displaystyle=n\cdot\overline{x}} + 2 n t = 2 n (t-\overline{x}) \] liefert \(\overline{x}\) als einzigen Kandidaten für eine Extremstelle, und wegen \(f''(t) \equiv 2n>0\) ist \(\overline{x}\) auch Minimumstelle.

Erklär-Video zu Aufgabe 9