Einfu¨hrung in die Wahrscheinlichkeitsrechnung und in die induktive Statistik Hausu¨bung 2 Prof. Dr. Helmut Ku¨chenhoff, Dr. Andre´ Klima, Hannah Blocher M.Sc., Sarah Musiol B.Sc. SS 2021 Aufgabe 1 14 Punkte Wa¨hrend der WM 2006 wurde die Anzahl der Herzinfarkte wa¨hrend der deutschen Spielzeiten (drei Stunden nach Spielbeginn) erfasst und dokumentiert. Insgesamt wurden u¨ber alle deutschen Spielzeiten 400 Fa¨lle beobachtet. Dabei wird die Anzahl an Herzinfarkten bei einem beliebigem Spiel der deutschen Nationalmannschaft wa¨hrend der WM 2006 als X bezeichnet. Zur Pla- nung der Kapazita¨ten in Mu¨nchen bei der Europameisterschaft 2021 ist von Interesse, wie viele Rettungseinsa¨tze aufgrund von Herzinfarkten innerhalb von 180 Minuten nach Spielbeginn zu erwarten sind. Y bezeichnet die Zeitspanne zwischen zwei Rettungseinsa¨tzen aufgrund von Herz- infarkten wa¨hrend der oben definierten Spielzeit der deutschen Nationalmannschaft. (Hinweis: Die deutsche Nationalmannschaft hatte acht Spiele wa¨hrend der WM 2006 absolviert.) (Quelle: https://www.nejm.org/doi/pdf/10.1056/NEJMoa0707427?articleTools=true) Alle Teilaufgaben beziehen sich auf die Spiele der deutschen Nationalmannschaft und die dazu- geho¨rige Spielzeit. (a) Wie groß ist die Wahrscheinlichkeit, dass wa¨hrend eines Spiels der deutschen National- mannschaft genau 20 Herzinfarkte beobachtet werden? Geben Sie an und begru¨nden Sie welche Verteilung Sie hier annehmen. Spezifizieren Sie außerdem den/die zugeho¨rigen Ver- teilungsparameter. Lo¨sung: X: Anzahl an Herzinfarkten wa¨hrend einem Spiel der deutschen Nationalmannschaft X beschreibt die Anzahl von zufa¨lligen Ereignissen (diskret) innerhalb eines festgelegten Zeitintervalls. X ∼ Po(λ = 50) λ = 4008 = 50 P (X = 20) = λx x! exp(−λ) = 5020 20! exp(−50) = 0 Die Wahrscheinlichkeit, dass wa¨hrend einem Spiel der deutschen Nationalmannschaft ge- nau 20 Herzinfarkte auftreten, betra¨gt 0 %. (b) Was ist die erwartete Wartezeit zwischen zwei Herzinfarkten (in Stunden)? Geben Sie an und begru¨nden Sie welche Verteilung Sie hier annehmen. Spezifizieren Sie außerdem den/die zugeho¨rigen Vertelungsparameter. Lo¨sung: Y : Zeitspanne zwischen dem Auftreten von zwei Herzinfarkten Y beschreibt die Wartezeit zwischen zwei poisson-verteilten Ereignissen. 1 Y ∼ Exp(λ = 1.667) λ = 4008∗3 = 400 8∗3 = 16.667 E(Y ) = 1λ = 1 16.667 = 0.06 Alternativ: aus a) λ = 50 E(Y ) = 150 · 3 = 0.06 Die erwartete Wartezeit zwischen zwei Herzinfarkten betra¨gt 0.06 Stunden, das entspricht 3.6 Minuten. (c) Wie hoch ist die Wahrscheinlichkeit, dass nach einem Herzinfarkt innerhalb der na¨chsten 3 Minuten der Na¨chste auftritt? Lo¨sung: P (Y ≤ 3 60 ) = P (Y ≤ 1 20 ) = F ( 1 20 ) = 1− exp(−λy) = 1− exp(−λ 1 20 ) = 0.565409 = 0.565 Die Wahrscheinlichkeit, dass der na¨chste Herzinfarkt innerhalb der na¨chsten 3 Minuten auftritt, liegt bei 56.541%. (d) Wie hoch ist die Wahrscheinlichkeit, dass die Zeit zwischen zwei Herzinfarkten exakt (un- gerundet) 3 Minuten betra¨gt? (Achten Sie explizit auf eine nachvollziehbare Lo¨sung!) Lo¨sung: P (Y = 1 20 ) = 0 Begru¨ndung: Fu¨r z ∈ R ist die Punktwahrscheinlichkeit P (Y = z) fu¨r eine stetige Zufall- variable Y immer gleich 0. ( ∫ z z f(y)dy = 0) Die Wahrscheinlichkeit, dass die Zeit zwischen zwei Herzinfarkten exakt (ungerundet) 3 Minuten betra¨gt, ist 0%. 2 Aufgabe 2 11 Punkte Betrachten Sie eine Zufallsvariable X mit folgender Dichte f(x) = { λ exp(−λx+ c), x ≥ 1 0, sonst , wobei λ ∈ R>0. (a) Definieren Sie den Tra¨ger der oben genannten Dichte. Lo¨sung: Tra¨ger dieser Dichte ist: {x ∈ R : f(x) > 0} = {x ∈ R : x ≥ 1} = [1;∞) (b) Bestimmen Sie die Konstante c so, dass f(x) eine Dichte ist. Lo¨sung: Eigenschaften einer Dichte: Eine Funktion muss den folgenden beiden Eigenschaften genu¨gen, um eine Dichte zu sein. (i) f(x) ≥ 0 Beweis: λ ∈ R>0 und exp : R 7→ R>0 ist positiv, stetig, streng monoton wachsend (ii) ∫∞ −∞ f(x)dx = 1 Beweis: ∫ ∞ −∞ f(x)dx = ∫ 1 −∞ f(x)dx+ ∫ ∞ 1 f(x)dx = ∫ ∞ 1 f(x)dx = ∫ ∞ 1 λ exp(−λx+ c)dx = [− exp(−λx+ c)]∞1 = exp(−λ+ c) != 1 mit limx→−∞ exp(x) = 0. Somit ist fu¨r c = λ diese Eigenschaft erfu¨llt. (c) Berechnen Sie den Erwartungswert von X in Abha¨ngigkeit von λ. Lo¨sung: E(X) = ∫ ∞ −∞ x · f(x)dx = ∫ 1 −∞ x · f(x)dx+ ∫ ∞ 1 x · f(x)dx = ∫ ∞ 1 x · λ exp(−λx+ c)dx = [ −x exp(−λx+ c)− 1 λ exp(−λx+ c) ]∞ 1 = exp(−λ+ c) + 1 λ exp(−λ+ c) = exp(−λ+ c)(1 + 1 λ ) Fu¨r c = λ: 3 E(X) = 1 + 1 λ Alternativ: Nutzung der Geda¨chtnislosigkeit der Exponential-Verteilung. U¨ber Partielle Integration: f(x) = − 1 λ exp(−λx) f ′(x) = exp(−λx) g(x) = x g′(x) =1 mit ∫ b a f ′(x) · g(x)dx = [f(x) · g(x)]ba − ∫ b a f(x) · g′(x)dx. E(X) = λ · exp(λ) ∫ ∞ 1 x · exp(−λx)dx = λ · exp(λ) · ([ − 1 λ x exp(−λx) ]∞ 1 − ∫ ∞ 1 − 1 λ exp(−λx)dx ) = λ · exp(λ) · ([ − 1 λ x exp(−λx)− 1 λ2 exp(−λx) ]∞ 1 ) = λ · exp(λ) · ( 1 λ exp(−λ) + 1 λ2 exp(−λ) ) = 1 + 1 λ mit limx→−∞ exp(x) = 0. (d) Ist die Hazardrate dieser Dichte konstant? Lo¨sung: JA, da es sich um eine trunkierte Exponential-Verteilung handelt und diese eine konstante Hazardrate besitzt. Alternativ: λ(x) = f(x) S(x) = f(x) 1− F (x) = λ exp(−λx+ λ) 1− (1− exp(−λx+ λ)) = λ exp(−λx+ λ) exp(−λx+ λ) = λ 4 Aufgabe 3 5 Punkte Sind die folgenden Aussagen richtig oder falsch? Begru¨nden Sie Ihre Antwort in maximal 2 Sa¨tzen. (a) Der Tra¨ger der Binomial-Verteilung ist R. (2 Punkte) Lo¨sung: FALSCH Der Tra¨ger der Binomial-Verteilung nimmt keine negativen Werte an. Es genu¨gt ein Gegenbeispiel bei solchen Aufgabenstellungen. Gegenbeispiel: −1.5 ist nicht mo¨glich, da Erfolge nur positive, ganze Zahlen sein du¨rfen (N+0 ). (b) Je ho¨her die Varianz, desto wahrscheinlicher ist es in der Regel extremere Werte zu beob- achten. (3 Punkte) Lo¨sung: FALSCH Diese Aussage gilt fu¨r Spezialfa¨lle, wie z.B. gleicher Verteilungstyp und gleicher Erwar- tungswert, aber nicht im Vergleich von zwei nicht weiter bestimmten Verteilungen. Gegenbeispiel: Eine Gleichverteilung auf [a,b] vs. irgendeine andere Verteilung mit unend- lichen Tra¨ger (kleiner a, gro¨ßer b). Dann hat immer die Verteilung mit der kleinen Varianz die ho¨here Wahrscheinlichkeit fu¨r extreme Werte. Es lassen sich fu¨r beide Fa¨lle Beispiele finden, mit ada¨quater und kompletter Begru¨ndung mit der Darlegung notwendiger Annahmen wird auch ein RICHTIG akzeptiert. 5
学霸联盟