Normalapproximation < Stochastik < Hochschule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 21:43 Do 17.02.2005 | Autor: | Edric |
Ich nochmal.
Die Aufgabe:
Von einem Würfel (evt. nicht ideal) ist bekannt, daß die Wahrscheinlichkeit p für eine "Sechs" zwischen 1/8 und 1/5 liegt.
Man will die Wahrscheinlichkeit p anhand der in N Würfen mit diesem Würfel beobachteten Anzahl X von "Sechsen" schätzen.
Geben Sie einen Schätzer [mm] \hat{p}_N [/mm] für p und eine möglichst kleine Anzahl N notwendiger Versuche derart an, dass die Wahrscheinlichkeit, sich um mehr als 1/50 zu verschätzen, höchstens 10% beträgt.
Mein Ansatz soweit:
P("Sechs") = p = ? ; 1/8 [mm] \le [/mm] p [mm] \le [/mm] 1/5
X := # Sechsen
N := # Würfe
Ich hab einen Spielraum von 1/50 beim Schätzen, also bin ich davon ausgegangen, dass ich von den Intervallgrenzen nochmal 1/50 abweichen kann. Hier bin ich mir aber schon etwas unsicher, ob das richtig gedacht ist...
Gesucht ist also (mit den erweiterten Grenzen):
N, so dass P(21/200 [mm] \le [/mm] p [mm] \le [/mm] 44/200) = 0,1
Jetzt nähere ich mit der Standardnormalverteilung an, mein Schätzer [mm] \hat{p}_N:
[/mm]
[mm]\hat{p}_N = \bruch{p - E p}{\wurzel{D²p}} = \bruch{p - N*p}{\wurzel{N*p*(1-p)}}[/mm]
Nur, wie mache ich dann weiter? Ich bin völlig durcheinander, weil ich mit der Wahrscheinlichkeit für die Schätzung der Wahrscheinlichkeit rechne, ist der Ansatz soweit richtig?
Ich weiß, dass ich irgendwann sowas haben werde:
[mm] P(\hat{p}_N \le \bruch{k - N*p}{\wurzel{N*p*(1-p)}}) \approx \Phi(\bruch{k - N*p}{\wurzel{N*p*(1-p)}}) [/mm] = 0,9
k ist der Zahlenwert, wo ich drunter bleiben möchte, also denke ich, dass ich eine Unterscheidung für die untere und obere Intervallgrenze machen muss, aber wie genau?
Wofür [mm] \Phi [/mm] 0,9 wird kann ich aus meiner Quantiltabelle ablesen; hab ich dann ein Gleichungssystem mit den 2 Unbekannten N und p?
Es wäre toll, wenn jemand die Lücken füllen könnte.
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
> Ich nochmal.
Ich auch nochmal
> Die Aufgabe:
>
> Von einem Würfel (evt. nicht ideal) ist bekannt, daß die
> Wahrscheinlichkeit p für eine "Sechs" zwischen 1/8 und 1/5
> liegt.
>
> Man will die Wahrscheinlichkeit p anhand der in N Würfen
> mit diesem Würfel beobachteten Anzahl X von "Sechsen"
> schätzen.
>
> Geben Sie einen Schätzer [mm]\hat{p}_N[/mm] für p und eine möglichst
> kleine Anzahl N notwendiger Versuche derart an, dass die
> Wahrscheinlichkeit, sich um mehr als 1/50 zu verschätzen,
> höchstens 10% beträgt.
>
> Mein Ansatz soweit:
>
> P("Sechs") = p = ? ; 1/8 [mm]\le[/mm] p [mm]\le[/mm] 1/5
> X := # Sechsen
> N := # Würfe
>
> Ich hab einen Spielraum von 1/50 beim Schätzen, also bin
> ich davon ausgegangen, dass ich von den Intervallgrenzen
> nochmal 1/50 abweichen kann. Hier bin ich mir aber schon
> etwas unsicher, ob das richtig gedacht ist...
Nein, ich glaube, das ist nicht gemeint. S.u.
> Gesucht ist also (mit den erweiterten Grenzen):
> N, so dass P(21/200 [mm]\le[/mm] p [mm]\le[/mm] 44/200) = 0,1
>
> Jetzt nähere ich mit der Standardnormalverteilung an, mein
> Schätzer [mm]\hat{p}_N:
[/mm]
> [mm]\hat{p}_N = \bruch{p - E p}{\wurzel{D²p}} = \bruch{p - N*p}{\wurzel{N*p*(1-p)}}[/mm]
Hm, der Schätzer ist nicht besonders brauchbar, weil dort der unbekannte Parameter p wieder auftaucht. Um den geht es ja gerade. Ein Schätzer ist ja eine Zufallsvariable, und die einzige Zufallsvariable in Deinem Modell ist X. Wie kannst Du also aus X einen vernünftigen Schätzer für p basteln? Nimm mal an, Du hast N=100 Mal geworfen und 19 Mal eine 6 gewürfelt. Was würdest Du dann für p schätzen?
> Nur, wie mache ich dann weiter? Ich bin völlig
> durcheinander, weil ich mit der Wahrscheinlichkeit für die
> Schätzung der Wahrscheinlichkeit rechne, ist der Ansatz
> soweit richtig?
Nein. Der Ansatz sollte lauten
[mm]P\left(|\hat{p}_N-p|\ge \frac{1}{50}\right)\le 0.1[/mm]
> Ich weiß, dass ich irgendwann sowas haben werde:
> [mm]P(\hat{p}_N \le \bruch{k - N*p}{\wurzel{N*p*(1-p)}}) \approx \Phi(\bruch{k - N*p}{\wurzel{N*p*(1-p)}})[/mm]
> = 0,9
Hm, ich denke, das kommt aus einem anderen Typ Aufgabe. Da solltest Du mit Transferleistungen vorsichtig sein. Durch die Betragsstriche bekommst Du eine obere und untere Grenze, k wirst Du aber kennen (da steckt nur noch N drin, was durch die Standardisierung kommt). Du bekommst also eine (Un-)Gleichung mit einer Unbekannten, nämlich N. Ist gar nicht so kompliziert.
Viele Grüße
Brigitte
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 12:24 Fr 18.02.2005 | Autor: | Edric |
Hallo, erstmal vielen Dank für die Antwort!
> Hm, der Schätzer ist nicht besonders brauchbar, weil dort
> der unbekannte Parameter p wieder auftaucht. Um den geht es
> ja gerade. Ein Schätzer ist ja eine Zufallsvariable, und
> die einzige Zufallsvariable in Deinem Modell ist X.
Ich glaube, dass war ein Teil dessen, was mich so irritiert hat. Die bisherigen Aufgaben unter der Überschrift "Normalapproximation" konnte ich nach dem Muster lösen, diese aber offenbar nicht.
> Wie kannst Du also aus X einen vernünftigen Schätzer für p
> basteln? Nimm mal an, Du hast N=100 Mal geworfen und 19 Mal
> eine 6 gewürfelt. Was würdest Du dann für p schätzen?
Wenn ich bei 100 Würfen 19 Sechsen habe, dann würde ich grob p = 19/100 = 0,19 schätzen -- ich weiß ja zu diesem Zeitpunkt nur, dass der Würfel vielleicht nicht ideal ist. Ist mein Schätzer dann wirklich so einfach [mm] \hat{p}_N [/mm] = [mm] \bruch{X}{N} [/mm] ?
> Der Ansatz sollte lauten
>
> [mm]P\left(|\hat{p}_N-p|\ge \frac{1}{50}\right)\le 0.1[/mm]
Das sieht mir verdächtig nach der Tschebytschev-Ungleichung aus. Die kenne ich als:
P(|X - EX| [mm] \ge \epsilon) \le \bruch{D²X}{\epsilon²}
[/mm]
Wenn ich daraus schließe, dass [mm] \epsilon [/mm] = 1/50, dann kann ich daraus ja auch D²X berechnen, da der Teil hinter dem [mm] \le [/mm] ja 0,1 ist. Also weiß ich, dass D²X = 0,00004.
Ich gehe davon aus, dass dieses Würfelexperiment binomialverteilt ist, demnach gilt:
EX = N*p
D²X = N*p*(1-p)
Also ist hier EX = [mm] \bruch{0,00004}{1-p}.
[/mm]
Aber nützt mir das was? Das p werde ich ja trotzdem nicht komplett los...
Der Ansatz ist mir mittlerweile klar, er beschreibt genau das, was ich will. Aber wie ich davon auf N kommen soll, ist mir immer noch ein Rätsel.
|
|
|
|
|
Hallo Edric!
> Ich glaube, dass war ein Teil dessen, was mich so irritiert
> hat. Die bisherigen Aufgaben unter der Überschrift
> "Normalapproximation" konnte ich nach dem Muster lösen,
> diese aber offenbar nicht.
>
> > Wie kannst Du also aus X einen vernünftigen Schätzer für
> p
> > basteln? Nimm mal an, Du hast N=100 Mal geworfen und 19
> Mal
> > eine 6 gewürfelt. Was würdest Du dann für p schätzen?
>
> Wenn ich bei 100 Würfen 19 Sechsen habe, dann würde ich
> grob p = 19/100 = 0,19 schätzen -- ich weiß ja zu diesem
> Zeitpunkt nur, dass der Würfel vielleicht nicht ideal ist.
> Ist mein Schätzer dann wirklich so einfach [mm]\hat{p}_N[/mm] =
> [mm]\bruch{X}{N}[/mm] ?
> > Der Ansatz sollte lauten
> >
> > [mm]P\left(|\hat{p}_N-p|\ge \frac{1}{50}\right)\le 0.1[/mm]
>
>
> Das sieht mir verdächtig nach der Tschebytschev-Ungleichung
> aus. Die kenne ich als:
> P(|X - EX| [mm]\ge \epsilon) \le \bruch{D²X}{\epsilon²}
[/mm]
Ja, die könntest Du hier nehmen, aber die Ungleichung liefert recht grobe Abschätzungen. Genauer geht es mit der Binomialpproximation. Du weißt doch, dass X binomialverteilt ist mit Parametern N und p. Das heißt, X ist näherungsweise normalverteilt mit:
> EX = N*p
> D²X = N*p*(1-p)
Das heißt:
[mm]P(X\le k)\approx\Phi\left(\frac{k-Np}{\sqrt{Np(1-p)}}\right)[/mm]
Jetzt geht es so weiter:
[mm]P\left(|\hat{p}_N-p|\ge \frac{1}{50}\right)=P\left(|\frac{X}{N}-p|\ge \frac{1}{50}\right)=P\left(|X-Np|\ge \frac{N}{50}\right)[/mm]
[mm]P\left(X-Np\ge \frac{N}{50}\right) + P\left(X-Np\le \frac{-N}{50}\right)[/mm]
Jetzt die obige Approximation verwenden und die Abschätzung [mm] $p(1-p)\le [/mm] 1/4$ benutzen. Dann solltest Du die untere Schranke von 10 % aus der Aufgabenstellung berücksichtigen und nach N auflösen können.
Viele Grüße
Brigitte
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 14:36 Sa 19.02.2005 | Autor: | Edric |
Hallo!
> Du weißt doch, dass X
> binomialverteilt ist mit Parametern N und p. Das heißt, X
> ist näherungsweise normalverteilt mit:
>
> > EX = N*p
> > D²X = N*p*(1-p)
>
>
>
> Das heißt:
>
> [mm]P(X\le k)\approx\Phi\left(\frac{k-Np}{\sqrt{Np(1-p)}}\right)[/mm]
Da ja hierfür (X [mm] \le [/mm] k) gelten muss und in meiner Quantiltabelle nur Werte größer 0.5 stehen, hab ich die Ungleichung an dieser Stelle schon umgedreht, also:
[mm]P\left(|\hat{p}_N-p|\le \frac{1}{50}\right) \ge 0.9[/mm]
Dann davon weiter mit deinen Vorgaben:
[mm]P\left(|\hat{p}_N-p|\le \frac{1}{50}\right)=P\left(|\frac{X}{N}-p|\le \frac{1}{50}\right)=P\left(|X-Np|\le \frac{N}{50}\right)[/mm]
[mm]= P\left(X-Np\le \frac{N}{50}\right) + P\left(X-Np\ge \frac{-N}{50}\right)[/mm]
Hier hab ich eine Zwischenfrage: Ist diese Fallunterscheidung so notwendig? Wenn mich nicht alles täuscht, gilt doch wg. der Symmetrie der Verteilung:
[mm]P\left(X-Np\ge \frac{-N}{50}\right) = P\left(X-Np\le \frac{N}{50}\right)[/mm]
Also 2x der erste Ausdruck.
Für diesen alleine erhalte ich auch ein N:
[mm]P\left(X-Np\le \frac{N}{50}\right) = P\left(X\le \frac{N}{50} + Np\right)[/mm]
Nach Einsetzen für k in obiges [mm] \Phi [/mm] und Annäherung von p(1-p) durch 1/4...:
[mm]\Phi\left(\frac{N/50 + Np - Np}{\sqrt{1/4*N}}\right) = 0.9[/mm]
...erhalte ich nach einigen Umformungen und Ablesen des zu 0.9 ungefähr passenden Wertes:
[mm]\bruch{\wurzel{N}}{25} = 1.28 \gdw N = 1024[/mm]
Diese Zahl erscheint mir für die gewünschte Schätzung schon ganz realistisch, allerdings hab ich da ja die Fallunterscheidung noch nicht berücksichtigt. Einfach 2N nehmen?
Wenn meine Idee mit der Symmetrie richtig ist, muss ja die Summe der beiden Fälle 0.9 sein...
Sorry, falls ich da wieder Unfug veranstaltet haben sollte, mir fehlt nach wie vor ein bisschen das Gefühl für stochastische Dinge...
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 01:02 So 20.02.2005 | Autor: | Edric |
Hallo,
> Daraus folgt
>
> [mm]P(-a\le Y\le a)=P(Y\le a)-P(Y\le -a)=P(Y\le a)- (1-P(Y\le a))=2P(Y\le a)-1[/mm]
>
Das hab ich jetzt berücksichtigt.
> > Nach Einsetzen für k in obiges [mm]\Phi[/mm] und Annäherung von
>
> > p(1-p) durch 1/4...:
>
> Das ist keine ANnäherung, sondern eine Abschätzung
> (worst-case). Aber ok...
Natürlich ist das keine Annäherung, meinte ich auch nicht (auch wenn ich das Wort verwendet hab).
> [mm]P(Y\le a)\ge 0.95[/mm]
>
> Das heißt: anderes Quantil nehmen, neues N berechnen.
Ergibt N = 1681. Puh.
|
|
|
|