N-Grammmodele < Wahrscheinlichkeit < Stochastik < Oberstufe < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 10:32 Di 06.06.2006 | Autor: | Katya |
Aufgabe | Wahrscheinlichkeit eines n-Gramms:
1) [mm] P(t_{1},....., t_{n})= f(t_{1},....., t_{n})/N
[/mm]
n- Anzahl von Wörtern in einem n-Gramm
N- Anzahl Wörter im Text
2) [mm] p(w_{n}| w_{1}...., w_{n})=p(w_{1}...., w_{n})/p(w_{1}...., w_{n-1}) [/mm] |
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
Hallo.
Eine N-Gramm ist eine Folge von Wörtern in einem Text, die aus n Wörtern besteht. Um die Wahrscheinlichkeit eines n-Gramms zu berechnen hab ich in meinem Skript die erste Formel (1) gefunden. Die verstehe ich. Die zweite Formel (2)verstehe ich aber nicht. Oder besser gesagt, ich finde, dass die zweite Formel der ersten widerspricht
Könnte mir bitte jemand erklären was mithilfe der zweiten Formel berechnet wird und ob die erste und die zweite Formel irgendwas mit einander zum tun haben.
Danke
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 11:34 Di 06.06.2006 | Autor: | DirkG |
Die zweite Formel beinhaltet nicht mehr und nicht weniger als die Definition der bedingten Wahrscheinlichkeit
$$P(A [mm] \bigm| B)=\frac{P(A\cap B)}{P(B)}$$
[/mm]
angewandt auf [mm] $A=w_n$ [/mm] und [mm] $B=w_1\cap\ldots\cap w_{n-1}$.
[/mm]
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 12:02 Di 06.06.2006 | Autor: | Katya |
> Die zweite Formel beinhaltet nicht mehr und nicht weniger
> als die Definition der bedingten Wahrscheinlichkeit
> [mm]P(A \bigm| B)=\frac{P(A\cap B)}{P(B)}[/mm]
> angewandt auf [mm]A=w_n[/mm]
> und [mm]B=w_1\cap\ldots\cap w_{n-1}[/mm].
>
Ehrlich gesagt, verstehe ich jetzt noch weniger.
> [mm]B=w_1\cap\ldots\cap w_{n-1}[/mm].
Wie kann man zwischen den Wörtern differenz bilden?
Z.B. Ich nehme den Satz:
Das sind grüne Blätter.
Ich will ja die Wahrscheinlichkeit berechnen, dass das Wort 'Blätter' vorkommt.
P(das) = 1/10
P(sind) = 1/20
P(grüne) = 1/40
Was ist denn die Diferenz?
Oder soll das sein:
das [mm] \cap [/mm] sind [mm] \cap [/mm] grüne
Was ist dann die Diferenz?
Danke vielmals
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 15:10 Di 06.06.2006 | Autor: | DirkG |
Was denn für eine Differenz???
[mm] $\cap$ [/mm] steht für Durchschnitt von Ereignissen, also "und".
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 12:20 Do 08.06.2006 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|