Chi^2 Test < Stochastik < Oberstufe < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 08:35 Do 25.04.2013 | Autor: | Kapungen |
Ich behalndle gerade in der Schule den [mm] Chi^2 [/mm] Test. Stimmt es, dass er Aussagen über die Richtigkeit von Versuchen angibt?
Und wie komme ich zu der Formel?
Danke
Kapungen
Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.
|
|
|
|
Hallo!
Der test sagt nichts über die Richtigkeit von Versuchen aus, sondern darüber, ob eine Funktion die Daten denn auch gut beschreibt.
Ich beschreibe das Prinzip mal aus Sicht eines Physikers, der Daten mit der Theorie vergleichen will:
- Man hat eine Datenreihe, beispielsweise die Position y eines beschleunigenden Körpers gegen die Zeit t. Man hat also viele Wertepaare [mm] (t_1;y_1) (t_3;y_3) (t_3;y_3) [/mm] ...
- Man glaubt, daß es einen quadratischen Zusammenhang gibt, kennt man ja aus der Schule: [mm] Y(t)=v_0t+\frac{1}{2}at^2
[/mm]
Frage: Wie groß sind [mm] v_0 [/mm] und a ? Das löst man über einen Algorithmus:
1.: Wähle einen Anfangswert für [mm] v_0 [/mm] und a
2.: Bilde für jedes Wertepaar [mm] (t_i;y_i) [/mm] die Differenz [mm] d_i= y_i-Y(t_i) [/mm] also [mm] d_1= y_1-Y(t_1) [/mm] , [mm] d_2= y_2-Y(t_2) [/mm] , ...
Anschaulich: Berechne in einem Diagramm mit Wertepaaren und Funktion Y(t) den vertikalen Abstand zwischen den Punkten und der Funktion
3.: Bilde die Summe der Quadrate: [mm] $s=\sum d_i^2=d_1^2+d_2^2+d_3^3+...$
[/mm]
Durch das Quadrieren sind alle Summanden positiv. Außerdem: große Differenzen wirken sich verstärkt auf die Summe aus, kleine eher weniger!
Diese Summe s gibt dir sowas wie einen Gesamtabstand aller Punkte von der Funktion
4.: wähle etwas andere Werte für [mm] v_0 [/mm] und a, und beginne wieder bei Punkt 2. Ist die neue Summe s kleiner, passen diese neuen Werte besser, und die Funktion beschreibt die Daten damit besser.
Wiederhole das ganze so lange, bis du keine Verbesserung mehr erreichst. Dann hast du die besten Werte für [mm] v_0 [/mm] und a gefunden!
Dies nennt man die "Methode der kleinsten Quadrate"
In der Realität wird man etwas gezielter wissen, welche "etwas anderen" werte vermutlich bessere Ergebnisse bringen.
Jetzt hat jede Position [mm] y_i [/mm] eine Messunsicherheit die z.B. durch Ungenauigkeiten der Messapparatur zustande kommt. Diese Ungenauigkeiten bezeichnet man mit [mm] \sigma_i [/mm] , denn sie können für jeden Wert anders sein (z.B.: Position bei hohen Geschwindigkeiten schlecher bestimmbar).
Das Problem: Werte mit großer Unsicherheit hatten bisher den gleichen Einfluss auf die Summenbildung, wie Werte mit keiner Unsicherheit. Deshlab wird die Summe nun anders berechnet:
[mm] $s=\sum \left(\frac{d_i}{\sigma_i}\right)^2=\left(\frac{d_1}{\sigma_1}\right)^2+\left(\frac{d_2}{\sigma_2}\right)^2+\left(\frac{d_3}{\sigma_3}\right)^2+...$
[/mm]
Eine hohe Unsicherheit verringert den Anteil eines Messwertes an s nun, und er hat weniger Einfluss.
Auch dieses s ist ein Maß für die Gesamtdifferenz zwischen Funktion und Messwerten, allerdings relativiert durch die Unsicherheit.
Nun kann man die Summe noch durch die Anzahl der Messwerte teilen, man bekommt so die mittlere Differenz der relativen Abweichungen. Dieser Wert ist das Chi-Quadrat.
Jetzt gibt es drei Fälle:
1.: Deine Funktion passt gar nicht: Dann wird die Funktion sehr oft weit neben den Messpunkten verlaufen, die einzelnen Differenzen sind weit größer, als die Unsicherheiten. Das Chi-Quadrat wird dann sehr groß.
2.: Die Funktion passt gut: Im Mittel sind die Differenzen [mm] d_i= y_i-Y(t_i) [/mm] genauso groß wie die Unsicherheiten [mm] \sigma_i [/mm] , das heißt, im Mittel ist $ [mm] \frac{d_i}{\sigma_i}\approx [/mm] 1$ , und damit ist auch das Chi-Quadrat ungefähr =1.
3: Die Funktion passt viel zu gut: Die Differenzen sind viel kleiner als die Unsicherheiten, das Chi-Quadrat ist nahe 0. Das kann passieren, weil du die Unsicherheit viel zu groß abgeschätzt hast, oder weil die Funktion zu viele Parameter hat: Wenn du nur zwei Messpunkte hast, kannst du immer Werte für [mm] v_0 [/mm] und a finden, so daß die Funktion exakt durch die Punkte läuft, dann sind alle Differenzen =0.
Holla. Das sollte nur ein kurzer Abriss werden, ist aber doch etwas ausgeartet. Ich hoffe aber, dieser eher handwerkliche Beitrag hilft, das zu verstehen.
|
|
|
|