www.vorhilfe.de
- Förderverein -
Der Förderverein.

Gemeinnütziger Verein zur Finanzierung des Projekts Vorhilfe.de.
Hallo Gast!einloggen | registrieren ]
Startseite · Mitglieder · Impressum
Forenbaum
^ Forenbaum
Status VH e.V.
  Status Vereinsforum

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Suchen
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Statistik (Anwendungen)" - Test auf Lognormal-Vert.
Test auf Lognormal-Vert. < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Test auf Lognormal-Vert.: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 17:12 Di 08.01.2019
Autor: Thomas_Aut

Hallo,

ich würde gerne an einen relativ großen Datensatz (ca. 100.000 Einträge) eine Verteilung anpassen.

Wünschenswert wäre, wenn es sich um eine Lognormalverteilung handelt (der Grund hierfür: in Versicherungen arbeitet man oft mit einem Standardmodell, das von lognormalverteilten Schadenshöhen ausgeht).

Als erstes habe ich mir in R einen QQ-Plot angesehen - Datensatz gegen Lognormalverteilung.

Das sieht alles andere als Lognormalverteilt aus.... statistische Tests (z.B. Cramer-Mises-Test) verwerfen aber nicht die Hypothese, dass die Daten normalverteilt sind.

Was würdet ihr sagen?


LG

Thomas

PS: im Anhang der Screenshot vom QQ Plot.

QQ-Plot

Dateianhänge:
Anhang Nr. 1 (Typ: PNG) [nicht öffentlich]
        
Bezug
Test auf Lognormal-Vert.: Antwort
Status: (Antwort) fertig Status 
Datum: 17:02 Mi 09.01.2019
Autor: luis52

Moin, ich kann nicht erkennen, wie dein Plot entstanden ist. Aber versuch es doch einmal so: Logarithmiere die Daten und verwende qqnorm() bzw. teste mit mit einem Shapiro-Wilk-Test, ?shapiro.test.



Bezug
                
Bezug
Test auf Lognormal-Vert.: Frage (überfällig)
Status: (Frage) überfällig Status 
Datum: 23:08 Sa 12.01.2019
Autor: Thomas_Aut

Hallo Luis und danke für die Antwort.

Es ist folgender Sachverhalt:

Es wäre sehr wünschenswert, wenn die Lognormalverteilung am besten passen würde (egal, ob sie nun wirklich gut passt).

Was meinst du dazu, wenn ich mir beim Verteilungsfit jeweils die LogLikelihood ausgeben lasse und jene Verteilung als am Besten ansehe, die die größe Likelihood hat?


Wenn ich einen sehr großen Datensatz habe (z.B. 100000 Daten) und davon sind einige sehr groß - sagen wir 300 Datenpunkte sind zwischen 100000 und 1000000 -- 99800 sind allerdings zwischen 0,01 und 99999 ...

meinst du es ist sinnvoll den Datensatz zu teilen? Gäbe es eine vernünftige Grenze, dass z.B. auf kleine Cluster dieses Datensatzes verschiedene Lognormalverteilungen passen?

LG und Dank

Thomas

Bezug
                        
Bezug
Test auf Lognormal-Vert.: Fälligkeit abgelaufen
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 23:20 Mo 14.01.2019
Autor: matux

$MATUXTEXT(ueberfaellige_frage)
Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
ev.vorhilfe.de
[ Startseite | Mitglieder | Impressum ]