Linearisierung < Interpol.+Approx. < Numerik < Hochschule < Mathe < Vorhilfe
|
Hallo,
ich muss die folgende Regressionsgleichung linearisieren:
Y(x)=Alpha*e^(bx)
Kann mir hier jemand helfen die lineare Regressionsgleichung aufzustellen? Ich weiß wohl dass man hier den ln verwenden muss. Aber es ist nun doch schon eine Weile her. :-(
Vielen Dank!
|
|
|
|
Hallo,
du benötigst hier Logarithmengesetze.
> Ich weiß wohl dass man
> hier den ln verwenden muss. Aber es ist nun doch schon eine
> Weile her. :-(
Das ist ein bisschen wenig an Eigeninitiative, zumindest meiner Ansicht nach.
Gruß, Diophant
|
|
|
|
|
Gut, dann poste ich mal meine Lösung
ich schreibe: y=a*e^(bx)
Teile durch a
y/a=e^(bx)
Wende den Logarithmus an
ln(y)-ln(a)=bx
Da ich eine Regressionsgleichung etwa in der Form a+bx oder a-bx brauche, ziehe ich den ln(a) auf die andere Seite, ergibt:
ln(y)=ln(a)+bx
wenn y`=ln(y), dann gilt die linearisierte Regressionsgleichung:
y`=ln(a)+bx
Ist das so korrekt?
|
|
|
|
|
Hallo,
> Gut, dann poste ich mal meine Lösung
>
> ich schreibe: y=a*e^(bx)
>
> Teile durch a
>
> y/a=e^(bx)
>
> Wende den Logarithmus an
>
> ln(y)-ln(a)=bx
>
> Da ich eine Regressionsgleichung etwa in der Form a+bx oder
> a-bx brauche, ziehe ich den ln(a) auf die andere Seite,
> ergibt:
>
> ln(y)=ln(a)+bx
>
> wenn y'=ln(y), dann gilt die linearisierte
> Regressionsgleichung:
> y'=ln(a)+bx
>
> Ist das so korrekt?
Ja. Wobei die Divison durch a nicht notwendig war (denn du musst ja das a eh wieder auf die andere Seite bringen):
[mm] y=a*e^{b*x} \gdw
[/mm]
[mm] ln(y)=ln(a*e^{b*x})=ln(a)+ln(e^{b*x})=ln(a)+b*x
[/mm]
Gruß, Diophant
|
|
|
|
|
Danke!
Wenn ich nun a und b bestimmen will, also das konstante Glied a der Regression und den Regressionskoeffizienten b, habe aber nur folgende Daten gegeben:
Jahr Werbeeinnahme
2004 270
2005 330
2006 490
2007 690
Was stellt nun mein x und y dar, um die Werte in die Gleichungen zur Ermittlung der Parameter der Regressionsfunktion einzusetzen? Dazu benötige ich immer ein x und y, hier aber habe ich nur y, also die Werbeeinnahmen. Ich kann ja für x nicht die Jahreszahlen einsetzen. Um den Regressionskoeffizienten b zu bestimmen müsste ich ja dann die Werbeeinnahmen mit den Jahreszahlen multiplizieren und summieren. Aber das macht ja bereits inhaltlich keinen Sinn. Wie kann ich nun vorgehen?
Die Gleichung für das konstante Glied a lautet ja
Mittelwert von y - b* Mittelwert von x. Da die Regressionsgleichung die Entwicklung der Werbeeinnahmen bestimmen soll, müsste ja der Mittelwert von y der Mittelwert aller Werbeinnahmen sein. Aber für den Mittelwert von x kann ich doch nun nicht einfach den Mittelwert der 4 Jahreszahlen nehmen, oder?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:22 Do 29.05.2014 | Autor: | leduart |
Hallo
setze Zeit t=0 für 2004, dann 1, 2, usw dann hast du We(t) als funktion We(0)=270 ...
Gru0 leduart
|
|
|
|
|
Ah, ok, vielen Dank!
D.h. ich könnte für den Parameter a=Mittelwert von y - b*Mittelwert von x schreiben:
Mittelwert von x=(0+1+2+3)/4? Und y sind dann die Werbeinnahmen? also Mittelwert von y=(270+330+490+690)/4?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 18:58 Do 29.05.2014 | Autor: | leduart |
Hallo
bei deiner Geraden ist doch y=ln/We)
Gruß leduart
|
|
|
|
|
Hm, nun bin ich verwirrt. Wie würde ich denn dann die Parameter a und b der Regressionsgleichung mit den vorliegenden Daten berechnen? Ich hätte sie jetzt so, wie sie vorliegen (ohne ln) in die Formeln zur Berechnung von a und b eingesetzt, ausgerechnet und hinterher entsprechend des linearisierten Regressionsmodells eingesetzt. Erst wenn ich dann zB die Werbeeinnahmen für ein anderes Jahr, zB 2020 berechnen will müsste ich das linearisierte Modell heranziehen. Oder schon für die Berechnung der Parameter?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 20:17 Do 29.05.2014 | Autor: | leduart |
hallo
wie willst du denn eine Regressionsgerade ohne ddas ln bestimmen? du kannst natürlich deine Werte in die exp funktion einsetzen, aber ich dachte du wolltest eine lineare Regression. Wenn du a und b hast kannst du die exp. funktion verwenden um andere Werte auszurechnen,
Gruß leduart
|
|
|
|
|
Genau. Also mit der linearisierten Funktion möchte/kann ich für bestimmte Jahre die Werbeeinnahmen bestimmen/prognostizieren. Dafür fehlen mir ja noch das konstante Glied a und der Regressionskoeffizient b. Dafür habe ich ja die Werte für 4 Jahre. Meine Frage ist nun, wie ich damit a und b bestimme. Ich weiß ja zB dass ich a bestimmen kann mit der Formel: a=y_quer-b*x_quer.
Was ist aber nun y_quer und x_quer? Ist das nicht Mittelwert von x=(0+1+2+3)/4? Und Mittelwert von y=(270+330+490+690)/4?
Dann müsste ich mit der Formel für b noch b bestimmen und in a einsetzen. Dann hätte ich a und b. Und dann müsste ich nur noch den ln von a nehmen und kann es in die linearisierte Funktion einsetzen. Sehe ich das falsch?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:32 Fr 30.05.2014 | Autor: | leduart |
Hallo
sieh dir mal das hier an
http://de.wikipedia.org/wiki/Lineare_Regression
dabei sind deine y die lnW und deine x die Zeit.
Gruß leduart
|
|
|
|
|
Hallo,
dann würde ich nun so rechnen:
Meine linearisierte Regressionsgleichung lautet ja:
ln(y)=ln(a)+b*x
Meine Daten lauten
Jahr Werbeeinnahme
2004 270
2005 330
2006 490
2007 690
Ich möchte die Werbeeinnahmen für 2010 schätzen.
Ich habe noch gegeben die Formel für den Regressionskoeffizienten b:
[mm] \bruch{K(\summe_kxy)-(\summe_kx)(\summe_ky)}{K(\summe_kx^{2})-(\summe_kx)^{2}}
[/mm]
Die Formel für das konstante Glied lautet
Mittelwert von y - b * Mittelwert von x
Meine x-Werte sind ja meine t-Werte, also
Jahr t
2004 0
2005 1
2006 2
2007 3
Meine y-Werte sind ja meine ln(y)-Werte also
Werbeeinnahme ln(WE) bzw ln(y)
270 5,6
330 5,8
490 6,2
690 6,5
Für b brauche ich ja noch die Summe von x*y, also zB 0*5,6+...+3*6,5 usw. Die Summe ergibt 37,7
FÜr b brauche ich außerdem noch die Summe aller x (also 0+1+2+3=6) und die Summe aller y (also 5,6+...+6,5=24,1)
Außerdem noch die Summe aller [mm] x^{2}, [/mm] also [mm] 0^{2}+...+3^{2}=9 [/mm] und das Quadrat der Summe aller x, also 36.
Mit K=4 bekomme ich dann für b:
(4*37,7-6*24,1)/(4*14-36)=0,067
Und für das konstante Glied a dann:
6,025-0,067*1,5=5,924
Um die Probe für das Jahr 2007, also t=3 zu machen setze ich ein:
ln(5,924)+0,067*3=1,98
Und das ergibt leider nicht 690 :-(
Wo ist der Fehler? Vielen Dank im Voraus für die Hilfe!
|
|
|
|
|
Hallo Englein89,
> Hallo,
> dann würde ich nun so rechnen:
>
> Meine linearisierte Regressionsgleichung lautet ja:
>
> ln(y)=ln(a)+b*x
>
> Meine Daten lauten
>
> Jahr Werbeeinnahme
> 2004 270
> 2005 330
> 2006 490
> 2007 690
>
> Ich möchte die Werbeeinnahmen für 2010 schätzen.
>
> Ich habe noch gegeben die Formel für den
> Regressionskoeffizienten b:
>
> [mm]\bruch{K(\summe_kxy)-(\summe_kx)(\summe_ky)}{K(\summe_kx^{2})-(\summe_kx)^{2}}[/mm]
>
> Die Formel für das konstante Glied lautet
>
> Mittelwert von y - b * Mittelwert von x
>
>
> Meine x-Werte sind ja meine t-Werte, also
>
> Jahr t
> 2004 0
> 2005 1
> 2006 2
> 2007 3
>
> Meine y-Werte sind ja meine ln(y)-Werte also
>
> Werbeeinnahme ln(WE) bzw ln(y)
> 270 5,6
> 330 5,8
> 490 6,2
> 690 6,5
>
> Für b brauche ich ja noch die Summe von x*y, also zB
> 0*5,6+...+3*6,5 usw. Die Summe ergibt 37,7
>
> FÜr b brauche ich außerdem noch die Summe aller x (also
> 0+1+2+3=6) und die Summe aller y (also 5,6+...+6,5=24,1)
>
> Außerdem noch die Summe aller [mm]x^{2},[/mm] also
> [mm]0^{2}+...+3^{2}=9[/mm] und das Quadrat der Summe aller x, also
> 36.
>
> Mit K=4 bekomme ich dann für b:
>
> (4*37,7-6*24,1)/(4*14-36)=0,067
>
Diesen Wert musst Du nochmal nachrechnen.
> Und für das konstante Glied a dann:
>
> 6,025-0,067*1,5=5,924
>
> Um die Probe für das Jahr 2007, also t=3 zu machen setze
> ich ein:
>
> ln(5,924)+0,067*3=1,98
>
> Und das ergibt leider nicht 690 :-(
>
> Wo ist der Fehler? Vielen Dank im Voraus für die Hilfe!
Rechne zunächst mit den exakten Werten,
und runde dann das Endergebnis.
Ansonsten schleichen sich hier Fehler ein.
Gruss
MathePower
|
|
|
|
|
Hallo,
da es sich hierbei um eine alte Klausuraufgabe meiner Uni handelt, bin ich leider dazu angehalten mit den gerundeten Werten zu rechnen, wenn der Rechenweg denn so stimmt. Ich könnte natürlich auf 2 oder 3 Nachkommastellen runden, aber ob das zu deutlich besseren Ergebnissen führt? Ich bin ja mit meiner Lösung extrem weit vom echten Wert entfernt.
Ich habe es auch nochmal so versucht, dass ich erst mit den absoluten Werten gerechnet habe, also ohne den ln der Werbeeinnahmen zu nehmen. D.h.:
[4*[(0*270)+(1*330)+(2*490)+(3*690)]-6*1780] / 4*14-36
1780 ist dabei die Summe der Werbeeinnahmen
14 die Summe der [mm] x^2 [/mm] und 36 das Quadrat der Summe der x
dann bekomme ich b=142
Dann bekomme ich für a: 445-142*1,5= 658
445 ist der Mittelwert der Werbeeinnahmen, 1,5 der Mittelwert der Jahre mit t=0,1,2,3
Dann habe ich den ln(a) genommen, also ist a=6,49
Die Regression lautet dann
ln(y)=6,49+142*t
aber auch hier: Wenn ich nun für t=1 (also für das Jahr 2005) eingebe bekomme ich ln(y)=148,49. Wenn ich delogarithmiere komme ich auch nicht annähernd auf die Werbeinnahmen im Datensatz.
Mich wundert das alles doch sehr.
|
|
|
|
|
Hallo Englein89,
> Hallo,
> da es sich hierbei um eine alte Klausuraufgabe meiner Uni
> handelt, bin ich leider dazu angehalten mit den gerundeten
> Werten zu rechnen, wenn der Rechenweg denn so stimmt. Ich
> könnte natürlich auf 2 oder 3 Nachkommastellen runden,
> aber ob das zu deutlich besseren Ergebnissen führt? Ich
> bin ja mit meiner Lösung extrem weit vom echten Wert
> entfernt.
>
Ok.
> Ich habe es auch nochmal so versucht, dass ich erst mit den
> absoluten Werten gerechnet habe, also ohne den ln der
> Werbeeinnahmen zu nehmen. D.h.:
>
Dein erster Versuch war bis auf den Rechenfehler,
den ich bemängelt habe, in Ordnung.
> [4*[(0*270)+(1*330)+(2*490)+(3*690)]-6*1780] / 4*14-36
>
> 1780 ist dabei die Summe der Werbeeinnahmen
> 14 die Summe der [mm]x^2[/mm] und 36 das Quadrat der Summe der x
>
> dann bekomme ich b=142
>
> Dann bekomme ich für a: 445-142*1,5= 658
>
> 445 ist der Mittelwert der Werbeeinnahmen, 1,5 der
> Mittelwert der Jahre mit t=0,1,2,3
>
> Dann habe ich den ln(a) genommen, also ist a=6,49
>
> Die Regression lautet dann
>
> ln(y)=6,49+142*t
>
> aber auch hier: Wenn ich nun für t=1 (also für das Jahr
> 2005) eingebe bekomme ich ln(y)=148,49. Wenn ich
> delogarithmiere komme ich auch nicht annähernd auf die
> Werbeinnahmen im Datensatz.
>
> Mich wundert das alles doch sehr.
Gruss
MatherPower
|
|
|
|
|
Hallo,
aber mit Rechenfehler meinst du "nur" das Runden? Oder habe ich tatsächlich in der Formel etwas übersehen?
|
|
|
|
|
Hallo Englein89,
> Hallo,
> aber mit Rechenfehler meinst du "nur" das Runden? Oder
> habe ich tatsächlich in der Formel etwas übersehen?
Nein.
Der Rechenfehler ist bei der Berechnung von "b" passiert.
Gruss
MathePower
|
|
|
|
|
Oh, ja. Vielen Dank für den Hinweis.
Für b habe ich nun
(4*37,7-6*24,1) / (4*14-36) = 6,2/20=0,31
und a dann
6,025-0,31*1,5 = 5,56
und dann der ln(a)=1,72
Meine Regression lautet dann
ln(y)=1,72+0,31*x
Für x=3 (also 2007) bekomme ich dann aber wieder y=14,15 und das ist meilenweit entfernt von 690. :-(
|
|
|
|
|
Hallo Englein89,
> Oh, ja. Vielen Dank für den Hinweis.
>
> Für b habe ich nun
>
> (4*37,7-6*24,1) / (4*14-36) = 6,2/20=0,31
>
> und a dann
>
> 6,025-0,31*1,5 = 5,56
>
Das ist doch der Wert für ln(a).
> und dann der ln(a)=1,72
>
> Meine Regression lautet dann
>
> ln(y)=1,72+0,31*x
>
Hier muss es dann lauten:
[mm]ln(y)=\blue{5,56}+0,31*x [/mm]
> Für x=3 (also 2007) bekomme ich dann aber wieder y=14,15
> und das ist meilenweit entfernt von 690. :-(
Gruss
MathePower
|
|
|
|
|
Danke!
Zwei Fragen habe ich nun aber noch:
Wieso rechne ich nicht die ganze Zeit mit den Werten der Werbeinnahmen, wie sie in der Ausgangsdatentabelle stehen (um a und b zu bestimmen) und logarithmiere DANN den Wert, den ich für a bekomme um ihn in die linearisierte Regressionsgleichung einzusetzen?
Und wenn ich dann y bestimmen will, wieso kann ich nur ln(y) bestimmen und nicht y indem ich ln(y) und ln(a) mit exp wieder delogarithmiere?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 16:32 Di 03.06.2014 | Autor: | leduart |
Hallo Englein
nochmal von vorn:
Du hast werte x bzw Zeit t und Werte y bzw Werteeinnahmen.
normalerweise wäre der erste Schritt x gegen y aufzutragen und eine Kurve durch die Werte zu legen, dann gibt es mehrere Möglichkeiten:
a) die Punkte liegen etwa auf einer Geraden dann legst du diese Gerade möglichst gut durch die Punkte und bestimmst so in y=ax+b a und b aus Steigung und y Abschnitt. Damit du das möglichst gut machst gibt es die formeln für die lineare Regression.
b) die Kurven ligen auf einer Parabel [mm] y=ax^2+b [/mm] wenn du dann [mm] x^2=z [/mm] setzest hast du wieder eine Gerade y=az+b und kannst wie in a) vorgehen um a und b zu bestimmen, in der Zeichnung müsstest du dann alle deine x Werte erst quadrieren, dann gegen y auftragen und kannst wieder die Gerade etwa zeichnen oder genauer mit Regression berechnen,
c) die Kurve sieht aus wie eine efkt, oder jemand sagt dir es soll eine sein. also [mm] y=ae^{bt}
[/mm]
wenn alle deine Werte genau auf dieser Funktion lägen könntest du einfach 2 Wertepaare einsetzen und so a und b bestimmen. da die Werte aber nicht genau darauf liegen, und es schwer ist eine efkt durch die Punkte zu legen machst du wieder eine Gerade daraus
lny=ln(a)*b*t
mit lny=z, lna=a' hast du aber wieder eine Gerade
z=a'+bt wieder kannst du indem du lny gegen t aufträgst nachprüfen ob es wirklich etwa eine Gerade ist, wenn ja, findest du die best mögliche mit der lin. Regression
aus der kannst du dann b und a' ablesen, dann kannst du [mm] e^{a‘}=a [/mm] finden und b hast du und damit mit die beste fkt [mm] y=a*e^{bt}
[/mm]
wenn du mit den Werten der Ausgangstabelle rechnest kannst du nur 2 Werte verwenden um a und b zu bestimmen, deine gefundene fkt ist dann an den 2 Stellen exakt, kann aber an den anderen doch abweichen, ist also nicht die beste
die beste muss an alle Messpunkten nicht exakt sein, aber sie ist insgesamt besser als jede andere,
Versuch mal, was du tust jeweils auch in Graphiken zu machen, dann iehst du, dass es dir schwerfällt eine vernünftige e fkt mitten durch deine Punkte zu ziehen, aber leicht eine Gerade die gut dazwischen durchläuft, wenn du den lny aufträgst statt y. damit kannst du auch dein Verfahren auf grobe Fehler überprüfen und 4 Punkte einzeichnen geht ja schnell, für mehr punkte dann EXEl
Gruß leduart
|
|
|
|
|
Hervorragend, vielen Dank!!
Jetzt ist mir auch klar, warum ich die ln(y)-Werte zur Bestimmung von a' und b verwenden muss.
Aber: wenn ich nun den a'-Wert delogarithmiere, erhalte ich ja a. Und b liegt mir ja vor. Kann ich dann für den Wert, den ich für t einsetze dann sagen, dass das Ergebnis y ist oder ln(y)? Lautet die Gleichung nach delogarithmieren von a' also
z=a+bt oder
y=a+bt?
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 22:48 Di 03.06.2014 | Autor: | leduart |
Hallo
wenn du die Funktion y= [mm] a*e^{b*t} [/mm] mit dem gefundenen [mm] a=e^{a'} [/mm] verwendest kannst du zu einem t y direkt ausrechnen, sonst rechnest du lny=a'+bt und dann [mm] y=e^{lny}
[/mm]
Gruss leduart
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:21 Mi 04.06.2014 | Autor: | Englein89 |
Vielen Dank an alle Antwortenden!
|
|
|
|
|
Ich stecke leider noch an einer weiteren Linearisierung fest. Vllt kann mir hierzu jemand noch auf die Sprünge helfen?
Y=M-a*e^(-b*w)
Ich stelle um
Y-M=-a*e^(-b*w) also
a*e^(-b*w)=M-Y
ln(a*e^(-b*w))=ln(M-Y)
Dann kann ich sagen, dass für die linearisierte Regressionsgleichung gilt: Y`=ln(M-Y)
Aber was ist nun mit der linken Seite?
Ich kann noch umschreiben zu
ln(a)+ln(e^(-b*w)) also
ln(a)-b*w
Ist das dann in der Regressionsgleichung mein a', sodass gilt=
Y'=a' -bw mit
Y`=ln(M-Y) und a'=ln(a)?
Besten Dank!
|
|
|
|
|
Status: |
(Antwort) fertig | Datum: | 15:24 Do 29.05.2014 | Autor: | leduart |
Hallo
ja, richtig
|
|
|
|