www.vorhilfe.de
- Förderverein -
Der Förderverein.

Gemeinnütziger Verein zur Finanzierung des Projekts Vorhilfe.de.
Hallo Gast!einloggen | registrieren ]
Startseite · Mitglieder · Impressum
Forenbaum
^ Forenbaum
Status VH e.V.
  Status Vereinsforum

Gezeigt werden alle Foren bis zur Tiefe 2

Navigation
 Startseite...
 Suchen
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Statistik (Anwendungen)" - Verbesserung von Prognosedaten
Verbesserung von Prognosedaten < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Verbesserung von Prognosedaten: Hilfestellung, Tipp, Idee
Status: (Frage) für Interessierte Status 
Datum: 22:27 Mi 16.07.2014
Autor: Marcel08

Aufgabe
In dieser Aufgabe würde ich gerne versuchen, den Gasenergieverbrauch möglichst exakt zu prognostizieren. Zur besseren Veranschaulichung stelle ich einen exemplarischen Datensatz in einem Excel-Sheet zur Verfügung:

- Es soll der Gasverbrauch im Tagesraster einen Monat im Voraus möglichst genau prognostiziert werden, d.h. die tatsächlichen Prognosewerte liegen erst nach einem Monat vor. (Spalte B)

- Außerdem soll ein Algorithmus die Plausibilität der Prognosedaten bestimmen (0=nicht plausibel, 1=plausibel) und bei vorliegender Plausibilität den jeweiligen Wert in die Prognosereihe übernehmen. Der im Sheet bereits implementierte Algorithmus ist sicherlich noch verbesserungswürdig.

Folgende Inputs stehen zur Verfügung:

- die Gasverbrauchsdaten der Vergangenheit (Daten des jeweils gestrigen Tages, Spalte C)

- Gasverbrauchsdaten die nuf auf Wetterdaten basieren (Spalte E)

- Temperaturmittelwerte (Spalte G)

- Gasverbrauchsdaten einer weiteren Verbrauchergruppe mit ähnlichen Verbrauchsverhalten der Vergangenheit(Daten des jeweils gestrigen Tages, Spalte F)

Hallo zusammen!

Um möglichst gute Prognosen zu erhalten, würde ich gerne versuchen, möglichst viele Inputkategorien miteinfließen zu lassen. Allerdings habe ich Schwierigkeiten, einen geeigneten Ansatz zur Lösung des Problems zu finden. Gerne würde ich euch daher um eure Hilfe bitten. Hätte zunächst jemand vielleicht eine Idee, wie man die Prognosedaten noch exakter an die tatsächlichen Verbräuche annähern kann? Welche Methoden oder Verfahren wären dazu geeignet? Über hilfreiche Ideen und Ansätze würde ich mich sehr freuen; vielen Dank!

Viele Grüße, Marcel


[a]Datei-Anhang

Dateianhänge:
Anhang Nr. 1 (Typ: xlsx) [nicht öffentlich]
        
Bezug
Verbesserung von Prognosedaten: Hilfestellung, Tipp, Idee
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:18 Sa 19.07.2014
Autor: Marcel08

Aufgabe
Aufgabe ist es, den tatsächlichen Gasverbrauch eines fiktiven Energieversorgers (Spalte B) möglichst exakt zu prognostizieren. Folgende Rahmenbedingungen liegen dabei zugrunde (vgl. dazu stets die fiktiven Angaben im beigefügten [a]Excel-Sheet.

- Dabei liegen u.a. 5 Datensätze vor (Spalten D bis H). Jeder dieser 5 Datensätze enthält Prognosedaten, die jeweils auf eine andere Art und Weise ermittelt worden sind und daher i.d.R. mehr oder weniger stark voneinander abweichen.

- Um die Aufgabe zu erfüllen, soll nun ein logisches Kriterium gefunden werden, welches für jeden einzelnen Tag den jeweils besten Prognosewert aus den 5 möglichen Werten (Spalten D bis H) herausfiltert und in einer optimalen Prognosereihe ablegt.

- Dabei ist immer derjenige Prognosewert der beste, welcher zum tatsächlichen Ist-Wert (Spalte B) die kleinste durchschnittliche absolute Abweichung aufweist.

- Das grundlegende Problem dabei ist, dass die tatsächlichen Ist-Werte (Spalte B) zum Zeitpunkt der Prognoseerstellung nicht vorhanden sind.

- Weitere vorhandene Daten sind insbesondere die mittleren Temperaturen des jeweiligen Tages. (Spalte J)

Hallo zusammen!

Zunächst einmal möchte ich euch an meinen bisherigen Überlegungen teilhaben lassen. Ich bin erst einmal wie folgt vorgegangen:



Herleitung eines logischen Kriteriums auf Basis der tatsächlichen Ist-Werte, die in Wirklichkeit nicht vorliegen; alles was im Sheet blau ist, bezieht sich auf diese Überlegungen

- Um das Problem erst einmal gedanklich zu greifen, habe ich in einem ersten Schritt eine Formel entwickelt, welche mir aus den 5 Datensätzen den für den jeweils betrachteten Tag besten Wert herausfiltert und in einer optimalen Prognosereihe (Spalte P) ablegt. Dabei messe ich die jeweiligen Werte jedoch immer an den tatsächlichen Werten, die ja in der Realität nicht vorhanden sind. Der Excel-Befehl lautet dabei exemplarisch für die Spalte 4:


=WENN(ABS(B4-D4)=MIN(ABS(B4-D4);ABS(B4-E4);ABS(B4-F4);ABS(B4-G4);ABS(B4-H4));D4;0)
Wenn also die absolute Abweichung des Wertes der Spalte D zum Ist-Wert der Spalte B im Vergleich zu allen anderen Differenzen die kleinste ist so übernehme den D-Wert oder gib andernfalls eine 0 zurück.


Dies habe ich auch für alle anderen Reihen gemacht. Es ensteht als eine Art "5x30"-Matrix. (Spalten K bis O)

- Von der resultierenden "5x30-Matrix" (Spalten K bis O) habe ich dann jeweils die Zeilensumme gebildet. Dies auch für alle anderen Zeilen gemacht, erhält man dann die optimale Prognosereihe (Spalte P), die fälschlicherweise jedoch auf den tatsächliche Ist-Werten basiert, die - wie bereits gesagt - in der Realität nicht vorhanden sind.

- Ich habe dann drei Prognosereihen in einem Diagramm visualisiert: 1. Die Reihe der tatsächlichen Ist-Werte, die berechnete optimale Prognosereihe und exemplarisch eine der 5 ursprünglichen Prognosereihen. Wie erwartet liegt die optimale Prognosereihe dabei immer in einem Korridor, dessen Grenzen von der Ist-Reihe einerseits und der exemplarischen Prognosereihe andererseits gebildet wird.

- Das grundlegende Problem dürfte damit erst einmal verstanden worden sein.


Herleitung eines logischen Kriteriums ohne Rückgriff auf die tatsächlichen Ist-Werte (eigentliche Aufgabe)

Jetzt würde ich gerne eine optimale Prognosereihe finden, ohne dabei auf die tatsächlichen Ist-Werte zurückgreifen zu müssen und überlege gerade, wie ich das am besten anstelle. Dazu habe ich mir bisher folgendes überlegt:

- Ich habe ja u.a. auch Temperaturdaten vorliegen. Wenn man die Ist-Werte in einer Graphik mit den Temperaturwerten vergleicht so wird sofort eine enge Korrelation sichtbar: Mit steigender Temperatur sinkt der Gasverbrauch; die Umkehrung gilt analog. Außerdem lässt sich schnell zeigen, dass auch die Prognosegenauigkeit von der Temperatur abhängt: So steigt der Prognosefehler mit steigender Temperatur und umgekehrt. Dies würde jetzt einfach mal auf die thermodynamischen Prozesse zurückführen, die sich in einem Gasrohr abspielen. Lange Rede kurzer Sinn: Offenbar macht es Sinn, die Temperaturdaten in irgendeiner Weise mit in das zu findende Kriterium miteinzubauen.

- Diesbezüglich habe ich mir überlegt, eine Sensitivitätsanalyse durchzuführen, die mir eine quantitative Beziehung zwischen der prozentualen Änderung des Gasverbrauches einerseits sowie der prozentualen Temperaturänderung andererseits liefert. Konkret könnte ich dann ggf. die folgende Frage beantworten: Um wie viel Prozent steigt der Gasverbrauch, wenn sich die Temperatur um x Prozent ändert und umgekehrt. Sollte in etwa eine lineare Beziehung vorliegen, so hätte man einen Proportionalitätsfaktor, bspw: Sinkt die Temperatur um 10%, so steigt der Gasverbrauch um 50%. In diesem Fall wäre der Proportionalitätsfaktor 5. Diesen würde ich dann quasi als Fehlertoleranzgrenze mit in das Kriterium einbauen.

- Bevor ich jedoch damit beginne und groß herumrechne, würde ich sehr gerne auch einmal andere Ideen und Anregungen sammeln, die vielleicht sinnvoller wären und die ich bisher noch nicht in Betracht gezogen habe. Vielleicht haben ja einige Statistik-Cracks in diesem Forum schon an ähnlichen Aufgaben gearbeitet und würden mich freundlicherweise an Ihrem Erfahrungsschatz teilhaben lassen.


Für hilfreiche und zielführende Antworten bedanke ich mich jedoch schon einmal recht herzlich im Voraus.


Viele Grüße, Marcel

Dateianhänge:
Anhang Nr. 1 (Typ: xlsx) [nicht öffentlich]
Bezug
        
Bezug
Verbesserung von Prognosedaten: Hilfestellung, Tipp, Idee
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 01:53 So 20.07.2014
Autor: Marcel08

Hallo zusammen!

Ich versuche zurzeit eine funktionale Beziehung zwischen Gasverbrauchs- und Temperaturänderungen herzuleiten. Dazu liegen mir im beigefügten [a]Excel-Sheet die folgenden Daten vor:

- 1 Datensatz mit absoluten Verbrauchswerten

- 1 Datensatz mit absoluten Temperaturwerten


Daraus habe ich zunächst für beide Datensätze jeweils die prozentuale Änderung bezüglich eines beliebigen Punktes in der Datenreihe berechnet. Die jeweiligen prozentualen Änderungen habe ich dann in einem Diagramm abgetragen (vgl. die beigefügte Abbildung).

Sensitivitätsanalyse.


Sinkt also beispielsweise die Temperatur um 19%, so steigt der Gasverbrauch um etwa 200%.

Steigt die Temperatur um etwa 50%, so sinkt der Gasverbrauch um etwa 20%.


Meine Fragen:

- Stimmt das überhaupt, was ich bisher gemacht habe?

- Wenn ja, wie kann ich nun eine Funktionsvorschrift gewinnen, um sämtliche Punkte in einer Funktion zu vereinen und einen quantitativen Zusammenhang zu erreichen? Lässt sich das Problem gar linear annähern?


Vielen Dank für eure Mitwirkung.

Gruß, Marcel

Dateianhänge:
Anhang Nr. 1 (Typ: xlsx) [nicht öffentlich]
Anhang Nr. 2 (Typ: JPG) [nicht öffentlich]
Bezug
                
Bezug
Verbesserung von Prognosedaten: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 20:59 So 20.07.2014
Autor: abakus


> Hallo zusammen!

>

> Ich versuche zurzeit eine funktionale Beziehung zwischen
> Gasverbrauchs- und Temperaturänderungen herzuleiten. Dazu
> liegen mir im beigefügten [a]Excel-Sheet
> die folgenden Daten vor:

>

> - 1 Datensatz mit absoluten Verbrauchswerten

>

> - 1 Datensatz mit absoluten Temperaturwerten

>
>

> Daraus habe ich zunächst für beide Datensätze jeweils
> die prozentuale Änderung bezüglich eines beliebigen
> Punktes in der Datenreihe berechnet. Die jeweiligen
> prozentualen Änderungen habe ich dann in einem Diagramm
> abgetragen (vgl. die beigefügte Abbildung).

>

> Sensitivitätsanalyse.

>
>

> Sinkt also beispielsweise die Temperatur um 19%, so steigt
> der Gasverbrauch um etwa 200%.

>

> Steigt die Temperatur um etwa 50%, so sinkt der
> Gasverbrauch um etwa 20%.

Hallo,
was ist denn dein Bezugspunkt für "Steigerung der Temperatur um 19%?
Etwa die Celsiustemperatur? Da bin ich aber gespannt, wie du Temperaturänderungen zwischen positiven und negativen Temperaturen realisieren willst.
Gruß Abakus
>
>

> Meine Fragen:

>

> - Stimmt das überhaupt, was ich bisher gemacht habe?

>

> - Wenn ja, wie kann ich nun eine Funktionsvorschrift
> gewinnen, um sämtliche Punkte in einer Funktion zu
> vereinen und einen quantitativen Zusammenhang zu erreichen?
> Lässt sich das Problem gar linear annähern?

>
>

> Vielen Dank für eure Mitwirkung.

>

> Gruß, Marcel

Bezug
                        
Bezug
Verbesserung von Prognosedaten: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 22:02 Di 22.07.2014
Autor: Marcel08

Hallo abakus,

die Sache mit der Sensitivitätsanalyse habe ich ohne schon verworfen, da mich das nicht wirklich weiterbringt. Die funktionale Beziehung, die ich mir dadurch erhofft habe, dürfte schon als Grundlage für die Erhebung der Prognosedaten auf Wetterdatenbasis in das Problem miteingegangen sein.


Viele Grüße, Marcel

Bezug
        
Bezug
Verbesserung von Prognosedaten: Datei in älterem Excel-Format
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 20:51 So 20.07.2014
Autor: Marcel08

Da es offenbar zu Problem mit neuen Excel-Versionen kommt, lade ich die entsprechenden Dokumente noch einmal in einer älteren Excel-Version hoch. Vielen Dank für euer Interesse.

[a]Ausgangsdaten

[a]Sensitivitätsanalyse

Dateianhänge:
Anhang Nr. 1 (Typ: xls) [nicht öffentlich]
Anhang Nr. 2 (Typ: xls) [nicht öffentlich]
Bezug
        
Bezug
Verbesserung von Prognosedaten: SLP-Allokationsgüte anheben
Status: (Frage) für Interessierte Status 
Datum: 21:57 Di 22.07.2014
Autor: Marcel08

Hallo zusammen!

Anbei versuche ich nochmal, das Problem etwas präziser zu formulieren: Im Kern geht es um die Optimierung der SLP-Allokationsgüte zur Minimierung von Restlasten im Gasversorgungsbereich eben durch das Finden eines Excel-Kriteriums. Dieses soll nach Möglichkeit für jeden Tag immer genau diejenige Prognosespalte (aus den Spalten D bis H) auswählen, dessen entsprechender Wert eben die kleinste durchschnittliche absolute Abweichung zum tatsächlichen Gasverbrauch (Spalte B) hat. Das Problem dabei ist jedoch, dass man bei der Entwicklung eines Kriteriums nicht auf die tatsächlichen Verbrauchsdaten (Spalte B) zurückgreifen kann, da diese in der Realität wohl erst etwa einen Monat im Nachhinein verfügbar sind. Da es offenbar jedoch einen signifikanten Zusammenhang zwischen dem Gasverbrauch und der Temperatur gibt, dürfte der Weg wohl nur über eine gründliche Analyse der Temperaturdaten zu beschreiten sein. Näheres zu diesem Thema liest sich beispielsweise auf den Seiten 9 und 10 der folgenden []PDF-Datei.

Eine zu den Seiten 9 und 10 passende Darstellung habe ich auf Grundlage der Datensätze auf dem [a][Dateianhang Nr. 1 (fehlt/gelöscht)] unter „Visualisierung“ eingefügt: Es sollen die Abstände zwischen den aufgeführten Graphen möglichst reduziert werden, ohne dass man jedoch die Daten der Spalte B verwenden kann, da diese heute noch gar nicht zur Verfügung stehen. Mit Hilfe der Spalte B könnte man aber vielleicht am Ende die Qualität einer gefundenen Auswahlbedingung testen.

Mich würde sehr interessieren, wie bzw. ob man dieses Problem überhaupt strukturiert angehen kann. Dazu habe ich leider bisher noch keine zündende Idee gehabt. Vielleicht hat jemand von euch schon einmal etwas ähnliches gemacht. Ich hoffe jedenfalls, dass das Problem damit etwas klarer geworden ist und danke euch noch einmal recht herzlich für eurer Engagement.


Viele Grüße, Marcel

Bezug
                
Bezug
Verbesserung von Prognosedaten: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 21:46 Do 24.07.2014
Autor: Marcel08

Eine Beantwortung an dieser Stelle ist nicht mehr notwendig. Ich habe das Problem nochmal im Forumbsbereich Operations Research in einer vereinfachten und übersichtlicheren Form gepostet. Vielen Dank!

Bezug
                        
Bezug
Verbesserung von Prognosedaten: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 22:05 Do 24.07.2014
Autor: Diophant

Hallo,

wie oft soll man es denn noch wiederholen:

- Gleiches Problem: gleicher Thread
- Neues Problem: neuer Thread

Auf ein erneutes Aneinanderfügen verzichte ich aus technischen Gründen an dieser Stelle, nicht jedoch ohne meiner Verwunderung über die Hartnäckigkeit Ausdruck zu verleihen, mit der hier Bitten eines Moderators ignoriert wurden.

Sieht so aus, als hätte hier bald jeder seine eigenen Regeln...

Gruß, Diophant

Bezug
                                
Bezug
Verbesserung von Prognosedaten: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 16:17 Fr 25.07.2014
Autor: Marcel08

Hallo


> Hallo,
>  
> wie oft soll man es denn noch wiederholen:
>  
> - Gleiches Problem: gleicher Thread
>  - Neues Problem: neuer Thread


Diese Frage stelle ich mir auch immer wieder:

Ich habe ganz bewusst das auf den wesentlichen Kern reduzierte Problem in einem neuen Thread angesetzt, weil es einfach überhaupt keinen Sinn macht, einen Diskussionsneustart in einem völlig überfrachteten Thread zu starten. Es ist dem interessierten Leser schlicht und ergreifend nicht zuzumuten, sich zunächst in einem Wust von aneinandergereihten überarbeiteten Fragestellungen zurechtzufinden, aus dem bisher ohnehin keine neuen Erkenntnisse hervorgegangen sind.

Keine Reaktionen auf eine komplexe Fragestellung --> Thread auslaufen lassen --> überarbeitete sowie inhaltlich reduzierte Fragestellung in einem neuen Thread posten --> geringere Orientierungsschwierigkeiten für den Leser durch Wegall redundanter Informationen --> Steigerung der Wahrscheinlichkeit produktiver Beiträge durch interessierte Forenmitglieder


> Auf ein erneutes Aneinanderfügen verzichte ich aus
> technischen Gründen an dieser Stelle, nicht jedoch ohne
> meiner Verwunderung über die Hartnäckigkeit Ausdruck zu
> verleihen, mit der hier Bitten eines Moderators ignoriert
> wurden.


Dies betrifft meine Verwunderung über die Hartnäckigkeit, mit der hier Überlegungen eines Fragenstellers ignoriert werden nicht minder.


> Sieht so aus, als hätte hier bald jeder seine eigenen
> Regeln...


Das ist alles eine Frage der Perspektive. Bitte um Rückversetzung meines letzten Posts in den Forenbereich "Operations Research! Danke!


> Gruß, Diophant


Gruß, Marcel

Bezug
                                        
Bezug
Verbesserung von Prognosedaten: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 17:18 Fr 25.07.2014
Autor: Diophant

Moin,

mit Verlaub: aber jetzt erklärst du den Mods hier ihre Arbeit, also irgendwo ist dann mal ein Punkt erreicht...

Ich würde dir dringend raten, dich mal eingehend mit unseren Forenregeln auseinanderzusetzen. Die sind allerdings nicht ausschließlich dazu da, gelesen und dann missachtet zu werden!

Gruß, Diophant

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
ev.vorhilfe.de
[ Startseite | Mitglieder | Impressum ]