Monday 13 November 2017

Saisonalität Im Gleitenden Durchschnitt


Spreadsheet-Implementierung der saisonalen Anpassung und exponentieller Glättung Es ist einfach, saisonale Anpassung durchzuführen und exponentielle Glättungsmodelle mit Excel anzupassen. Die unten aufgeführten Bildschirmbilder und Diagramme werden einer Tabellenkalkulation entnommen, die eine multiplikative saisonale Anpassung und eine lineare Exponentialglättung auf den folgenden vierteljährlichen Verkaufsdaten von Outboard Marine darstellt: Um eine Kopie der Tabellenkalkulation selbst zu erhalten, klicken Sie hier. Die Version der linearen exponentiellen Glättung, die hier für Demonstrationszwecke verwendet wird, ist die Brown8217s-Version, nur weil sie mit einer einzigen Spalte von Formeln implementiert werden kann und es nur eine Glättungskonstante gibt, die optimiert werden soll. In der Regel ist es besser, Holt8217s Version, die separate Glättungskonstanten für Ebene und Trend hat. Der Prognoseprozess verläuft wie folgt: (i) Die Daten werden saisonbereinigt (ii) sodann für die saisonbereinigten Daten über lineare exponentielle Glättung prognostiziert und (iii) schließlich werden die saisonbereinigten Prognosen zur Erzielung von Prognosen für die ursprüngliche Serie herangezogen . Der saisonale Anpassungsprozess wird in den Spalten D bis G durchgeführt. Der erste Schritt in der Saisonbereinigung besteht darin, einen zentrierten gleitenden Durchschnitt (hier in Spalte D) zu berechnen. Dies kann erreicht werden, indem der Durchschnitt von zwei einjährigen Durchschnittswerten, die um eine Periode relativ zueinander versetzt sind, genommen wird. (Eine Kombination von zwei Offset-Durchschnittswerten anstatt eines einzigen Mittels wird für die Zentrierung benötigt, wenn die Anzahl der Jahreszeiten gleich ist.) Der nächste Schritt besteht darin, das Verhältnis zum gleitenden Durchschnitt zu berechnen. Wobei die ursprünglichen Daten durch den gleitenden Durchschnitt in jeder Periode dividiert werden, was hier in Spalte E durchgeführt wird. (Dies wird auch Quottrend-Cyclequot-Komponente des Musters genannt, sofern Trend - und Konjunktur-Effekte als all das angesehen werden können Bleibt nach einer Durchschnittsberechnung über ein ganzes Jahr im Wert von Daten bestehen. Natürlich können die monatlichen Veränderungen, die nicht saisonal bedingt sind, durch viele andere Faktoren bestimmt werden, aber der 12-Monatsdurchschnitt glättet sie weitgehend Wird der geschätzte saisonale Index für jede Jahreszeit berechnet, indem zuerst alle Verhältnisse für die jeweilige Jahreszeit gemittelt werden, was in den Zellen G3-G6 unter Verwendung einer AVERAGEIF-Formel erfolgt. Die Durchschnittsverhältnisse werden dann neu skaliert, so daß sie auf das genau 100-fache der Anzahl der Perioden in einer Jahreszeit, oder 400 in diesem Fall, die in den Zellen H3-H6 durchgeführt wird, summieren. Unten in der Spalte F werden VLOOKUP-Formeln verwendet, um den entsprechenden saisonalen Indexwert in jede Zeile der Datentabelle einzufügen, entsprechend dem Viertel des Jahres, das es repräsentiert. Der mittlere gleitende Durchschnitt und die saisonbereinigten Daten enden wie folgt: Beachten Sie, dass der gleitende Durchschnitt typischerweise wie eine glattere Version der saisonbereinigten Serie aussieht und an beiden Enden kürzer ist. Ein weiteres Arbeitsblatt in derselben Excel-Datei zeigt die Anwendung des linearen exponentiellen Glättungsmodells auf die saisonbereinigten Daten beginnend in Spalte G. Über der Prognosespalte (hier in Zelle H9) wird ein Wert für die Glättungskonstante (alpha) eingetragen Zur Vereinfachung wird ihm der Bereichsname quotAlpha. quot zugewiesen (Der Name wird mit dem Befehl quotInsertNameCreatequot zugewiesen.) Das LES-Modell wird initialisiert, indem die ersten beiden Prognosen gleich dem ersten Istwert der saisonbereinigten Serie gesetzt werden. Die hier verwendete Formel für die LES-Prognose ist die rekursive Einzelformel des Brown8217s-Modells: Diese Formel wird in der Zelle entsprechend der dritten Periode (hier Zelle H15) eingegeben und von dort nach unten kopiert. Beachten Sie, dass sich die LES-Prognose für die aktuelle Periode auf die beiden vorherigen Beobachtungen und die beiden vorhergehenden Prognosefehler sowie auf den Wert von alpha bezieht. Somit bezieht sich die Prognoseformel in Zeile 15 nur auf Daten, die in Zeile 14 und früher verfügbar waren. (Natürlich könnten wir statt der linearen exponentiellen Glättung einfach statt der linearen exponentiellen Glättung verwenden, könnten wir stattdessen die SES-Formel ersetzen. Wir könnten auch Holt8217s anstelle von Brown8217s LES-Modell verwenden, was zwei weitere Spalten von Formeln erfordern würde, um das Niveau und den Trend zu berechnen Die in der Prognose verwendet werden.) Die Fehler werden in der nächsten Spalte (hier Spalte J) durch Subtrahieren der Prognosen von den Istwerten berechnet. Der Quadratwurzel-Quadratfehler wird als Quadratwurzel der Varianz der Fehler plus dem Quadrat des Mittelwerts berechnet. (Dies ergibt sich aus der mathematischen Identität: MSE VARIANCE (Fehler) (AVERAGE (Fehler)). 2) Bei der Berechnung des Mittelwertes und der Varianz der Fehler in dieser Formel sind die ersten beiden Perioden ausgeschlossen, weil das Modell nicht tatsächlich mit der Prognose beginnt Die dritte Periode (Zeile 15 auf der Kalkulationstabelle). Der optimale Wert von alpha kann entweder durch manuelles Ändern von alpha gefunden werden, bis das minimale RMSE gefunden wird, oder Sie können das quotSolverquot verwenden, um eine genaue Minimierung durchzuführen. Der Wert von alpha, den der Solver gefunden hat, wird hier angezeigt (alpha0.471). Es ist in der Regel eine gute Idee, die Fehler des Modells (in transformierten Einheiten) zu zeichnen und ihre Autokorrelationen zu berechnen und zu zeichnen, bis zu einer Saison. Hier ist eine Zeitreihenfolge der (saisonbereinigten) Fehler: Die Fehlerautokorrelationen werden mit Hilfe der CORREL () - Funktion berechnet, um die Korrelationen der Fehler selbst mit einer oder mehreren Perioden zu berechnen - Einzelheiten sind im Kalkulationsblatt dargestellt . Hier ist ein Diagramm der Autokorrelationen der Fehler bei den ersten fünf Verzögerungen: Die Autokorrelationen bei den Verzögerungen 1 bis 3 sind sehr nahe bei Null, aber die Spitze bei Verzögerung 4 (deren Wert 0,35 ist) ist etwas mühsam Saisonale Anpassungsprozess nicht vollständig erfolgreich war. Allerdings ist es eigentlich nur marginal signifikant. 95 Signifikanzbanden zum Testen, ob Autokorrelationen signifikant von Null verschieden sind, sind ungefähr plus-oder-minus 2SQRT (n-k), wobei n die Stichprobengröße und k die Verzögerung ist. Hier ist n gleich 38 und k variiert von 1 bis 5, so daß die Quadratwurzel von - n-minus-k für alle von etwa 6 ist, und daher sind die Grenzen für das Testen der statistischen Signifikanz von Abweichungen von Null grob plus - Oder-minus 26 oder 0,33. Wenn Sie den Wert von alpha von Hand in diesem Excel-Modell variieren, können Sie den Effekt auf die Zeitreihen und Autokorrelationsdiagramme der Fehler sowie auf den Root-mean-squared-Fehler beobachten, der nachfolgend erläutert wird. Am Ende der Kalkulationstabelle wird die Prognoseformel quasi in die Zukunft gestartet, indem lediglich Prognosen für tatsächliche Werte an dem Punkt ausgetauscht werden, an dem die tatsächlichen Daten ablaufen - d. h. Wo die Zukunft beginnt. (Mit anderen Worten, in jeder Zelle, in der ein zukünftiger Datenwert auftreten würde, wird eine Zellreferenz eingefügt, die auf die Prognose für diese Periode hinweist.) Alle anderen Formeln werden einfach von oben nach unten kopiert: Beachten Sie, dass die Fehler für die Prognosen von Die Zukunft werden alle berechnet, um Null zu sein. Dies bedeutet nicht, dass die tatsächlichen Fehler null sein werden, sondern lediglich die Tatsache, dass wir für die Vorhersage davon ausgehen, dass die zukünftigen Daten den Prognosen im Durchschnitt entsprechen werden. Die daraus resultierenden LES-Prognosen für die saisonbereinigten Daten sehen wie folgt aus: Mit diesem für α-Periodenprognosen optimalen Wert von alpha ist der prognostizierte Trend leicht nach oben, was auf den lokalen Trend in den letzten 2 Jahren zurückzuführen ist oder so. Für andere Werte von alpha könnte eine sehr unterschiedliche Trendprojektion erhalten werden. Es ist normalerweise eine gute Idee, zu sehen, was mit der langfristigen Trendprojektion geschieht, wenn Alpha variiert wird, weil der Wert, der für kurzfristige Prognosen am besten ist, nicht notwendigerweise der beste Wert für die Vorhersage der weiter entfernten Zukunft sein wird. Dies ist beispielsweise das Ergebnis, das erhalten wird, wenn der Wert von alpha manuell auf 0,25 gesetzt wird: Der projizierte Langzeittrend ist jetzt eher negativ als positiv Mit einem kleineren Wert von alpha setzt das Modell mehr Gewicht auf ältere Daten Seine Einschätzung des aktuellen Niveaus und Tendenz und seine langfristigen Prognosen spiegeln den in den letzten 5 Jahren beobachteten Abwärtstrend wider, eher als der jüngste Aufwärtstrend. Dieses Diagramm zeigt auch deutlich, wie das Modell mit einem kleineren Wert von alpha langsamer ist, um auf quotturning pointsquot in den Daten zu antworten und daher tendiert, einen Fehler des gleichen Vorzeichens für viele Perioden in einer Reihe zu machen. Die Prognosefehler von 1-Schritt-Vorhersage sind im Mittel größer als die, die zuvor erhalten wurden (RMSE von 34,4 statt 27,4) und stark positiv autokorreliert. Die Lag-1-Autokorrelation von 0,56 übersteigt den oben berechneten Wert von 0,33 für eine statistisch signifikante Abweichung von Null deutlich. Als Alternative zum Abkürzen des Wertes von Alpha, um mehr Konservatismus in Langzeitprognosen einzuführen, wird manchmal ein Quottrend-Dämpfungsquotfaktor dem Modell hinzugefügt, um die projizierte Tendenz nach einigen Perioden abflachen zu lassen. Der letzte Schritt beim Erstellen des Prognosemodells besteht darin, die LES-Prognosen durch Multiplikation mit den entsprechenden saisonalen Indizes zu veranschaulichen. Somit sind die reseasonalisierten Prognosen in Spalte I einfach das Produkt der saisonalen Indizes in Spalte F und der saisonbereinigten LES-Prognosen in Spalte H. Es ist relativ einfach, Konfidenzintervalle für einstufige Prognosen dieses Modells zu berechnen: Erstens Berechnen Sie den RMSE (root-mean-squared Fehler, der nur die Quadratwurzel der MSE ist) und berechnen Sie dann ein Konfidenzintervall für die saisonbereinigte Prognose durch Addition und Subtraktion zweimal des RMSE. (Im Allgemeinen ist ein 95-Konfidenzintervall für eine Ein-Perioden-Vorausprognose ungefähr gleich der Punktvorhersage plus-oder-minus-zweimal der geschätzten Standardabweichung der Prognosefehler, vorausgesetzt, die Fehlerverteilung ist annähernd normal und die Stichprobengröße Ist groß genug, sagen wir, 20 oder mehr Hier ist die RMSE anstelle der Standardabweichung der Fehler die beste Schätzung der Standardabweichung der zukünftigen Prognosefehler, weil sie auch die Zufallsvariationen berücksichtigt.) Die Vertrauensgrenzen Für die saisonbereinigte Prognose werden dann reseasonalisiert. Zusammen mit der Prognose, durch Multiplikation mit den entsprechenden saisonalen Indizes. In diesem Fall ist die RMSE gleich 27,4 und die saisonbereinigte Prognose für die erste künftige Periode (Dez-93) beträgt 273,2. So dass das saisonbereinigte 95-Konfidenzintervall von 273,2-227,4 218,4 auf 273,2227,4 328,0 liegt. Das Multiplizieren dieser Limits durch Decembers saisonalen Index von 68,61. Erhalten wir niedrigere und obere Konfidenzgrenzen von 149,8 und 225,0 um die Dez-93-Punktprognose von 187,4. Die Vertrauensgrenzen für Prognosen, die länger als eine Periode vorangehen, werden sich in der Regel aufgrund der Unsicherheit über das Niveau und den Trend sowie die saisonalen Faktoren erweitern, da der Prognosehorizont zunimmt, aber es ist schwierig, sie im Allgemeinen durch analytische Methoden zu berechnen. (Die geeignete Methode zur Berechnung der Vertrauensgrenzen für die LES-Prognose ist die Verwendung der ARIMA-Theorie, aber auch die Unsicherheit in den saisonalen Indizes ist eine andere.) Wenn Sie ein realistisches Konfidenzintervall für eine Prognose über mehrere Perioden bevorzugen, Fehler zu berücksichtigen, ist Ihre beste Wette, empirische Methoden zu verwenden: Zum Beispiel, um ein Vertrauensintervall für eine 2-Schritt-Vorausprognose zu erhalten, könnten Sie eine weitere Spalte auf der Kalkulationstabelle erstellen, um eine 2-Schritt-Voraus-Prognose für jeden Zeitraum zu berechnen Durch Booten der Ein-Schritt-Voraus-Prognose). Berechnen Sie dann die RMSE der 2-Schritt-Voraus-Prognosefehler und verwenden Sie diese als Basis für ein 2-stufiges Konfidenzintervall. Zeitreihenanalyse: Der Prozess der Saisonbereinigung Was sind die beiden Hauptphilosophien der Saisonanpassung? Filter Was ist der Endpunkt Problem Wie entscheiden wir, welche Filter zu verwenden Was ist eine Verstärkungsfunktion Was ist eine Phasenverschiebung Was sind Henderson gleitende Durchschnitte Wie gehen wir mit dem Endpunkt Problem umgehen Was sind saisonale gleitende Durchschnitte Warum werden Trendschätzungen überarbeitet Wie Sind viel Daten erforderlich, um annehmbare saisonbereinigte Schätzungen zu erzielen. ERWEITERT Wie die beiden saisonalen Anpassungsphilosophien vergleichen, WAS DIE ZWEI HAUPTSPHILOSOPHIEN SEASONALER EINSTELLUNG Die beiden Hauptphilosophien für die saisonale Anpassung sind die modellbasierte Methode und die Filtermethode. Filterbasierte Methoden Diese Methode wendet einen Satz von festen Filtern (gleitende Mittelwerte) an, um die Zeitreihen in eine Trend-, Saison - und unregelmäßige Komponente zu zerlegen. Der zugrunde liegende Gedanke ist, dass die Wirtschaftsdaten aus einer Reihe von Zyklen zusammengesetzt sind, einschließlich der Konjunkturzyklen (der Trend), saisonale Zyklen (Saisonalität) und Lärm (die unregelmäßige Komponente). Ein Filter entfernt im Wesentlichen die Stärke bestimmter Zyklen aus den Eingangsdaten. Um eine saisonbereinigte Reihe von monatlich gesammelten Daten zu erzeugen, müssen Ereignisse, die alle 12, 6, 4, 3, 2.4 und 2 Monate auftreten, entfernt werden. Diese entsprechen saisonalen Frequenzen von 1, 2, 3, 4, 5 und 6 Zyklen pro Jahr. Die längeren nicht-saisonalen Zyklen gelten als Teil des Trends und die kürzeren nicht-saisonalen Zyklen bilden die unregelmäßigen. Jedoch kann die Grenze zwischen dem Trend und den unregelmßigen Zyklen mit der Länge des Filters, der verwendet wird, um den Trend zu erhalten, variieren. In ABS saisonale Anpassung sind Zyklen, die erheblich zur Tendenz beitragen, in der Regel größer als etwa 8 Monate für monatliche Serien und 4 Quartalen für vierteljährliche Serien. Der Trend, saisonale und irreguläre Komponenten brauchen keine expliziten individuellen Modelle. Die unregelmäßige Komponente ist definiert als das, was nach dem Trend bleibt und saisonale Komponenten wurden durch Filter entfernt. Irregulars zeigen keine weißen Rauscheigenschaften. Filterbasierte Methoden werden oft als X11-Stilmethoden bezeichnet. Dazu gehören X11 (entwickelt von U. S. Census Bureau), X11ARIMA (von Statistics Canada entwickelt), X12ARIMA (entwickelt von U. S. Census Bureau), STL, SABL und SEASABS (das von der ABS verwendete Paket). Computational Unterschiede zwischen verschiedenen Methoden in X11 Familie sind vor allem das Ergebnis der verschiedenen Techniken an den Enden der Zeitreihen verwendet. Beispielsweise verwenden einige Verfahren asymmetrische Filter an den Enden, während andere Verfahren die Zeitreihe extrapolieren und symmetrische Filter auf die erweiterte Serie anwenden. Modellbasierte Methoden Dieser Ansatz erfordert, dass Trend, saisonale und unregelmäßige Komponenten der Zeitreihe separat modelliert werden. Es geht davon aus, dass die unregelmäßige Komponente 8220weißes Rauschen8221 ist - das heißt, alle Zykluslängen sind gleich dargestellt. Die Unregelmäßigen haben Null-Mittelwert und eine konstante Varianz. Die saisonale Komponente hat ein eigenes Rauschen. Zwei weit verbreitete Softwarepakete, die modellbasierte Methoden anwenden, sind STAMP und SEATSTRAMO (entwickelt von der Bank of Spain. Beachtete rechnerische Unterschiede zwischen den verschiedenen modellbasierten Methoden sind in der Regel auf Modellspezifikationen zurückzuführen, in manchen Fällen werden die Komponenten direkt modelliert Müssen die ursprünglichen Zeitreihen zunächst modelliert und die Komponentenmodelle daraus zersetzt werden. Für einen Vergleich der beiden Philosophien auf einem fortgeschritteneren Niveau, siehe Wie die beiden saisonalen Anpassung Philosophien vergleichen WAS IST EIN FILTER Filter können verwendet werden, um sich zu zersetzen Eine Zeitreihe in einen Trend, eine saisonale und eine irreguläre Komponente Die gleitenden Mittelwerte sind eine Art von Filter, die aufeinanderfolgend eine Verschiebungszeitspanne von Daten schätzen, um eine geglättete Schätzung einer Zeitreihe zu erzeugen. Diese geglättete Reihe kann als abgeleitet betrachtet werden Indem eine Eingabeserie durch einen Prozess geleitet wird, der bestimmte Zyklen ausfiltert, wodurch ein gleitender Durchschnitt oft als Filter bezeichnet wird. Das grundlegende Verfahren beinhaltet das Definieren eines Satzes von Gewichten der Länge m 1 m 2 1 als: Anmerkung: Ein symmetrischer Satz von Gewichten hat m 1 m 2 und wjw - j. Ein gefilterter Wert zum Zeitpunkt t kann berechnet werden, indem Y t den Wert beschreibt Der Zeitreihe zum Zeitpunkt t. Man betrachte beispielsweise folgende Reihen: Unter Verwendung eines einfachen symmetrischen 3-Term-Filters (dh m 1 m 2 1 und alle Gewichte sind 13) wird der erste Term der geglätteten Reihe durch Anwenden der Gewichte auf die ersten drei Terme des Originals erhalten Serie: Der zweite geglättete Wert wird durch Anwenden der Gewichte auf den zweiten, dritten und vierten Term in der ursprünglichen Serie erzeugt: WAS IST DAS ENDPUNKT-PROBLEM Die Serie überdenken: Diese Reihe enthält 8 Begriffe. Jedoch enthält die geglättete Reihe, die durch Anwenden eines symmetrischen Filters auf die ursprünglichen Daten erhalten wird, nur 6 Ausdrücke: Das liegt daran, daß an den Enden der Reihe nicht genügend Daten vorhanden sind, um ein symmetrisches Filter anzuwenden. Der erste Term der geglätteten Reihe ist ein gewichteter Durchschnitt von drei Terme, der auf den zweiten Term der ursprünglichen Reihe zentriert ist. Ein gewichteter Mittelwert, der auf den ersten Term der ursprünglichen Reihe zentriert ist, kann nicht als Daten erhalten werden, bevor dieser Punkt nicht verfügbar ist. Ebenso ist es nicht möglich, einen gewichteten Mittelwert zu berechnen, der auf den letzten Term der Reihe zentriert ist, da keine Daten nach diesem Punkt vorliegen. Aus diesem Grund können symmetrische Filter nicht an jedem Ende einer Serie verwendet werden. Dies wird als Endpunktproblem bezeichnet. Zeitreihenanalytiker können asymmetrische Filter verwenden, um geglättete Schätzungen in diesen Regionen zu erzeugen. In diesem Fall wird der geglättete Wert 8216off centre8217 berechnet, wobei der Durchschnitt unter Verwendung von mehr Daten von einer Seite des Punktes als dem anderen gemäß dem, was verfügbar ist, bestimmt wird. Alternativ können Modellierungstechniken verwendet werden, um die Zeitreihen zu extrapolieren und dann symmetrische Filter auf die erweiterte Serie aufzubringen. WIE WIR ENTFERNEN, WELCHES FILTER ZU BENUTZEN Der Zeitreihenanalytiker wählt einen geeigneten Filter, der auf seinen Eigenschaften basiert, wie z. B. welche Zyklen der Filter entfernt, wenn er angewendet wird. Die Eigenschaften eines Filters können mit einer Verstärkungsfunktion untersucht werden. Verstärkungsfunktionen werden verwendet, um die Wirkung eines Filters bei einer gegebenen Frequenz auf die Amplitude eines Zyklus für eine bestimmte Zeitreihe zu untersuchen. Für weitere Informationen über die Mathematik, die mit Verstärkungsfunktionen verknüpft ist, können Sie die Time Series Kursnotizen, eine Einführung in die Zeitreihenanalyse, die von der Zeitreihenanalyse des ABS veröffentlicht wird, herunterladen (siehe Abschnitt 4.4). Das folgende Diagramm ist die Verstärkungsfunktion für das symmetrische 3-Term-Filter, das wir früher untersucht haben. Abbildung 1: Verstärkungsfunktion für symmetrische 3-Term-Filter Die horizontale Achse stellt die Länge eines Eingangszyklus in Bezug auf die Periode zwischen den Beobachtungspunkten in der ursprünglichen Zeitreihe dar. So ist ein Eingabezyklus der Länge 2 in 2 Perioden abgeschlossen, was 2 Monate für eine monatliche Serie und 2 Quartale für eine vierteljährliche Serie entspricht. Die vertikale Achse zeigt die Amplitude des Ausgabezyklus relativ zu einem Eingangszyklus. Dieser Filter reduziert die Festigkeit von 3 Periodenzyklen auf Null. Das heißt, sie entfernt vollständig Zyklen von etwa dieser Länge. Dies bedeutet, dass für eine Zeitreihe, in der Daten monatlich gesammelt werden, alle saisonalen Effekte, die vierteljährlich auftreten, durch Anwendung dieses Filters auf die ursprüngliche Serie eliminiert werden. Eine Phasenverschiebung ist die Zeitverschiebung zwischen dem gefilterten Zyklus und dem ungefilterten Zyklus. Eine positive Phasenverschiebung bedeutet, dass der gefilterte Zyklus rückwärts verschoben wird und eine negative Phasenverschiebung zeitlich verschoben wird. Eine Phasenverschiebung tritt auf, wenn das Timing der Wendepunkte verzerrt ist, zum Beispiel wenn der gleitende Durchschnitt von den asymmetrischen Filtern außermittig platziert wird. Das heißt, sie werden entweder früher oder später in der gefilterten Serie auftreten als im Original. Ungerade symmetrische Bewegungsdurchschnitte (wie sie vom ABS verwendet werden), bei denen das Ergebnis mittig platziert wird, bewirken keine zeitliche Phasenverschiebung. Es ist wichtig, dass Filter, die verwendet werden, um den Trend abzuleiten, die Zeitphase und somit den Zeitpunkt jedes Wendepunktes beizubehalten. Die 2 und 3 zeigen die Effekte der Anwendung eines 2 × 12 symmetrischen gleitenden Mittelwertes, der außerhalb der Mitte liegt. Die kontinuierlichen Kurven repräsentieren die Anfangszyklen und die unterbrochenen Kurven repräsentieren die Ausgangszyklen nach dem Anlegen des gleitenden Durchschnittsfilters. Abbildung 2: 24-Monate-Zyklus, Phase -5,5 Monate Amplitude 63 Abbildung 3: 8-Monatszyklus, Phase -1,5 Monate Amplitude 22 WAS SIND HENDERSON BEWEGENDE AVERAGEN Henderson-Bewegungsdurchschnitte sind Filter, die von Robert Henderson 1916 für den Einsatz in versicherungsmathematischen Anwendungen abgeleitet wurden. Sie sind Trendfilter, die üblicherweise in der Zeitreihenanalyse verwendet werden, um saisonbereinigte Schätzungen zu glätten, um eine Trendschätzung zu erzeugen. Sie werden bevorzugt einfacheren gleitenden Durchschnitten verwendet, da sie Polynome bis zu Grad 3 reproduzieren können, wodurch Trendkurvenpunkte erfasst werden. Das ABS verwendet Henderson gleitende Mittelwerte, um Trendschätzungen aus einer saisonbereinigten Serie zu erzeugen. Die von der ABS veröffentlichten Trendschätzungen werden typischerweise unter Verwendung eines 13-term-Henderson-Filters für monatliche Serien und eines 7-term-Henderson-Filters für vierteljährliche Serien abgeleitet. Henderson-Filter können entweder symmetrisch oder asymmetrisch sein. Symmetrische Bewegungsdurchschnitte können an Punkten angewandt werden, die ausreichend weit entfernt von den Enden einer Zeitreihe liegen. In diesem Fall wird der geglättete Wert für einen gegebenen Punkt in der Zeitreihe aus einer gleichen Anzahl von Werten auf beiden Seiten des Datenpunkts berechnet. Um die Gewichte zu erhalten, wird ein Kompromiss zwischen den beiden Merkmalen, die allgemein von einer Trendreihe erwartet werden, erreicht. Dies ist, dass der Trend in der Lage sein, eine breite Palette von Krümmungen darstellen und dass es auch so glatt wie möglich sein sollte. Zur mathematischen Ableitung der Gewichte siehe Abschnitt 5.3 der Zeitreihen-Lehrveranstaltungen. Die von der ABS-Website heruntergeladen werden können. Die Gewichtungsmuster für einen Bereich symmetrischer Henderson-Bewegungsdurchschnitte sind in der folgenden Tabelle angegeben: Symmetrisches Gewichtungsmuster für Henderson Moving Average Im allgemeinen gilt, je länger der Trendfilter ist, desto glatter der resultierende Trend, wie sich aus einem Vergleich der Verstärkungsfunktionen ergibt über. Ein 5-term-Henderson reduziert Zyklen von etwa 2,4 Perioden oder weniger um mindestens 80, während ein 23-Term-Henderson reduziert Zyklen von etwa 8 Perioden oder weniger um mindestens 90. In der Tat ein 23-Term-Henderson-Filter entfernt vollständig Zyklen von weniger als 4 Perioden . Henderson bewegte Durchschnitte dämpfen auch die Jahreszeitzyklen in unterschiedlichen Graden. Jedoch zeigen die Verstärkungsfunktionen in den 4 - 8, dass die jährlichen Zyklen in den Monats - und Quartalsreihen nicht signifikant genug gedämpft werden, um die Anwendung eines Henderson-Filters direkt auf ursprüngliche Schätzungen zu rechtfertigen. Aus diesem Grund werden sie nur auf eine saisonbereinigte Reihe angewendet, wo die kalenderbedingten Effekte bereits mit speziell entwickelten Filtern entfernt wurden. Abbildung 9 zeigt die Glättungseffekte des Anwendens eines Henderson-Filters auf eine Serie: Abbildung 9: 23-Term-Henderson-Filter - Wert der Nicht-Wohngebäude Zulassungen WIE MACHEN WIR MIT DEM ENDPUNKT-PROBLEM Der symmetrische Henderson-Filter kann nur auf Regionen angewendet werden Von Daten, die ausreichend weit von den Enden der Reihe entfernt sind. Zum Beispiel kann die Standard-13-Term Henderson nur auf monatliche Daten angewendet werden, die mindestens 6 Beobachtungen vom Anfang oder Ende der Daten sind. Dies liegt daran, dass die Filterglätte der Reihe, indem sie einen gewichteten Durchschnitt der 6 Begriffe auf beiden Seiten des Datenpunktes sowie den Punkt selbst. Wenn wir versuchen, es auf einen Punkt anzuwenden, der weniger als 6 Beobachtungen von dem Ende der Daten ist, dann sind nicht genügend Daten auf einer Seite des Punktes verfügbar, um den Durchschnitt zu berechnen. Um Trendschätzungen dieser Datenpunkte zu liefern, wird ein modifizierter oder asymmetrischer gleitender Durchschnitt verwendet. Die Berechnung von asymmetrischen Henderson-Filtern kann durch eine Anzahl verschiedener Methoden erzeugt werden, die ähnliche, aber nicht identische Ergebnisse liefern. Die vier Hauptmethoden sind die Musgrave-Methode, die Minimierung der Mittelwert-Revisionsmethode, die Methode der besten linearen unregelmäßigen Schätzungen (BLUE) und die Kenny - und Durbin-Methode. Shiskin et. Al (1967) die ursprünglichen asymmetrischen Gewichte für den Henderson-gleitenden Durchschnitt, die innerhalb der X11-Pakete verwendet werden. Für Informationen über die Ableitung der asymmetrischen Gewichte siehe Abschnitt 5.3 der Zeitreihen-Lehrveranstaltungen. Man betrachte eine Zeitreihe, bei der der letzte beobachtete Datenpunkt zum Zeitpunkt N auftritt. Dann kann ein 13-term-symmetrisches Henderson-Filter nicht auf Datenpunkte angewendet werden, die zu jedem Zeitpunkt nach und einschließlich Zeit N-5 gemessen werden. Für alle diese Punkte muss ein asymmetrischer Satz von Gewichten verwendet werden. Die folgende Tabelle gibt das asymmetrische Gewichtungsmuster für einen normalen 13-Term-Henderson-gleitenden Durchschnitt. Die asymmetrischen 13-term-Henderson-Filter entfernen oder dämpfen nicht dieselben Zyklen wie der symmetrische 13-Term-Henderson-Filter. Tatsächlich verstärkt das asymmetrische Gewichtungsmuster, das verwendet wird, um den Trend bei der letzten Beobachtung zu schätzen, die Stärke von 12 Periodenzyklen. Auch asymmetrische Filter erzeugen eine zeitliche Phasenverschiebung. WAS SIND SEASONAL MOVING AVERAGES Fast alle Daten, die vom ABS untersucht werden, haben saisonale Eigenschaften. Da die Henderson-Bewegungsdurchschnitte, die verwendet wurden, um die Trendreihen abzuschätzen, nicht die Saisonalität beseitigen, müssen die Daten saisonbereinigt zuerst mit saisonalen Filtern eingestellt werden. Ein Saisonfilter hat Gewichte, die im gleichen Zeitraum über die Zeit angewendet werden. Ein Beispiel des Gewichtungsmusters für einen saisonalen Filter wäre: (13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 13), wobei zum Beispiel ein Gewicht von einem Drittel auf drei aufeinanderfolgende Januars angewendet wird. Innerhalb X11, eine Reihe von saisonalen Filter zur Auswahl stehen. Dies sind ein gewichteter 3-Term-gleitender Durchschnitt (ma) S 3x1. Gewichtet 5-term ma S 3x3. Gewichtet 7-term ma S 3x5. Und eine gewichtete 11-term ma S 3x9. Die Gewichtungsstruktur gewichteter gleitender Durchschnitte der Form, S nxm. Ist, dass ein einfacher Mittelwert von m Ausdrücken berechnet wird und dann ein gleitender Durchschnitt von n dieser Mittelwerte bestimmt wird. Dies bedeutet, dass nm-1 Ausdrücke verwendet werden, um jeden endgültigen geglätteten Wert zu berechnen. Zum Beispiel, um ein 11-Term S 3x9 zu berechnen. Ein Gewicht von 19 wird auf den gleichen Zeitraum in 9 aufeinander folgenden Jahren angewendet. Dann wird ein einfacher dreidimensionaler gleitender Durchschnitt über die gemittelten Werte angewendet: Dies ergibt ein endgültiges Gewichtungsmuster von (127, 227, 19, 19, 19, 19, 19, 19, 19, 227, 127). Die Verstärkungsfunktion für einen 11-Jahres-Saisonfilter, S 3x9. Sieht wie folgt aus: Abbildung 10: Verstärkungsfunktion für 11 Term (S 3x9) Saisonfilter Die Anwendung eines saisonalen Filters auf Daten erzeugt eine Schätzung der saisonalen Komponente der Zeitreihe, da sie die Stärke der saisonalen Oberwellen und Dämpfungszyklen von nicht - Saisonale Längen. Asymmetrische saisonale Filter werden an den Enden der Serie verwendet. Die asymmetrischen Gewichte für jeden der in X11 verwendeten Saisonfilter finden Sie in Abschnitt 5.4 der Zeitreihen-Kursnotizen. WARUM SIND TREND ESTIMATES REVISED Am aktuellen Ende einer Zeitreihe ist es nicht möglich, symmetrische Filter zu verwenden, um den Trend aufgrund des Endpunktproblems abzuschätzen. Stattdessen werden asymmetrische Filter verwendet, um vorläufige Trendschätzungen zu erzeugen. Wenn jedoch mehr Daten verfügbar sind, ist es möglich, den Trend unter Verwendung von symmetrischen Filtern neu zu berechnen und die anfänglichen Schätzungen zu verbessern. Dies wird als Trend-Revision bezeichnet. WIE VIELE DATEN ERFORDERLICH WERDEN KÖNNEN, DASS ANNEHMBARE SAISONAL EINSTELLTE SCHÄTZUNGEN ERGEBEN WERDEN Wenn eine Zeitreihe eine relativ stabile Saisonalität aufweist und nicht von der unregelmäßigen Komponente dominiert wird, dann können 5 Jahre Daten als akzeptable Länge betrachtet werden, um saisonbereinigte Schätzungen abzuleiten. Für eine Serie, die eine besonders starke und stabile Saisonalität aufweist, kann eine grobe Anpassung mit 3-jährigen Daten vorgenommen werden. Es ist in der Regel vorzuziehen, mindestens 7 Jahre Daten für eine normale Zeitreihe zu haben, um saisonale Muster, Handelstage und bewegte Urlaubseffekte, Trend - und Saisonbrüche sowie Ausreißer präzise zu identifizieren. ERWEITERTE WIE KÖNNEN DIE ZWEI SEASONALEN EINSTELLUNGSPHILOSOPHIEN VERGLEICHEN Modellbasierte Ansätze erlauben die stochastischen Eigenschaften (Zufälligkeit) der zu analysierenden Reihe, in dem Sinne, dass sie die Filtergewichte aufgrund der Art der Serie maßschneidern. Die Fähigkeit des Modells8217, das Verhalten der Reihe genau zu beschreiben, kann ausgewertet werden, und es werden statistische Schlussfolgerungen für die Schätzungen auf der Grundlage der Annahme zur Verfügung gestellt, dass die unregelmäßige Komponente weißes Rauschen ist. Filterbasierte Methoden sind weniger abhängig von den stochastischen Eigenschaften der Zeitreihen. Es ist die Zeitreihe analyst8217s Verantwortung, um die am besten geeignete Filter aus einer begrenzten Sammlung für eine bestimmte Serie zu wählen. Es ist nicht möglich, eine strenge Kontrolle der Angemessenheit des implizierten Modells durchzuführen, und genaue Präzisions - und statistische Schlußfolgerungen sind nicht verfügbar. Daher kann ein Vertrauensintervall nicht um die Schätzung herum aufgebaut werden. Die folgenden Diagramme vergleichen das Vorhandensein jeder der Modellkomponenten bei den saisonalen Frequenzen für die beiden saisonalen Anpassungsphilosophien. Die x-Achse ist die Periodenlänge des Zyklus und die y-Achse die Stärke der Zyklen, die jede Komponente umfassen: Abbildung 11: Vergleich der beiden saisonalen Anpassungsphilosophien Filterbasierte Methoden gehen davon aus, dass jede Komponente nur bestimmte Zykluslängen aufweist. Die längeren Zyklen bilden den Trend, die saisonale Komponente liegt bei saisonalen Frequenzen vor und die unregelmäßige Komponente wird als Zyklen beliebiger anderer Länge definiert. Unter einer modellbasierten Philosophie sind der Trend, die saisonale und die unregelmäßige Komponente bei allen Zykluslängen vorhanden. Die unregelmäßige Komponente ist von konstanter Festigkeit, die saisonalen Komponentenspitzen bei saisonalen Frequenzen und die Trendkomponente am stärksten in den längeren Zyklen. Diese Seite wurde erstmals veröffentlicht am 14. November 2005, zuletzt aktualisiert am 25. Juli 2008Allgemeine saisonale ARIMA Modelle: (0,1,1) x (0,1,1) etc. Übersicht der saisonalen ARIMA Modellierung: Der saisonale Teil eines ARIMA Modells ist gleich Struktur als die nicht-saisonale Teil: es kann einen AR-Faktor, ein MA-Faktor, andor eine Reihenfolge der Differenzierung. Im saisonalen Teil des Modells, alle diese Faktoren arbeiten über Vielfache von Lag s (die Anzahl der Perioden in einer Saison). Ein saisonales ARIMA-Modell wird als ARIMA (p, d, q) x (P, D, Q) - Modell klassifiziert, wobei Pnummer der saisonalen autoregressiven (SAR) Terme, Dnumber der saisonalen Unterschiede, Qnumber der saisonalen gleitenden Durchschnittswerte (SMA) Bei der Identifizierung eines saisonalen Modells, ist der erste Schritt, um festzustellen, ob eine saisonale Unterschied erforderlich ist, zusätzlich oder vielleicht statt einer nicht-saisonalen Unterschied. Sie sollten auf Zeitreihenplots und ACF - und PACF-Plots für alle möglichen Kombinationen von 0 oder 1 nicht-saisonalen Unterschied und 0 oder 1 saisonalen Unterschied zu suchen. Achtung: Verwenden Sie nicht mehr als einen saisonalen Unterschied, nicht mehr als zwei Gesamtdifferenzen (saisonal und nicht saisonal kombiniert). Wenn das saisonale Muster sowohl stark und stabil über die Zeit (zB hoch im Sommer und niedrig im Winter, oder umgekehrt) ist, dann sollten Sie wahrscheinlich einen saisonalen Unterschied verwenden, unabhängig davon, ob Sie einen nicht-saisonalen Unterschied verwenden, da dies wird Verhindern, dass das saisonale Muster aus Zerlegung outquot in den langfristigen Prognosen. Fügen Sie diese zu unserer Liste der Regeln für die Identifizierung von Modellen hinzu Regel 12: Wenn die Serie eine starke und konsistente saisonale Muster hat, sollten Sie eine Reihenfolge der saisonalen Differenzierung verwenden - aber nie mehr als eine Reihenfolge der saisonalen Differenzierung oder mehr als 2 verwenden Aufträge der Gesamtdifferenzierung (saisonabhängig). Die Signatur von reinem SAR oder reinem SMA Verhalten ist ähnlich der Signatur von reinem AR oder reinem MA Verhalten, mit der Ausnahme, dass das Muster über Vielfache von Verzögerung s im ACF und PACF auftritt. Zum Beispiel hat ein reines SAR (1) - Verfahren Spikes in der ACF bei den Verzögerungen s, 2s, 3s usw., während die PACF nach der Verzögerung s abschaltet. Umgekehrt hat ein reines SMA (1) - Verfahren Spikes in der PACF bei den Verzögerungen s, 2s, 3s usw., während der ACF nach der Verzögerung s abschaltet. Eine SAR-Signatur tritt gewöhnlich auf, wenn die Autokorrelation bei der saisonalen Periode positiv e ist, während eine SMA-Signatur normalerweise auftritt, wenn die saisonale Autokorrelation negativ ist. Daher: Regel 13: Wenn die Autokorrelation bei der Saisonzeit positiv ist. Erwägen, dem Modell einen SAR-Begriff hinzuzufügen. Wenn die Autokorrelation bei der Saisonperiode negativ ist. Erwägen, dem Modell einen SMA-Begriff hinzuzufügen. Vermeiden Sie das Mischen von SAR - und SMA-Begriffen in demselben Modell und vermeiden Sie die Verwendung von mehr als einer der beiden Arten. Normalerweise reicht ein SAR (1) oder SMA (1) Term aus. Sie werden selten einen echten SAR (2) oder SMA (2) - Prozess finden, und noch selten haben genug Daten, um zwei oder mehr saisonale Koeffizienten abzuschätzen, ohne dass der Schätzalgorithmus in eine Quotefeedback-Schleife eintritt. "Obwohl ein saisonales ARIMA-Modell zu haben scheint Nur ein paar Parameter, denken Sie daran, dass backforecasting die Schätzung von ein oder zwei Jahreszeiten im Wert von impliziten Parametern, um es zu initialisieren erfordert. Daher sollten Sie mindestens 4 oder 5 Jahreszeiten von Daten, um eine saisonale ARIMA-Modell passen. Das am häufigsten verwendete saisonale ARIMA-Modell ist das (0,1,1) x (0,1,1) - Modell - d. h. Ein MA (1) xSMA (1) - Modell mit einer saisonalen und einer nicht-saisonalen Differenz. Dies ist im wesentlichen ein sequentielles exponentielles Glättungsmodell. Wenn saisonale ARIMA-Modelle an protokollierte Daten angepasst werden, können sie ein multiplikatives saisonales Muster verfolgen. Beispiel: AUTOSALE-Serie erneut besucht Rückruf, dass wir zuvor Prognose der Retail-Auto-Verkaufs-Serie mit einer Kombination aus Deflation, saisonale Anpassung und exponentielle Glättung. Lets jetzt versuchen, passen die gleiche Serie mit saisonalen ARIMA Modelle, mit der gleichen Stichprobe von Daten von Januar 1970 bis Mai 1993 (281 Beobachtungen). Wie vorher werden wir mit deflationierten Autoverkäufen arbeiten - d. H. Wir verwenden die Serie AUTOSALECPI als Eingangsgröße. Hier sind die Zeitreihenplots und ACF - und PACF - Diagramme der Originalreihe, die im Prognoseverfahren durch die Darstellung des Quotienten eines ARIMA (0,0,0) x (0,0,0) Modells mit Konstante erhalten werden Quotsuspension bridgequot Muster in der ACF ist typisch für eine Serie, die sowohl nichtstationäre und stark saisonal ist. Natürlich brauchen wir mindestens eine Ordnung der Differenzierung. Wenn wir eine nicht-saisonale Differenz annehmen, sind die entsprechenden Diagramme wie folgt: Die differenzierte Reihe (die Residuen eines Modells mit wahlfreiem Anstieg) sieht mehr oder weniger stationär aus, aber es gibt immer noch sehr starke Autokorrelation in der Saisonzeit (Verzögerung 12). Da das saisonale Muster stark und stabil ist, wissen wir (aus Regel 12), dass wir eine Ordnung der saisonalen Differenzierung im Modell verwenden wollen. So sieht das Bild nach einem saisonalen Unterschied aus (nur): Die saisonal differenzierte Serie zeigt ein sehr starkes Muster positiver Autokorrelation, wie wir aus unserem früheren Versuch, ein saisonales Zufallsmodell anzupassen, erinnern. Dies könnte ein Zitat-Signaturquot - oder es könnte signalisieren die Notwendigkeit für einen anderen Unterschied. Wenn wir sowohl eine saisonale als auch eine nicht-saisonale Differenz einnehmen, werden folgende Ergebnisse erzielt: Dies sind natürlich die Residuen aus dem saisonal zufälligen Trendmodell, die wir früher an den Autoverkaufsdaten angepasst haben. Wir sehen jetzt die verräterischen Anzeichen einer leichten Überdifferenzierung. Sind die positiven Spikes in der ACF und PACF negativ geworden. Was ist die richtige Reihenfolge der Differenzierung Eine weitere Information, die hilfreich sein könnte, ist eine Berechnung der Fehlerstatistik der Serie auf jeder Ebene der Differenzierung. Wir können diese berechnen, indem wir die entsprechenden ARIMA-Modelle, in denen nur differencing verwendet wird, berechnen: Die kleinsten Fehler, sowohl in der Schätzperiode als auch in der Validierungsperiode, werden durch Modell A erhalten, das eine Differenz von jedem Typ verwendet. Dies, zusammen mit dem Auftreten der Plots oben, deutet stark darauf hin, dass wir sowohl eine saisonale und eine nonsaisonale Unterschied verwenden sollten. Das Modell A ist das saisonale Zufalls-Trend-Modell (SRT-Modell), während das Modell B nur das saisonal zufällige (SRW) Modell darstellt. Wie wir bereits beim Vergleich dieser Modelle festgestellt haben, scheint das SRT-Modell besser zu passen als das SRW-Modell. In der Analyse, die folgt, werden wir versuchen, diese Modelle durch die Zugabe von saisonalen ARIMA Bedingungen zu verbessern. Zurück zum Seitenanfang. Das häufig verwendete ARIMA (0,1,1) x (0,1,1) Modell: SRT Modell plus MA (1) und SMA (1) Begriffe Rückkehr zum letzten Satz von Plots oben, bemerken, dass mit einer Differenz von Jede Art gibt es eine negative Spitze in der ACF bei Verzögerung 1 und auch eine negative Spitze in der ACF bei Verzögerung 12. Wohingegen die PACF in der Nähe dieser beiden Verzögerungen ein graduelleres quadratisches Muster zeigt. Durch die Anwendung unserer Regeln zur Identifizierung von ARIMA-Modellen (speziell Regel 7 und Regel 13) können wir nun folgern, dass das SRT-Modell durch den Zusatz eines MA (1) - Terms und auch eines SMA (1) - Terms verbessert wird. Auch durch Regel 5 schließen wir die Konstante aus, da zwei Befehlsordnungen beteiligt sind. Wenn wir dies alles tun, erhalten wir das ARIMA (0,1,1) x (0,1,1) Modell. Welches das am häufigsten verwendete saisonale ARIMA-Modell ist. Seine Prognose-Gleichung ist: wobei 952 1 der MA (1) - Koeffizient und 920 1 (Kapital-Theta-1) der SMA (1) - Koeffizient ist. Man beachte, daß der Koeffizient des Lag-13-Fehlers das Produkt des MA (1) und des MA-1 ist SMA (1) Koeffizienten. Dieses Modell ist konzeptionell dem Winters-Modell insofern ähnlich, als es eine exponentielle Glättung effektiv auf Niveau, Trend und Saisonalität auf einmal anwendet, obwohl es auf fundierteren theoretischen Grundlagen beruht, insbesondere im Hinblick auf die Berechnung von Konfidenzintervallen für Langzeitprognosen. Seine Residualplots sind in diesem Fall wie folgt: Obwohl eine geringe Autokorrelation bei der Verzögerung 12 verbleibt, ist das Gesamtaussehen der Diagramme gut. Die Modellanpassungsergebnisse zeigen, dass die geschätzten MA (1) - und SMA (1) - Koeffizienten (die nach 7 Iterationen erhalten wurden) tatsächlich signifikant sind: Die Prognosen des Modells ähneln denen des saisonalen Zufallsmodells - d. h. Sie nehmen das saisonale Muster und den lokalen Trend am Ende der Serie auf - aber sie sind etwas glatter im Aussehen, da sowohl das saisonale Muster als auch die Tendenz effektiv gemittelt werden (in einer exponentiell-glättenden Art und Weise) Einige Jahreszeiten: Was ist dieses Modell wirklich tun Sie können es auf die folgende Weise denken. Zuerst berechnet er die Differenz zwischen jedem Monat8217s-Wert und einem 8220exponentiell gewichteten historischen Durchschnitt8221 für diesen Monat, der berechnet wird, indem exponentielle Glättung auf Werte angewendet wird, die im selben Monat in früheren Jahren beobachtet wurden, wobei der Betrag der Glättung durch die SMA bestimmt wird (1 ) - Koeffizient. Dann wird eine einfache exponentielle Glättung auf diese Unterschiede angewandt, um die Abweichung von dem historischen Durchschnitt vorherzusagen, der im nächsten Monat beobachtet wird. Der Wert des SMA (1) - Koeffizienten in der Nähe von 1,0 legt nahe, dass viele Jahreszeiten von Daten verwendet werden, um den historischen Durchschnitt für einen bestimmten Monat des Jahres zu berechnen. Es sei daran erinnert, dass ein MA (1) - Koeffizient in einem ARIMA-Modell (0,1,1) 1-minus-alpha im entsprechenden exponentiellen Glättungsmodell entspricht und dass das Durchschnittsalter der Daten in einer exponentiellen Glättungsmodellprognose 1alpha ist. Der SMA (1) - Koeffizient hat eine ähnliche Interpretation in Bezug auf Durchschnittswerte über die Jahreszeiten. Der Wert von 0,91 deutet darauf hin, dass das Durchschnittsalter der für die Schätzung des historischen Saisonmusters verwendeten Daten etwas mehr als 10 Jahre beträgt (fast die Hälfte der Länge des Datensatzes), was bedeutet, dass ein nahezu konstantes saisonales Muster angenommen wird. Der viel kleinere Wert von 0,5 für den MA (1) - Koeffizienten deutet darauf hin, dass relativ wenig Glättung durchgeführt wird, um die aktuelle Abweichung von dem historischen Durchschnitt für denselben Monat abzuschätzen, sodass der nächste Monat8217s vorhergesagte Abweichung von seinem historischen Durchschnitt in der Nähe der Abweichungen liegt Aus dem historischen Durchschnitt, die in den letzten Monaten beobachtet wurden. Das Modell ARIMA (1,0,0) x (0,1,0) mit konstantem SRW-Modell und AR (1) - Zustand Das Vorgängermodell war ein saisonales Random-Trend-Modell (SRT) 1) und SMA (1) Koeffizienten. Ein alternatives ARIMA-Modell für diese Serie kann erhalten werden, indem ein AR (1) - Term für die nicht-saisonale Differenz - d. h. Durch Hinzufügen eines AR (1) - Terms zu dem Seasonal Random Walk (SRW) - Modell. Dies ermöglicht es uns, das saisonale Muster in dem Modell zu bewahren, während der Gesamtbetrag der Differenzierung gesenkt wird, wodurch die Stabilität der Trendvorsprünge erhöht wird, wenn dies gewünscht wird. (Erinnern wir uns, dass die Reihe mit einer saisonalen Differenz alleine eine starke AR (1) Signatur zeigte.) Wenn wir dies tun, erhalten wir ein ARIMA (1,0,0) x (0,1,0) Modell mit konstanten, Was zu folgenden Ergebnissen führt: Der AR (1) - Koeffizient ist in der Tat sehr signifikant und der RMSE ist nur 2,06, verglichen mit 3,00 für das SRW-Modell (Modell B im obigen Vergleichsbericht). Die Prognose-Gleichung für dieses Modell ist: Der zusätzliche Begriff auf der rechten Seite ist ein Vielfaches des saisonalen Unterschieds, der im letzten Monat beobachtet wurde, was die Wirkung hat, die Prognose für die Wirkung eines ungewöhnlich guten oder schlechten Jahres zu korrigieren. Dabei bezeichnet 981 1 den AR (1) - Koeffizienten, dessen Schätzwert 0,73 ist. So zum Beispiel, wenn Verkäufe letzter Monat waren X Dollar vor Verkäufen ein Jahr früher, dann die Quantität 0.73X würde die Prognose für diesen Monat hinzugefügt werden. 956 bezeichnet die Konstante in der Prognosegleichung, deren Schätzwert 0,20 beträgt. Die geschätzte MEAN, deren Wert 0,75 ist, ist der Mittelwert der saisonal differenzierten Serien, was der jährliche Trend bei den Langzeitprognosen dieses Modells ist. Die Konstante ist (durch Definition) gleich den mittleren Zeiten 1 minus dem AR (1) - Koeffizienten: 0,2 0,75 (1 8211 0,73). Die Prognose zeigt, dass das Modell in der Tat eine bessere Arbeit als das SRW-Modell der Verfolgung zyklischer Veränderungen (dh ungewöhnlich gute oder schlechte Jahre): Aber die MSE für dieses Modell ist noch deutlich größer als das, was wir für die ARIMA (0, 1,1) x (0,1,1) - Modell. Wenn wir uns die Grundstücke der Residuen anschauen, sehen wir Raum für Verbesserungen. Die Residuen zeigen immer noch ein Zeichen der zyklischen Variation: Die ACF und PACF legen nahe, dass sowohl MA (1) als auch SMA (1) Koeffizienten benötigt werden: Eine verbesserte Version: ARIMA (1,0,1) x (0,1,1) Mit Konstanten Wenn wir die angezeigten MA (1) und SMA (1) Terme dem vorhergehenden Modell hinzufügen, erhalten wir ein ARIMA (1,0,1) x (0,1,1) Modell mit einer Konstante, deren Prognosegleichung Dies ist Ist fast das gleiche wie das ARIMA (0,1,1) x (0,1,1) - Modell, mit der Ausnahme, dass es die nicht-saisonale Differenz durch einen AR (1) - Term ersetzt (eine partielle Differentialquot) und einen konstanten Term enthält, Langfristigen Trend. Daher nimmt dieses Modell einen stabileren Trend an als das ARIMA (0,1,1) x (0,1,1) - Modell, und das ist der Hauptunterschied zwischen ihnen. Die Modell-Anpassungsergebnisse sind wie folgt: Beachten Sie, dass der geschätzte AR (1) - Koeffizient (981 1 in der Modellgleichung) 0,96 ist, der sehr nahe bei 1,0 liegt, aber nicht so nahe ist, dass er unbedingt ersetzt werden sollte Ein erster Unterschied: sein Standardfehler ist 0.02, also ist er ungefähr 2 Standardfehler von 1.0. Die anderen Statistiken des Modells (die geschätzten MA (1) - und SMA (1) - Koeffizienten und Fehlerstatistiken in den Schätz - und Validierungsperioden sind ansonsten mit denen des ARIMA (0,1,1) x (0,1 , 1) - Modell. (Die geschätzten MA (1) und SMA (1) Koeffizienten sind 0,45 und 0,91 in diesem Modell gegenüber 0,48 und 0,91 in der anderen.) Die geschätzte MEAN von 0,68 ist der vorhergesagte langfristige Trend (durchschnittliche jährliche Steigerung). Dies ist im wesentlichen der gleiche Wert, der im (1,0,0) x (0,1,0) - mit konstanten Modell erhalten wurde. Der Standardfehler des geschätzten Mittels ist 0,26, so dass die Differenz zwischen 0,75 und 0,68 nicht signifikant ist. Wenn die Konstante nicht in diesem Modell enthalten wäre, wäre es ein gedämpftes Trendmodell: Der Trend in seinen sehr langfristigen Prognosen würde allmählich abflachen. Die Punktvorhersagen aus diesem Modell ähneln denen des (0,1,1) x (0,1,1) - Modells, da der durchschnittliche Trend dem lokalen Trend am Ende der Serie ähnlich ist. Allerdings wachsen die Konfidenzintervalle für dieses Modell etwas weniger schnell aufgrund seiner Annahme, dass der Trend stabil ist. Beachten Sie, dass die Vertrauensgrenzen für die zweijährigen Prognosen nun innerhalb der horizontalen Rasterlinien bei 24 und 44 bleiben, während die Werte des (0,1,1) x (0,1,1) Modells nicht: saisonale ARIMA Versus exponentielle Glättung und saisonale Anpassung: Jetzt können wir die Leistung der beiden besten ARIMA - Modelle mit einfachen und linearen exponentiellen Glättungsmodellen vergleichen, begleitet von einer multiplikativen saisonalen Anpassung und dem Winters - Modell, wie in den Dias zur Prognose mit saisonaler Anpassung dargestellt: Sind die Ein-Perioden-Prognosen für alle Modelle in diesem Fall extrem eng. Es ist schwierig, eine 8220winner8221 basierend auf diesen Zahlen allein auszuwählen. Zurück zum Seitenanfang. Was sind die Kompromisse zwischen den verschiedenen saisonalen Modellen Die drei Modelle, die multiplikative saisonale Anpassung verwenden Deal mit Saisonalität in einer expliziten Weise - d. H. Werden saisonale Indizes als expliziter Teil des Modells ausgebrochen. Die ARIMA-Modelle behandeln Saisonalität in einer impliziteren Weise - wir können nicht leicht sehen, in der ARIMA-Ausgabe, wie die durchschnittliche Dezember, sagen, unterscheidet sich von der durchschnittlichen Juli. Abhängig davon, ob es wichtig ist, das saisonale Muster zu isolieren, könnte dies ein Faktor bei der Auswahl unter den Modellen sein. Die ARIMA-Modelle haben den Vorteil, dass sie, sobald sie initialisiert worden sind, weniger bewegliche Teile als die exponentiellen Glättungs - und Einstellmodelle haben und daher weniger wahrscheinlich sind, die Daten zu überladen. ARIMA models also have a more solid underlying theory with respect to the calculation of confidence intervals for longer-horizon forecasts than do the other models. There are more dramatic differences among the models with respect to the behavior of their forecasts and confidence intervals for forecasts more than 1 period into the future. This is where the assumptions that are made with respect to changes in the trend and seasonal pattern are very important. Between the two ARIMA models, one (model A) estimates a time-varying trend, while the other (model B) incorporates a long-term average trend. (We could, if we desired, flatten out the long-term trend in model B by suppressing the constant term.) Among the exponential-smoothing-plus-adjustment models, one (model C) assumes a flat trend, while the other (model D) assumes a time-varying trend. The Winters model (E) also assumes a time-varying trend. Models that assume a constant trend are relatively more confident in their long-term forecasts than models that do not, and this will usually be reflected in the extent to which confidence intervals for forecasts get wider at longer forecast horizons. Models that do not assume time-varying trends generally have narrower confidence intervals for longer-horizon forecasts, but narrower is not better unless this assumption is correct. The two exponential smoothing models combined with seasonal adjustment assume that the seasonal pattern has remained constant over the 23 years in the data sample, while the other three models do not. Insofar as the seasonal pattern accounts for most of the month-to-month variation in the data, getting it right is important for forecasting what will happen several months into the future. If the seasonal pattern is believed to have changed slowly over time, another approach would be to just use a shorter data history for fitting the models that estimate fixed seasonal indices. For the record, here are the forecasts and 95 confidence limits for May 1995 (24 months ahead) that are produced by the five models: The point forecasts are actually surprisingly close to each other, relative to the widths of all the confidence intervals. The SES point forecast is the lowest, because it is the only model that does not assume an upward trend at the end of the series. The ARIMA (1,0,1)x(0,1,1)c model has the narrowest confidence limits, because it assumes less time-variation in the parameters than the other models. Also, its point forecast is slightly larger than those of the other models, because it is extrapolating a long-term trend rather than a short-term trend (or zero trend). The Winters model is the least stable of the models and its forecast therefore has the widest confidence limits, as was apparent in the detailed forecast plots for the models. And the forecasts and confidence limits of the ARIMA(0,1,1)x(0,1,1) model and those of the LESseasonal adjustment model are virtually identical To log or not to log Something that we have not yet done, but might have, is include a log transformation as part of the model. Seasonal ARIMA models are inherently additive models, so if we want to capture a multiplicative seasonal pattern . we must do so by logging the data prior to fitting the ARIMA model. (In Statgraphics, we would just have to specify quotNatural Logquot as a modeling option--no big deal.) In this case, the deflation transformation seems to have done a satisfactory job of stabilizing the amplitudes of the seasonal cycles, so there does not appear to be a compelling reason to add a log transformation as far as long term trends are concerned. If the residuals showed a marked increase in variance over time, we might decide otherwise. There is still a question of whether the errors of these models have a consistent variance across months of the year . If they don8217t, then confidence intervals for forecasts might tend to be too wide or too narrow according to the season. The residual-vs-time plots do not show an obvious problem in this regard, but to be thorough, it would be good to look at the error variance by month. If there is indeed a problem, a log transformation might fix it. Return to top of page.

No comments:

Post a Comment