A Correlogram tale In der Datenanalyse beginnen wir in der Regel mit den deskriptiven statistischen Eigenschaften der Probendaten (z. B. Mittelwert, Standardabweichung, Schiefe, Kurtosis, empirische Verteilung, etc.). Diese Berechnungen sind zweifellos nützlich, aber sie berücksichtigen nicht die Reihenfolge der Beobachtungen in den Beispieldaten. Die Zeitreihenanalyse verlangt, dass wir die Aufmerksamkeit auf die Ordnung und damit auf eine andere Art von deskriptiven Statistiken zu bezahlen: Zeitreihe deskriptive Statistiken oder einfach Korrektogramm-Analyse. Die Korrelogrammanalyse untersucht die zeitabhängige Abhängigkeit innerhalb der Probendaten und konzentriert sich auf die empirische Autokovarianz, Autokorrelation und verwandte statistische Tests. Schließlich ist das Korrelogramm ein Eckpfeiler zur Identifizierung der Modell - und Modellreihenfolge. Was bedeutet ein Plot für Autokorrelation (ACF) und eine partielle Autokorrelation (PACF) über die zugrunde liegende Prozessdynamik? Dieses Tutorial ist etwas theoretischer als bisherige Tutorials in der gleichen Serie, aber wir werden unser Bestes tun, um die Intuitionen zu fahren Zu Hause für Sie. Hintergrund Erste, gut mit einer Definition für die Auto-Korrelation-Funktion beginnen, vereinfachen und untersuchen die theoretische ACF für einen ARMA-Typ des Prozesses. Autokorrelationsfunktion (ACF) Nach Definition wird die Autokorrelation für die Verzögerung k wie folgt ausgedrückt: Mit Hilfe der Autokorrelationsformel MA (q) können wir die Autokorrelationsfunktionen ARMA (p, q) für ihre MA-Repräsentation berechnen . Dies wird intensiv Einige von Ihnen vielleicht fragen, warum wir havent verwendet VAR oder eine Zustandsraumdarstellung zur Vereinfachung der Notationen. Ich machte einen Punkt, um im Zeitbereich zu bleiben, und vermied jegliche neuen Ideen oder mathematischen Tricks, da sie unseren Intentionen hier nicht dienen würden: Den genauen ARMA-Auftrag unter Verwendung der ACF-Werte von sich auszuführen, was alles andere als präzise ist. Intuition: Die ACF-Werte können als die Koeffizientenwerte des äquivalenten MA-Modells angesehen werden. Intuition: Die bedingte Varianz hat keine Barriere (Wirkung) auf die Autokorrelationsberechnungen. Intuition: Das Langzeit-Mittel hat auch keine Barriere (Wirkung) auf die Autokorrelationen. Partielle Autokorrelationsfunktion (PACF) Wir haben mittlerweile gesehen, dass die Identifizierung der Modellreihenfolge (MA oder AR) für nicht einfache Fälle nicht trivial ist, so dass wir eine andere partielle Autokorrelationsfunktion (PACF) benötigen. Die partielle Autokorrelationsfunktion (PACF) spielt eine wichtige Rolle bei der Datenanalyse, die darauf abzielt, das Ausmaß der Verzögerung in einem autoregressiven Modell zu bestimmen. Die Verwendung dieser Funktion wurde als Teil des Box-Jenkins-Ansatzes für die Zeitreihenmodellierung eingeführt, wobei man die entsprechenden Verzögerungen p in einem AR (p) - Modell oder in einem erweiterten ARIMA (p, d, q) - Modell durch Plotten bestimmen konnte Die partiellen Autokorrelationsfunktionen. Einfach ausgedrückt, ist die PACF für Lag k der Regressionskoeffizient für den k-ten Term, wie unten gezeigt: Die PACF nimmt an, dass das zugrundeliegende Modell ein AR (k) ist und mehrere Regressionen verwendet, um den letzten Regressionskoeffizienten zu berechnen. Schnelle Intuition: Die PACF-Werte können (grob gesprochen) als Koeffizientenwerte des äquivalenten AR-Modells betrachtet werden. Wie ist die PACF hilfreich für uns Angenommen, wir haben ein AR (p) - Verfahren, dann hat die PACF signifikante Werte für die ersten p-Verzögerungen und wird danach auf Null fallen. Was ist mit dem MA-Prozess Der MA-Prozess hat ungleich Null-PACF-Werte für eine (theoretisch) unendliche Anzahl von Verzögerungen. Beispiel 4: MA (1) Identifizieren der Zahlen von AR - oder MA-Terme in einem ARIMA-Modell ACF - und PACF-Plots: Nachdem eine Zeitreihe durch Differenzieren stationarisiert wurde, ist der nächste Schritt bei der Anpassung eines ARIMA-Modells, um festzustellen, ob AR - oder MA-Begriffe Werden benötigt, um jegliche Autokorrelation zu korrigieren, die in der differenzierten Reihe verbleibt. Natürlich, mit Software wie Statgraphics, könnten Sie nur versuchen, einige verschiedene Kombinationen von Begriffen und sehen, was am besten funktioniert. Aber es gibt einen systematischeren Weg, dies zu tun. Durch Betrachten der Autokorrelationsfunktion (ACF) und partiellen Autokorrelations - (PACF-) Plots der differenzierten Serien können Sie die Anzahl der benötigten AR - und MA-Terme vorläufig identifizieren. Sie sind bereits mit dem ACF-Diagramm vertraut: Es ist nur ein Balkendiagramm der Koeffizienten der Korrelation zwischen einer Zeitreihe und Verzögerungen von sich selbst. Das PACF-Diagramm ist ein Diagramm der partiellen Korrelationskoeffizienten zwischen der Reihe und den Verzögerungen von sich selbst. Im allgemeinen ist die Quotientquot-Korrelation zwischen zwei Variablen der Betrag der Korrelation zwischen ihnen, der nicht durch ihre gegenseitigen Korrelationen mit einem bestimmten Satz von anderen Variablen erklärt wird. Wenn wir z. B. eine Variable Y auf andere Variablen X1, X2 und X3 zurückrechnen, ist die partielle Korrelation zwischen Y und X3 der Betrag der Korrelation zwischen Y und X3, der nicht durch ihre gemeinsamen Korrelationen mit X1 und X2 erklärt wird. Diese partielle Korrelation kann als Quadratwurzel der Abweichung berechnet werden, die durch Addition von X3 an die Regression von Y auf X1 und X2 erreicht wird. Eine partielle Autokorrelation ist die Größe der Korrelation zwischen einer Variablen und einer Verzögerung von sich, die nicht durch Korrelationen bei allen niedrigeren Ordnungsschichten erklärt wird. Die Autokorrelation einer Zeitreihe Y bei der Verzögerung 1 ist der Koeffizient der Korrelation zwischen Y t und Y t - 1. Was vermutlich auch die Korrelation zwischen Y t -1 und Y t -2 ist. Aber wenn Y t mit Y t -1 korreliert. Und Y t -1 ist gleich mit Y t -2 korreliert. Dann sollten wir auch erwarten, Korrelation zwischen Y t und Y t-2 zu finden. Tatsächlich ist die Korrelationsmenge, die wir bei der Verzögerung 2 erwarten sollten, genau das Quadrat der Lag-1-Korrelation. Folglich propagiert die Korrelation bei Verzögerung 1 eine Verzögerung 2 und vermutlich zu Verzögerungen höherer Ordnung. Die partielle Autokorrelation bei Verzögerung 2 ist daher die Differenz zwischen der tatsächlichen Korrelation bei Verzögerung 2 und der erwarteten Korrelation aufgrund der Ausbreitung der Korrelation bei Verzögerung 1. Hier ist die Autokorrelationsfunktion (ACF) der UNITS-Reihe, bevor irgendeine Differenzierung durchgeführt wird: Die Autokorrelationen sind für eine große Anzahl von Verzögerungen signifikant, aber vielleicht sind die Autokorrelationen bei den Verzögerungen 2 und höher lediglich auf die Ausbreitung der Autokorrelation bei Verzögerung 1 zurückzuführen. Dies wird durch die PACF-Kurve bestätigt: Es ist zu beachten, daß die PACF-Kurve signifikant ist Spike nur bei Verzögerung 1, was bedeutet, dass alle Autokorrelationen höherer Ordnung effektiv durch die Lag-1-Autokorrelation erklärt werden. Die partiellen Autokorrelationen bei allen Verzögerungen können durch Anpassen einer Folge autoregressiver Modelle mit zunehmender Anzahl von Verzögerungen berechnet werden. Insbesondere ist die partielle Autokorrelation bei Verzögerung k gleich dem geschätzten AR (k) - Koeffizienten in einem autoregressiven Modell mit k Terme - d. e. Ein Multiregressionsmodell, bei dem Y auf LAG (Y, 1), LAG (Y, 2) usw. bis zu LAG (Y, k) zurückgerechnet wird. Somit können Sie durch bloße Inspektion der PACF bestimmen, wie viele AR-Begriffe Sie verwenden müssen, um das Autokorrelationsmuster in einer Zeitreihe zu erläutern: Wenn die partielle Autokorrelation bei einer Verzögerung k signifikant ist und bei einer höheren Ordnung nicht signifikant ist - d. h. Wenn die PACF-Abkürzung offquot bei Verzögerung k - dann schlägt dies vor, Sie sollten versuchen, Montage eines autoregressiven Modells der Ordnung k Die PACF der UNITS-Serie bietet ein extremes Beispiel für die Cut-off-Phänomen: es hat eine sehr große Spitze bei Verzögerung 1 Und keine anderen signifikanten Spitzen, was anzeigt, daß bei Abwesenheit der Differenzierung ein AR (1) - Modell verwendet werden sollte. Jedoch wird sich der AR (1) - Term in diesem Modell als äquivalent zu einer ersten Differenz erweisen, da der geschätzte AR (1) - Koeffizient (der die Höhe der PACF-Spitze bei der Verzögerung 1 ist) nahezu genau gleich 1 ist Die Prognose-Gleichung für ein AR (1) - Modell für eine Reihe Y ohne Abweichungsreihenfolge lautet: Ist der AR (1) - Koeffizient 981 1 in dieser Gleichung gleich 1, so ist dies gleichbedeutend mit der Vorhersage, daß die erste Differenz Von Y konstant ist Es ist gleichbedeutend mit der Gleichung des zufälligen Wandermodells mit Wachstum: Die PACF der UNITS-Reihe sagt uns, dass, wenn wir es nicht unterscheiden, dann sollten wir ein AR (1) - Modell passen, das sich als äquivalent zum Nehmen eignet Eine erste Differenz. Mit anderen Worten, es sagt uns, dass UNITS wirklich eine Ordnung der Differenzierung benötigt, um stationär zu sein. AR - und MA-Signaturen: Wenn die PACF einen scharfen Cutoff zeigt, während der ACF langsamer abnimmt (dh signifikante Spikes bei höheren Lags), dann sagen wir, dass die stationäre Serie eine Zehnsignatur aufweist, was bedeutet, dass das Autokorrelationsmuster leichter erklärt werden kann Durch Hinzufügen von AR-Terme als durch Hinzufügen von MA-Terme. Sie werden wahrscheinlich feststellen, dass eine AR-Signatur gewöhnlich mit einer positiven Autokorrelation bei der Verzögerung 1 assoziiert ist - d. h. Es neigt dazu, in Serie, die leicht unter differenziert auftreten. Der Grund dafür ist, dass ein AR-Term wie eine partielle Differentialquot in der Prognosegleichung agieren kann. Beispielsweise wirkt der AR-Term in einem AR (1) - Modell wie eine erste Differenz, wenn der autoregressive Koeffizient gleich 1 ist, er tut nichts, wenn der autoregressive Koeffizient null ist, und er wirkt wie eine partielle Differenz, wenn der Koeffizient dazwischen liegt 0 und 1. Also, wenn die Reihe etwas unterdifferenziert ist - dh Wenn das nichtstationäre Muster der positiven Autokorrelation nicht vollständig eliminiert worden ist, wird es eine Teilsumme für eine Teildifferenz durch Anzeige einer AR-Signatur zustellen. Folglich haben wir die folgende Faustregel, um festzustellen, wann man AR-Begriffe hinzufügen soll: Regel 6: Wenn die PACF der differenzierten Reihe einen scharfen Cutoff aufweist unddie Lag-1-Autokorrelation positiv ist - i. e. Wenn die Serie etwas quadratisch unterschieden wird, dann erwägen Sie, dem Modell einen AR-Term hinzuzufügen. Die Verzögerung, bei der die PACF abschaltet, ist die angegebene Anzahl von AR-Terme. Grundsätzlich kann jedes Autokorrelationsmuster aus einer stationären Reihe entfernt werden, indem genügend autoregressive Terme (Verzögerungen der stationären Reihe) zu der Vorhersagegleichung addiert werden, und die PACF sagt Ihnen, wie viele solche Ausdrücke wahrscheinlich benötigt werden. Dies ist jedoch nicht immer der einfachste Weg, um ein gegebenes Muster der Autokorrelation zu erklären: Manchmal ist es effizienter, MA-Bedingungen (Verzögerungen der Prognosefehler) hinzuzufügen. Die Autokorrelationsfunktion (ACF) spielt dieselbe Rolle für MA-Terme, die die PACF für AR-Terme spielt - das heißt, der ACF teilt Ihnen mit, wie viele MA-Bedingungen benötigt werden, um die verbleibende Autokorrelation aus den differenzierten Serien zu entfernen. Wenn die Autokorrelation bei Verzögerung k aber nicht bei höheren Verzögerungen signifikant ist, d. h. Wenn die ACF-Abkürzungen offquot bei Verzögerung k - dies zeigt, dass genau k MA-Terme in der Prognosegleichung verwendet werden sollten. Im letzteren Fall sagen wir, daß die Stationarisierte Reihe eine Signatur von "Signatur" aufweist, was bedeutet, daß das Autokorrelationsmuster durch Hinzufügen von MA-Terme leichter erklärt werden kann als durch Hinzufügen von AR-Terme. Eine MA-Signatur ist gewöhnlich mit einer negativen Autokorrelation bei der Verzögerung 1 verbunden - d. h. Es neigt dazu, in Serie, die etwas über differenziert sind entstehen. Der Grund hierfür ist, dass ein MA-Begriff in der Prognosegleichung partiell eine Reihenfolge der Differenzierung aufheben kann. Um dies zu sehen, sei daran erinnert, dass ein ARIMA (0,1,1) Modell ohne Konstante einem Simple Exponential Smoothing Modell entspricht. Die Prognose-Gleichung für dieses Modell ist, wenn der MA (1) - Koeffizient 952 1 der Größe 1 - 945 im SES-Modell entspricht. Wenn 952 1 gleich 1 ist, entspricht dies einem SES-Modell mit 945 0, was nur ein CONSTANT-Modell ist, da die Prognose nie aktualisiert wird. Dies bedeutet, daß, wenn 952 1 gleich 1 ist, tatsächlich die Differenzierungsoperation aufgehoben wird, die gewöhnlich die SES-Prognose ermöglicht, sich bei der letzten Beobachtung wieder zu verankern. Wenn andererseits der gleitende mittlere Koeffizient gleich 0 ist, reduziert sich dieses Modell auf ein zufälliges Wandermodell, d. h. Es lässt den differencing Betrieb allein. Also, wenn 952 1 etwas größer als 0 ist, ist es, als ob wir teilweise eine Reihenfolge der Differenzierung aufheben. Ist die Reihe schon etwas überdifferenziert - d. h. Wenn eine negative Autokorrelation eingeführt wurde -, dann wird es für eine quadratische Abweichung durch eine MA-Signatur aufgehoben. (Im Folgenden wird eine weitere Faustregel aufgeführt: Regel 7: Wenn der ACF der differenzierten Serie a. Zeigt, dass der ACF der differenzierten Serie a Scharfen Cutoff und die Lag-1-Autokorrelation negativ ist Wenn die Reihe etwas quotoverdifferencedquot erscheint - dann erwäge, einen MA-Begriff dem Modell hinzuzufügen. Die Verzögerung, bei der der ACF abschaltet, ist die angegebene Anzahl von MA-Begriffen. Ein Modell für die UNITS-Serie - ARIMA (2,1,0): Bisher haben wir festgestellt, dass die UNITS-Serie (mindestens) eine Reihenfolge der nicht-saisonalen Differenzierung benötigt, um stationär zu sein. Nach der Einnahme eines nicht sonderbaren Unterschieds - d. h. (A) die Korrelation bei Verzögerung 1 ist signifikant und positiv, und (b) zeigt die PACF ein schärferes quadratisches Quadrat an Die ACF. Insbesondere hat die PACF nur zwei signifikante Spitzen, während die ACF vier hat. Somit zeigt die differenzierte Reihe gemäß Regel 7 eine AR (2) Signatur an. Wenn wir also die Ordnung des AR-Termes auf 2 einstellen - d. h. Passen wir ein ARIMA (2,1,0) - Modell an - erhalten wir die folgenden ACF - und PACF-Diagramme für die Residuen: Die Autokorrelation bei den entscheidenden Verzögerungen - nämlich den Verzögerungen 1 und 2 - wurde eliminiert und es gibt kein wahrnehmbares Muster In höherwertigen Verzögerungen. Der Zeitreihenplot der Residuen zeigt eine leicht besorgniserregende Tendenz, vom Mittel wegzuwandern: Der Analysezusammenfassungsbericht zeigt jedoch, dass das Modell im Validierungszeitraum trotzdem sehr gut abläuft, beide AR-Koeffizienten unterscheiden sich signifikant von Null und dem Standard Wurde die Abweichung der Residuen durch die Addition der AR-Terme von 1.54371 auf 1.4215 (nahezu 10) reduziert. Darüber hinaus gibt es keine Anzeichen für eine Quotierung Rootquot, weil die Summe der AR-Koeffizienten (0,2522540.195572) nicht in der Nähe von 1 liegt. (Einheitswurzeln werden unten ausführlicher diskutiert.) Insgesamt scheint dies ein gutes Modell zu sein . Die (untransformierten) Prognosen für das Modell zeigen einen linearen Aufwärtstrend, der in die Zukunft projiziert wird: Der Trend bei den Langzeitprognosen ist darauf zurückzuführen, dass das Modell eine nicht sonderbare Differenz und einen konstanten Term enthält: Dieses Modell ist im Grunde ein Zufallswandergang Wachstum durch die Addition von zwei autoregressive Begriffe - d. H Zwei Verzögerungen der differenzierten Reihe. Die Steigung der Langzeitprognosen (d. h. der durchschnittliche Anstieg von einer Periode zu einer anderen) ist gleich dem mittleren Term in der Modellzusammenfassung (0,467566). Die Vorhersagegleichung lautet: wobei 956 der konstante Term in der Modellzusammenfassung (0,258178), 981 1 der AR (1) - Koeffizient (0,25224) und 981 2 der AR (2) - Koeffizient (0,1995572) ist. Mittelwert gegen Konstante: Im allgemeinen bezieht sich der Quotientterm in der Ausgabe eines ARIMA-Modells auf den Mittelwert der differenzierten Reihe (dh der mittlere Trend, wenn die Reihenfolge der Differenzierung gleich 1 ist), während der Konstantantquot der konstante Ausdruck ist Auf der rechten Seite der Prognose-Gleichung. Die mittleren und konstanten Terme sind durch die Gleichung: CONSTANT MEAN (1 minus der Summe der AR-Koeffizienten) verknüpft. In diesem Fall haben wir 0.258178 0.467566 (1 - 0.25224 - 0.195572) Alternatives Modell für die UNITS - Serie - ARIMA (0,2,1): Denken Sie daran, dass wir bei der Analyse der UNITS - Serie nicht ganz sicher waren Richtige Reihenfolge der Differenzierung zu verwenden. Eine Reihenfolge der Nichtsaisondifferenzierung ergab die niedrigste Standardabweichung (und ein Muster einer leichten positiven Autokorrelation), während zwei Ordnungen von nicht seasonaler Differenzierung ein eher stationäreres Zeitreihenplot (aber mit ziemlich starker negativer Autokorrelation) ergaben. Hier sind sowohl die ACF und PACF der Serie mit zwei nicht sonderbaren Differenzen: Der einzelne negative Spike bei Lag 1 in der ACF ist eine MA (1) Signatur, gemäß Regel 8 oben. Wenn wir also zwei nicht-seasonale Differenzen verwenden würden, müßten wir auch einen MA (1) - Term enthalten, was ein ARIMA (0,2,1) - Modell ergibt. Gemäß Regel 5 würden wir auch den konstanten Begriff unterdrücken wollen. Hier sind die Ergebnisse der Anpassung eines ARIMA (0,2,1) - Modells ohne Konstante: Beachten Sie, dass die geschätzte Weißabstand-Standardabweichung (RMSE) für dieses Modell nur sehr geringfügig höher ist als die vorherige (1.46301 hier gegenüber 1.45215 vorher). Die Prognose-Gleichung für dieses Modell ist: wobei theta-1 der MA (1) - Koeffizient ist. Es sei daran erinnert, dass dies einem linearen exponentiellen Glättungsmodell ähnlich ist, wobei der MA (1) - Koeffizient der Größe 2 (1-alpha) im LES-Modell entspricht. Der MA (1) - Koeffizient von 0,76 in diesem Modell deutet darauf hin, dass ein LES-Modell mit alpha in der Nähe von 0,72 würde gleich gut passen. Wenn ein LES-Modell an dieselben Daten angepasst wird, erweist sich der optimale Wert von & agr; als ungefähr 0,61, was nicht zu weit weg ist. Hier ist ein Modellvergleichsbericht, der die Ergebnisse der Anpassung des ARIMA (2,1,0) Modells mit Konstante, das ARIMA (0,2,1) Modell ohne Konstante und das LES Modell zeigt: Die drei Modelle sind nahezu identisch Der Schätzzeitraum und das ARIMA-Modell (2,1,0) mit Konstanten etwas besser als die beiden anderen in der Validierungsperiode. Auf der Grundlage dieser statistischen Ergebnisse allein wäre es schwer, zwischen den drei Modellen zu wählen. Wenn wir jedoch die langfristigen Prognosen des ARIMA-Modells (0,2,1) ohne Konstante (die im Wesentlichen dieselben wie die des LES-Modells sind) darstellen, sehen wir einen signifikanten Unterschied zu denen des früheren Modells: Die Prognosen haben einen etwas geringeren Aufwärtstrend als jene des früheren Modells - weil der lokale Trend nahe dem Ende der Serie etwas geringer ist als der durchschnittliche Trend über die ganze Serie -, aber die Vertrauensintervalle weiten sich viel schneller. Das Modell mit zwei Ordnungen der Differenzierung geht davon aus, dass der Trend in der Serie zeitlich variabel ist, daher hält er die ferne Zukunft viel unsicherer als das Modell mit nur einer Ordnung der Differenzierung. Welches Modell wir wählen sollten Das hängt von den Annahmen ab, die wir in Bezug auf die Konstanz des Trendes in den Daten komfortabel machen. Das Modell mit nur einer Ordnung der Differenzierung nimmt einen konstanten durchschnittlichen Trend - es handelt sich im Wesentlichen um ein fein abgestimmtes Zufallsmodell mit Wachstum - und macht daher relativ konservative Trendprojektionen. Es ist auch ziemlich optimistisch über die Genauigkeit, mit der es mehr als eine Periode vorhersagen kann. Das Modell mit zwei Differenzierungsaufträgen nimmt einen zeitlich variierenden lokalen Trend an - es handelt sich im Wesentlichen um ein lineares exponentielles Glättungsmodell - und seine Trendprojektionen sind etwas unbeständiger. Als eine allgemeine Regel in dieser Art von Situation, würde ich empfehlen, die Wahl des Modells mit der niedrigeren Reihenfolge der Differenzierung, andere Dinge sind etwa gleich. In der Praxis scheinen random-walk oder einfach-exponentielle Glättungsmodelle oft besser zu funktionieren als lineare exponentielle Glättungsmodelle. Mixed-Modelle: In den meisten Fällen stellt das beste Modell ein Modell dar, das entweder nur AR-Begriffe oder nur MA-Begriffe verwendet, obwohl in einigen Fällen ein quotiertes Mixedquot-Modell sowohl mit AR - als auch mit MA-Bedingungen die beste Anpassung an die Daten liefern kann. Bei der Montage von gemischten Modellen ist jedoch Vorsicht geboten. Es ist möglich, dass ein AR-Begriff und ein MA-Begriff alle anderen Effekte abbrechen. Obwohl beide in dem Modell signifikant erscheinen können (wie durch die t-Statistik ihrer Koeffizienten beurteilt). Man nehme zum Beispiel an, dass das Modell für eine Zeitreihe ein ARIMA (0,1,1) - Modell ist, sondern ein ARIMA (1,1,2) - Modell - d. h. Sie enthalten einen zusätzlichen AR-Begriff und einen zusätzlichen MA-Begriff. Dann können die zusätzlichen Begriffe am Ende erscheinen erheblich in das Modell, aber im Inneren können sie nur gegeneinander arbeiten. Die resultierenden Parameterschätzungen können zweideutig sein, und der Parameterschätzprozeß kann sehr viele (z. B. mehr als 10) Iterationen zum Konvergieren annehmen. Folglich: Regel 8: Es ist möglich, dass ein AR-Begriff und ein MA-Begriff alle anderen Effekte abbrechen, so dass, wenn ein gemischtes AR-MA-Modell den Daten zu entsprechen scheint, auch ein Modell mit einem weniger AR-Term und einem weniger MA-Begriff versuchen - besonders wenn die Parameterschätzungen im Originalmodell mehr als 10 Iterationen konvergieren müssen. Aus diesem Grund können die ARIMA-Modelle nicht durch einen schrittweisen Ansatz, der sowohl AR - als auch MA-Begriffe umfasst, identifiziert werden. Mit anderen Worten, Sie können nicht beginnen, indem Sie mehrere Begriffe jeder Art und dann werfen die diejenigen, deren geschätzten Koeffizienten sind nicht signifikant. Stattdessen folgen Sie normalerweise einem anfänglichen stepwisequot-Ansatz, indem Sie Begriffe der einen oder anderen Art hinzufügen, wie durch das Auftreten der ACF - und PACF-Diagramme angezeigt wird. Einheitswurzeln: Wenn eine Serie grob unter - oder überdifferenziert ist, d. h. Wenn eine ganze Reihenfolge der Differenzierung hinzugefügt oder annulliert werden muss, wird dies oft durch einen Quototrootquot in den geschätzten AR - oder MA-Koeffizienten des Modells signalisiert. Ein AR (1) - Modell soll eine Einheitswurzel haben, wenn der geschätzte AR (1) - Koeffizient nahezu exakt gleich 1 ist. (Durch quotexaktuelles Gleichheitszeichen I bedeutet wirklich nicht signifikant anders als in den Koeffizienten eigenen Standardfehler. ) Wenn dies geschieht, bedeutet dies, dass der AR (1) Term genau imitiert eine erste Differenz, in diesem Fall sollten Sie den AR (1) Begriff entfernen und fügen Sie eine Reihenfolge der differencing statt. (Dies ist genau das, was passieren würde, wenn Sie ein AR (1) - Modell an die undifferenzierte UNITS-Serie montiert haben, wie bereits erwähnt.) In einem AR-Modell höherer Ordnung existiert ein Einheitswurzel im AR-Teil des Modells, wenn die Summe von Sind die AR-Koeffizienten genau gleich 1. In diesem Fall sollten Sie die Reihenfolge des AR-Terms um 1 reduzieren und eine Reihenfolge der Differenzierung hinzufügen. Eine Zeitreihe mit einer Einheitswurzel in den AR-Koeffizienten ist nichtstationär - i. e. Es braucht eine höhere Reihenfolge der Differenzierung. Regel 9: Wenn es eine Einheit Wurzel in der AR-Teil des Modells - d. H. Wenn die Summe der AR-Koeffizienten fast genau 1 ist, sollten Sie die Anzahl der AR-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins erhöhen. In ähnlicher Weise bedeutet ein MA (1) - Modell eine Einheitswurzel, wenn der geschätzte MA (1) - Koeffizient genau gleich 1 ist. Wenn dies geschieht, bedeutet dies, daß der MA (1) - Term eine erste Differenz exakt annulliert In diesem Fall sollten Sie den Begriff MA (1) entfernen und auch die Reihenfolge der Differenzierung um eins reduzieren. In einem MA-Modell höherer Ordnung existiert eine Einheitswurzel, wenn die Summe der MA-Koeffizienten exakt gleich 1 ist. Regel 10: Besteht im MA-Teil des Modells eine Einheitswurzel, d. h. Wenn die Summe der MA-Koeffizienten fast genau 1 ist - sollten Sie die Anzahl der MA-Terme um eins reduzieren und die Reihenfolge der Differenzierung um eins reduzieren. Wenn Sie beispielsweise ein lineares exponentielles Glättungsmodell (ein ARIMA (0,2,2) - Modell) platzieren, wenn ein einfaches exponentielles Glättungsmodell (ein ARIMA (0,1,1) - Modell) ausreichend wäre, können Sie das finden Ist die Summe der beiden MA-Koeffizienten sehr nahezu gleich 1. Durch Verringerung der MA-Ordnung und der Reihenfolge der Differenzierung um eins erhält man das passendere SES-Modell. Ein Prognosemodell mit einer Einheitswurzel in den geschätzten MA-Koeffizienten wird als nicht-invertierbar bezeichnet. Was bedeutet, dass die Residuen des Modells nicht als Schätzwerte des quottruequot zufälligen Rauschens betrachtet werden können, das die Zeitreihen erzeugt hat. Ein weiteres Symptom einer Einheit Wurzel ist, dass die Prognosen des Modells kann aufblinken upquot oder sonst verhalten bizarr. Wenn das Zeitreihenplot der längerfristigen Prognosen des Modells seltsam aussieht, sollten Sie die geschätzten Koeffizienten Ihres Modells auf das Vorhandensein eines Einheitswurzels überprüfen. Regel 11: Wenn die Langzeitprognosen unregelmäßig oder unbeständig erscheinen, kann es einen Einheitswurzel in den AR - oder MA-Koeffizienten geben. Keines dieser Probleme entstand bei den beiden Modellen, die hier angebracht wurden, weil wir sorgfältig mit plausiblen Ordnungen von Differenzierung und entsprechender Anzahl von AR - und MA-Koeffizienten beginnen, indem wir die ACF - und PACF-Modelle studierten. Detailliertere Erörterungen von Einheitswurzeln und Annullierungseffekten zwischen AR - und MA-Begriffen finden Sie in der mathematischen Struktur des ARIMA-Modells Handout.2.1 Moving Average Models (MA-Modelle) Zeitreihenmodelle, die als ARIMA-Modelle bekannt sind, können autoregressive Begriffe und gleitende Durchschnittsterme enthalten. In Woche 1 erlernten wir einen autoregressiven Term in einem Zeitreihenmodell für die Variable x t ist ein verzögerter Wert von x t. Beispielsweise ist ein autoregressiver Term der Verzögerung 1 x t-1 (multipliziert mit einem Koeffizienten). Diese Lektion definiert gleitende Durchschnittsterme. Ein gleitender Durchschnittsterm in einem Zeitreihenmodell ist ein vergangener Fehler (multipliziert mit einem Koeffizienten). Es sei n (0, sigma2w) überschritten, was bedeutet, daß die wt identisch unabhängig voneinander verteilt sind, jeweils mit einer Normalverteilung mit dem Mittelwert 0 und der gleichen Varianz. Das durch MA (1) bezeichnete gleitende Durchschnittsmodell der 1. Ordnung ist (xt mu wt theta1w) Das durch MA (2) bezeichnete gleitende Durchschnittsmodell der zweiten Ordnung ist (xt mu wt theta1w theta2w) Das gleitende Mittelmodell der q-ten Ordnung , Mit MA (q) bezeichnet, ist (xt mu wt theta1w theta2w dots thetaqw) Hinweis. Viele Lehrbücher und Softwareprogramme definieren das Modell mit negativen Vorzeichen vor den Begriffen. Dies ändert nicht die allgemeinen theoretischen Eigenschaften des Modells, obwohl es die algebraischen Zeichen der geschätzten Koeffizientenwerte und (nicht quadrierten) Ausdrücke in Formeln für ACFs und Abweichungen umwandelt. Sie müssen Ihre Software überprüfen, um zu überprüfen, ob negative oder positive Vorzeichen verwendet worden sind, um das geschätzte Modell korrekt zu schreiben. R verwendet positive Vorzeichen in seinem zugrunde liegenden Modell, wie wir hier tun. Theoretische Eigenschaften einer Zeitreihe mit einem MA (1) Modell Beachten Sie, dass der einzige Wert ungleich Null im theoretischen ACF für Verzögerung 1 ist. Alle anderen Autokorrelationen sind 0. Somit ist ein Proben-ACF mit einer signifikanten Autokorrelation nur bei Verzögerung 1 ein Indikator für ein mögliches MA (1) - Modell. Für interessierte Studierende, Beweise dieser Eigenschaften sind ein Anhang zu diesem Handout. Beispiel 1 Angenommen, dass ein MA (1) - Modell x t 10 w t .7 w t-1 ist. Wobei (wt überstehendes N (0,1)). Somit ist der Koeffizient 1 0,7. Die theoretische ACF wird durch eine Plot dieser ACF folgt folgt. Die graphische Darstellung ist die theoretische ACF für eine MA (1) mit 1 0,7. In der Praxis liefert eine Probe gewöhnlich ein solches klares Muster. Unter Verwendung von R simulierten wir n 100 Abtastwerte unter Verwendung des Modells x t 10 w t .7 w t-1, wobei w t iid N (0,1) war. Für diese Simulation folgt ein Zeitreihen-Diagramm der Probendaten. Wir können nicht viel von dieser Handlung erzählen. Die Proben-ACF für die simulierten Daten folgt. Wir sehen eine Spitze bei Verzögerung 1, gefolgt von im Allgemeinen nicht signifikanten Werten für Verzögerungen nach 1. Es ist zu beachten, dass das Beispiel-ACF nicht mit dem theoretischen Muster des zugrunde liegenden MA (1) übereinstimmt, was bedeutet, dass alle Autokorrelationen für Verzögerungen nach 1 0 sein werden Eine andere Probe hätte eine geringfügig unterschiedliche Probe ACF wie unten gezeigt, hätte aber wahrscheinlich die gleichen breiten Merkmale. Theroretische Eigenschaften einer Zeitreihe mit einem MA (2) - Modell Für das MA (2) - Modell sind die theoretischen Eigenschaften die folgenden: Die einzigen Werte ungleich Null im theoretischen ACF sind für die Lags 1 und 2. Autokorrelationen für höhere Lags sind 0 , So zeigt ein Beispiel-ACF mit signifikanten Autokorrelationen bei Lags 1 und 2, aber nicht signifikante Autokorrelationen für höhere Lags ein mögliches MA (2) - Modell. Iid N (0,1). Die Koeffizienten betragen 1 0,5 und 2 0,3. Da es sich hierbei um ein MA (2) handelt, wird der theoretische ACF nur bei den Verzögerungen 1 und 2 Werte ungleich Null aufweisen. Werte der beiden Nicht-Autokorrelationen sind A-Kurve des theoretischen ACF. Wie fast immer der Fall ist, verhalten sich Musterdaten nicht ganz so perfekt wie die Theorie. Wir simulierten n 150 Beispielwerte für das Modell x t 10 w t .5 w t-1 .3 w t-2. Wobei wt iid N (0,1) ist. Die Zeitreihenfolge der Daten folgt. Wie bei dem Zeitreihenplot für die MA (1) Beispieldaten können Sie nicht viel davon erzählen. Die Proben-ACF für die simulierten Daten folgt. Das Muster ist typisch für Situationen, in denen ein MA (2) - Modell nützlich sein kann. Es gibt zwei statistisch signifikante Spikes bei Lags 1 und 2, gefolgt von nicht signifikanten Werten für andere Lags. Beachten Sie, dass aufgrund des Stichprobenfehlers das Muster ACF nicht genau dem theoretischen Muster entsprach. ACF für allgemeine MA (q) - Modelle Eine Eigenschaft von MA (q) - Modellen besteht im Allgemeinen darin, dass Autokorrelationen ungleich Null für die ersten q-Verzögerungen und Autokorrelationen 0 für alle Verzögerungen gt q existieren. Nicht-Eindeutigkeit der Verbindung zwischen Werten von 1 und (rho1) in MA (1) Modell. Im MA (1) - Modell für einen Wert von 1. Die reziproke 1 1 gibt den gleichen Wert für Als Beispiel, verwenden Sie 0.5 für 1. Und dann 1 (0,5) 2 für 1 verwenden. Youll erhalten (rho1) 0,4 in beiden Fällen. Um eine theoretische Einschränkung als Invertibilität zu befriedigen. Wir beschränken MA (1) - Modelle auf Werte mit einem Absolutwert von weniger als 1. In dem gerade angegebenen Beispiel ist 1 0,5 ein zulässiger Parameterwert, während 1 10,5 2 nicht. Invertibilität von MA-Modellen Ein MA-Modell soll invertierbar sein, wenn es algebraisch äquivalent zu einem konvergierenden unendlichen Ordnungs-AR-Modell ist. Durch Konvergenz meinen wir, dass die AR-Koeffizienten auf 0 sinken, wenn wir in der Zeit zurückgehen. Invertibilität ist eine Einschränkung, die in Zeitreihensoftware programmiert ist, die verwendet wird, um die Koeffizienten von Modellen mit MA-Begriffen abzuschätzen. Sein nicht etwas, das wir in der Datenanalyse überprüfen. Zusätzliche Informationen über die Invertibilitätsbeschränkung für MA (1) - Modelle finden Sie im Anhang. Fortgeschrittene Theorie Anmerkung. Für ein MA (q) - Modell mit einem angegebenen ACF gibt es nur ein invertierbares Modell. Die notwendige Bedingung für die Invertierbarkeit ist, daß die Koeffizienten solche Werte haben, daß die Gleichung 1- 1 y-. - q y q 0 hat Lösungen für y, die außerhalb des Einheitskreises liegen. R-Code für die Beispiele In Beispiel 1 wurde der theoretische ACF des Modells x t 10 w t aufgetragen. 7w t-1. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF für die simulierten Daten aufgetragen. Die R-Befehle, die verwendet wurden, um den theoretischen ACF aufzuzeichnen, waren: acfma1ARMAacf (mac (0,7), lag. max10) 10 Verzögerungen von ACF für MA (1) mit theta1 0,7 lags0: 10 erzeugt eine Variable namens lags, die im Bereich von 0 bis 10 liegt (H0) fügt dem Diagramm eine horizontale Achse hinzu Der erste Befehl bestimmt den ACF und speichert ihn in einem Objekt Genannt acfma1 (unsere Wahl des Namens). Der Plotbefehl (der dritte Befehl) verläuft gegen die ACF-Werte für die Verzögerungen 1 bis 10. Der ylab-Parameter bezeichnet die y-Achse und der Hauptparameter einen Titel auf dem Plot. Um die Zahlenwerte der ACF zu sehen, benutzen Sie einfach den Befehl acfma1. Die Simulation und Diagramme wurden mit den folgenden Befehlen durchgeführt. (N150, list (mac (0.7))) Simuliert n 150 Werte aus MA (1) xxc10 addiert 10, um Mittelwert 10. Simulationsvorgaben bedeuten 0. Plot (x, typeb, mainSimulated MA (1) Acf (x, xlimc (1,10), mainACF für simulierte Probendaten) In Beispiel 2 wurde der theoretische ACF des Modells xt 10 wt. 5 w t-1 .3 w t-2 aufgetragen. Und dann n 150 Werte aus diesem Modell simuliert und die Abtastzeitreihen und die Abtast-ACF für die simulierten Daten aufgetragen. Die verwendeten R-Befehle waren acfma2ARMAacf (mac (0,5,0,3), lag. max10) acfma2 lags0: 10 Plot (lags, acfma2, xlimc (1,10), ylabr, typh, main ACF für MA (2) mit theta1 0,5, (X, x) (x, x) (x, x, x, y) mainACF for simulated MA(2) Data) Appendix: Proof of Properties of MA(1) For interested students, here are proofs for theoretical properties of the MA(1) model. Variance: (text (xt) text (mu wt theta1 w ) 0 text (wt) text (theta1w ) sigma2w theta21sigma2w (1theta21)sigma2w) When h 1, the previous expression 1 w 2. For any h 2, the previous expression 0. The reason is that, by definition of independence of the w t . E( w k w j ) 0 for any k j. Further, because the w t have mean 0, E( w j w j ) E( w j 2 ) w 2 . For a time series, Apply this result to get the ACF given above. An invertible MA model is one that can be written as an infinite order AR model that converges so that the AR coefficients converge to 0 as we move infinitely back in time. Well demonstrate invertibility for the MA(1) model. We then substitute relationship (2) for w t-1 in equation (1) (3) (zt wt theta1(z - theta1w ) wt theta1z - theta2w ) At time t-2 . equation (2) becomes We then substitute relationship (4) for w t-2 in equation (3) (zt wt theta1 z - theta21w wt theta1z - theta21(z - theta1w ) wt theta1z - theta12z theta31w ) If we were to continue (infinitely), we would get the infinite order AR model (zt wt theta1 z - theta21z theta31z - theta41z dots ) Note however, that if 1 1, the coefficients multiplying the lags of z will increase (infinitely) in size as we move back in time. To prevent this, we need 1 lt1. This is the condition for an invertible MA(1) model. Infinite Order MA model In week 3, well see that an AR(1) model can be converted to an infinite order MA model: (xt - mu wt phi1w phi21w dots phik1 w dots sum phij1w ) This summation of past white noise terms is known as the causal representation of an AR(1). In other words, x t is a special type of MA with an infinite number of terms going back in time. This is called an infinite order MA or MA(). A finite order MA is an infinite order AR and any finite order AR is an infinite order MA. Recall in Week 1, we noted that a requirement for a stationary AR(1) is that 1 lt1. Lets calculate the Var( x t ) using the causal representation. This last step uses a basic fact about geometric series that requires (phi1lt1) otherwise the series diverges. Navigation
Comments
Post a Comment