Diferença entre média móvel e modelo autorregressivo


Os modelos ARIMA são, em teoria, a classe mais geral de modelos para prever uma série de tempo que pode ser feita para ser estacionária por diferenciação se necessário, talvez em conjunto com transformações não-lineares Tais como registrar ou desinflar, se necessário Uma variável aleatória que é uma série temporal é estacionária se suas propriedades estatísticas são todas constantes ao longo do tempo Uma série estacionária não tem tendência, suas variações em torno de sua média têm uma amplitude constante, e ele se move de forma consistente Ou seja, seus padrões de tempo aleatórios de curto prazo sempre se parecem em um sentido estatístico. A última condição significa que suas correlações de autocorrelações com seus próprios desvios anteriores da média permanecem constantes ao longo do tempo ou, de forma equivalente, que seu espectro de poder permanece constante ao longo do tempo. Variável desta forma pode ser vista como usual como uma combinação de sinal e ruído, eo sinal se um é aparente poderia ser um patt De reversão média rápida ou lenta, ou oscilação sinusoidal, ou alternância rápida no sinal, e também poderia ter uma componente sazonal Um modelo ARIMA pode ser visto como um filtro que tenta separar o sinal do ruído, eo sinal é então Extrapolada para o futuro para obter previsões. A equação de previsão de ARIMA para uma série de tempo estacionária é uma equação de tipo linear de regressão linear, na qual os preditores consistem em atrasos da variável dependente e / ou atrasos dos erros de previsão Isso é. Valor predito de Y Uma soma constante e ou ponderada de um ou mais valores recentes de Y e / ou uma soma ponderada de um ou mais valores recentes dos erros. Se os preditores consistem apenas em valores defasados ​​de Y é um modelo autoregressivo auto-regredido puro, Que é apenas um caso especial de um modelo de regressão e que poderia ser equipado com software de regressão padrão. Por exemplo, um modelo AR 1 auto-regressivo de primeira ordem para Y é um modelo de regressão simples no qual a variável independente i Se apenas alguns dos preditores são defasagens dos erros, um modelo ARIMA não é um modelo de regressão linear, porque não há como especificar o erro do último período s Como uma variável independente, os erros devem ser calculados periodicamente quando o modelo é ajustado aos dados. Do ponto de vista técnico, o problema com o uso de erros retardados como preditores é que as previsões do modelo não são funções lineares do Assim, os coeficientes em modelos ARIMA que incluem erros retardados devem ser estimados por métodos de otimização não-linear escalada em vez de simplesmente resolver um sistema de equações. A sigla ARIMA significa Auto-Regressive Integrated Média Móvel As baixas das séries estacionalizadas na equação de previsão são chamadas de termos autorregressivos, os atrasos dos erros de previsão são chamados de termos de média móvel e uma série de tempo que precisa ser Ser diferenciado para ser feito estacionário é dito ser uma versão integrada de uma série estacionária Random-pé e modelos de tendência aleatória, modelos autorregressivos e modelos de suavização exponencial são todos os casos especiais de modelos ARIMA. Um modelo ARIMA não sazonal é classificado como um ARIMA P, d, q modelo, where. p é o número de termos autorregressivos. d é o número de diferenças não sazonais necessárias para a estacionariedade, e. q é o número de erros de previsão defasados ​​na equação de previsão. A equação de previsão é construída da seguinte forma Notemos que a segunda diferença de Y o caso d 2 não é a diferença de dois períodos atrás. Em vez disso, é a diferença de primeira diferença da primeira diferença que é O análogo discreto de uma segunda derivada, ou seja, a aceleração local da série em vez de sua tendência local. Em termos de y, a equação de previsão geral é. Aqui os parâmetros de média móvel s são definidos de modo que seus sinais sejam negativos na equação Seguindo a convenção introduzida por Box e Jenkins Alguns autores e softwares, incluindo a linguagem de programação R, definem-nos de modo que eles tenham mais sinais ao invés. Quando os números reais são conectados à equação, não há ambigüidade, mas é importante saber qual convenção O software usa quando você está lendo a saída Muitas vezes os parâmetros são indicados por AR 1, AR 2,, e MA 1, MA 2, etc Para identificar o modelo ARIMA apropriado para Y você começa por determinar a ordem de diferenciação d que necessitam Para estacionarizar a série e remover as características brutas da sazonalidade, talvez em conjunto com uma transformação de estabilização de variância, como logging ou deflação Se você parar neste ponto e prever que a série diferenciada é constante, você apenas montou uma caminhada aleatória ou aleatória No entanto, a série estacionária pode ainda ter erros autocorrelacionados, sugerindo que algum número de termos AR p 1 e ou algum número de termos MA q 1 também são necessários Na equação de previsão. O processo de determinar os valores de p, d e q que são melhores para uma dada série de tempo será discutido em seções posteriores das notas cujos links estão no topo desta página, mas uma prévia de alguns Dos tipos de modelos não-temporais ARIMA que são comumente encontrados é dado abaixo. ARIMA 1,0,0 modelo auto-regressivo de primeira ordem se a série é estacionária e autocorrelacionada, talvez ele pode ser previsto como um múltiplo de seu próprio valor anterior, mais um Constante A equação de previsão neste caso é a que é Y regressa sobre si mesma retardada por um período. Este é um modelo de constante ARIMA 1,0,0 Se a média de Y for zero, então o termo constante não seria incluído. Se a inclinação O coeficiente 1 é positivo e menor que 1 em magnitude deve ser menor que 1 em magnitude se Y estiver parado, o modelo descreve o comportamento de reversão de média no qual o valor do próximo período deve ser predito como sendo 1 vezes mais distante da média como Valor do período s Se 1 for negativo, Prediz comportamento de reversão de média com alternância de sinais, ou seja, também prevê que Y estará abaixo do próximo período médio se estiver acima da média desse período. Em um modelo autorregressivo de segunda ordem ARIMA 2,0,0, haveria um Y t-2 termo à direita também, e assim por diante Dependendo dos sinais e magnitudes dos coeficientes, um modelo ARIMA 2,0,0 poderia descrever um sistema cuja reversão média ocorre de forma sinusoidal oscilante, como o movimento De uma massa em uma mola que é sujeita a choques aleatórios. ARIMA 0,1,0 passeio aleatório Se a série Y não é estacionário, o modelo mais simples possível para ele é um modelo de caminhada aleatória, que pode ser considerado como um caso limitativo de Um modelo AR 1 em que o coeficiente autorregressivo é igual a 1, ie uma série com reversão média infinitamente lenta. A equação de predição para este modelo pode ser escrita como. qual o termo constante é a variação média período-período, isto é, a longo prazo Este modelo pode ser montado como uma interceptação sem Em que a primeira diferença de Y é a variável dependente Uma vez que inclui apenas uma diferença não sazonal e um termo constante, é classificada como modelo ARIMA 0,1,0 com constante O modelo randômico-sem-desvio seria Um modelo ARIMA 0,1,0 sem constante. ARIMA 1,1,0 modelo auto-regressivo de primeira ordem diferenciado Se os erros de um modelo randômico randômico são autocorrelacionados, talvez o problema possa ser corrigido adicionando um atraso da variável dependente ao Isto é, regressando a primeira diferença de Y sobre si mesma retardada por um período Isto resultaria na seguinte equação de previsão que pode ser rearranjada para. Este é um modelo autorregressivo de primeira ordem com uma ordem de diferenciamento não sazonal e um termo constante --em um modelo ARIMA 1,1,0.ARIMA 0,1,1 sem alisamento exponencial simples constante Outra estratégia para corrigir erros autocorrelacionados em um modelo de caminhada aleatória é sugerida pelo modelo de suavização exponencial simples. Por exemplo, aqueles que exibem flutuações barulhentas em torno de uma média de variação lenta, o modelo de caminhada aleatória não funciona tão bem quanto uma média móvel de valores passados. Em outras palavras, ao invés de tomar a observação mais recente como a previsão da próxima observação , É melhor usar uma média das últimas observações para filtrar o ruído e estimar com mais precisão a média local O modelo de suavização exponencial simples usa uma média móvel exponencialmente ponderada de valores passados ​​para alcançar este efeito A equação de previsão para a O modelo de suavização exponencial simples pode ser escrito em um número de formas matematicamente equivalentes, uma das quais é a chamada forma de correção de erro, na qual a previsão anterior é ajustada na direção do erro que ela cometeu. Porque e t-1 Y t - 1 - t-1 por definição, isso pode ser reescrito como. que é uma equação de previsão ARIMA 0,1,1-sem-constante com 1 1 - Isso significa que você pode ajustar um smoo exponencial simples Coisa, especificando-o como um modelo ARIMA 0,1,1 sem constante, eo coeficiente MA 1 estimado corresponde a 1-menos-alfa na fórmula SES Lembre-se que no modelo SES, a idade média dos dados no 1- As previsões de período antecipado é de 1, o que significa que tenderão a ficar para trás em relação a tendências ou pontos de viragem em cerca de 1 períodos. Consequentemente, a idade média dos dados nas previsões de um período de 1 período de um ARIMA 0,1,1 - 1 1 - 1 Assim, por exemplo, se 1 0 8, a idade média é 5 Como 1 se aproxima de 1, o modelo ARIMA 0,1,1-sem constante se torna uma média móvel de muito longo prazo e Quando 1 se aproxima de 0, torna-se um modelo randômico-sem-deriva. Qual é a melhor maneira de corrigir a autocorrelação adicionando termos AR ou adicionando termos MA Nos dois modelos anteriores discutidos acima, o problema de erros autocorrelacionados em um modelo de caminhada aleatória Foi fixado de duas maneiras diferentes adicionando um valor defasado da série diferenciada à equação ou adicionando um valor defasado do foreca St erro Qual abordagem é a melhor Uma regra para esta situação, que será discutida em mais detalhes mais adiante, é que a autocorrelação positiva geralmente é melhor tratada pela adição de um termo AR para o modelo e autocorrelação negativa é geralmente melhor tratada por Adicionando um termo MA Na série econômica e de negócios, a autocorrelação negativa surge frequentemente como um artefato de diferenciação. Em geral, a diferenciação reduz a autocorrelação positiva e pode até causar uma mudança de autocorrelação positiva para negativa. Assim, o modelo ARIMA 0,1,1, em Cuja diferenciação é acompanhada por um termo MA, é mais freqüentemente usado do que um modelo ARIMA 1,1,0. ARIMA 0,1,1 com suavização exponencial simples constante com crescimento Ao implementar o modelo SES como um modelo ARIMA, você realmente ganha alguns Flexibilidade Em primeiro lugar, permite-se que o coeficiente de MA 1 estimado seja negativo, o que corresponde a um factor de alisamento superior a 1 num modelo SES, o que normalmente não é permitido pelo procedimento de ajustamento do modelo SES Sec Você tem a opção de incluir um termo constante no modelo ARIMA se desejar, para estimar uma tendência média não-zero. O modelo ARIMA 0,1,1 com constante tem a equação de previsão. As previsões deste modelo são qualitativamente semelhantes às do modelo SES, exceto que a trajetória das previsões de longo prazo é tipicamente uma linha inclinada cuja inclinação é igual a mu ao invés de uma linha horizontal. ARIMA 0,2,1 ou 0, 2,2 sem suavização exponencial linear constante Modelos lineares de suavização exponencial são modelos ARIMA que usam duas diferenças não sazonais em conjunção com os termos MA A segunda diferença de uma série Y não é simplesmente a diferença entre Y e ela mesma retardada por dois períodos, mas sim A primeira diferença da primeira diferença - ou seja, a mudança na mudança de Y no período t Assim, a segunda diferença de Y no período t é igual a Y t - Y t-1 - Y t-1 - Y T-2 Y t-2Y t-1 Y t-2 Uma segunda diferença de uma função discreta é analogou S para uma segunda derivada de uma função contínua mede a aceleração ou curvatura na função em um determinado ponto no tempo. O modelo ARIMA 0,2,2 sem constante prediz que a segunda diferença da série é igual a uma função linear da última Dois erros de previsão. que podem ser rearranjados como. quando 1 e 2 são os coeficientes MA 1 e MA 2 Este é um modelo de alisamento exponencial linear geral essencialmente o mesmo que o modelo de Holt s eo modelo de Brown s um caso especial Ele usa ponderação exponencial Médias móveis para estimar um nível local e uma tendência local na série As previsões de longo prazo deste modelo convergem para uma linha reta cuja inclinação depende da tendência média observada no final da série. ARIMA 1,1,2 sem Este modelo é ilustrado nos slides acompanhantes em modelos ARIMA extrapola a tendência local no final da série, mas aplaina-lo em horizontes de previsão mais longos para introduzir um Ote do conservadorismo, uma prática que tem suporte empírico Veja o artigo sobre Por que a Tendência de Damped trabalha por Gardner e McKenzie eo artigo da regra de ouro por Armstrong et al para detalhes. É geralmente aconselhável ficar com modelos em que pelo menos um de p E q não é maior do que 1, ou seja, não tente encaixar um modelo como o ARIMA 2,1,2, uma vez que isso é susceptível de levar a problemas de overfitting e de fatores comuns que são discutidos com mais detalhes nas notas sobre a matemática Estrutura de modelos ARIMA. Implementação de folha de cálculo Modelos ARIMA como os descritos acima são fáceis de implementar em uma planilha A equação de predição é simplesmente uma equação linear que se refere a valores passados ​​de séries de tempo originais e valores passados ​​dos erros Assim, você pode configurar Uma planilha de previsões ARIMA armazenando os dados na coluna A, a fórmula de previsão na coluna B e os dados de erros menos as previsões na coluna C A fórmula de previsão em uma célula típica na coluna B seria simplesmente um expressio linear N referindo-se a valores nas linhas precedentes das colunas A e C, multiplicados pelos coeficientes AR ou MA apropriados armazenados em outras células na planilha. Identificando os números de termos AR ou MA em um modelo ARIMA. ACF e traçados PACF Após uma série de tempo Tem sido estacionalizado por diferenciação, o próximo passo na montagem de um modelo ARIMA é determinar se AR ou MA termos são necessários para corrigir qualquer autocorrelação que permanece na série diferenciada Claro, com software como Statgraphics, você poderia tentar apenas algumas combinações diferentes de Termos e ver o que funciona melhor Mas existe uma maneira mais sistemática de fazer isso Ao olhar para a função de autocorrelação ACF e parcelar parcial PACF parcelas da série diferenciada, você pode tentativamente identificar os números de AR e ou MA termos que são necessários Você está Já familiarizado com a trama ACF é apenas um gráfico de barras dos coeficientes de correlação entre uma série de tempo e defasagens de si mesmo O gráfico PACF é um gráfico do parcial Os coeficientes de correlação entre as séries e defasagens de si. Em geral, a correlação parcial entre duas variáveis ​​é a quantidade de correlação entre eles que não é explicado por suas correlações mútuas com um conjunto especificado de outras variáveis ​​Por exemplo, se estamos regressando uma variável Y em outras variáveis ​​X1, X2 e X3, a correlação parcial entre Y e X3 é a quantidade de correlação entre Y e X3 que não é explicada por suas correlações comuns com X1 e X2. Esta correlação parcial pode ser computada como a raiz quadrada de A redução na variância que é conseguida pela adição de X3 à regressão de Y em X1 e X2. Uma auto-correlação parcial é a quantidade de correlação entre uma variável e um atraso de si mesmo que não é explicado por correlações em todas as lâminas de ordem inferior A autocorrelação de uma série temporal Y no intervalo 1 é o coeficiente de correlação entre Y t e Y t - 1 que presumivelmente também é a correlação entre Y t -1 e Y t -2 Mas se Y t é correlacionado D com Y t -1 e Y t -1 está igualmente correlacionada com Y t -2, então também deve-se esperar encontrar correlação entre Y t e Y t-2 De fato, a quantidade de correlação que deveríamos esperar no retardo 2 é precisamente Assim, a correlação no retardo 1 propaga-se para o retardo 2 e presumivelmente para atrasos de ordem superior. A autocorrelação parcial no retardo 2 é, portanto, a diferença entre a correlação real no retardo 2 e a correlação esperada devido ao A autocorrelação é significativa para um grande número de defasagens - mas talvez as autocorrelações nos intervalos 2 e acima sejam meramente devidas à função de autocorrelação ACF da série UNITS. Propagação da autocorrelação à defasagem 1 Isto é confirmado pelo gráfico PACF. Note que a parcela PACF tem um pico significativo apenas no retardo 1, o que significa que todas as autocorrelações de ordem superior são efetivamente explicadas pela autocorrelação lag-1. Em particular, a autocorrelação parcial a lag k é igual ao coeficiente estimado de AR k em um modelo autorregressivo com k termos - ie um modelo de regressão múltipla Em que Y é regredido em LAG Y, 1, LAG Y, 2, etc. até LAG Y, k Assim, por simples inspeção do PACF você pode determinar quantos termos AR você precisa usar para explicar o padrão de autocorrelação em um tempo Se a autocorrelação parcial é significativa à lag k e não significativa em qualquer maior atraso de ordem - ou seja, se o PACF corta em lag k - então isso sugere que você deve tentar ajustar um modelo autorregressivo de ordem k. O PACF do A série UNITS fornece um exemplo extremo do fenômeno de corte que tem um pico muito grande no retardo 1 e nenhum outro pico significativo, indicando que na ausência de diferenciação um modelo AR 1 deve ser usado No entanto, o termo AR 1 neste modelo Você vai Rn para ser equivalente a uma primeira diferença, porque o coeficiente estimado de AR 1 que é a altura do pico de PACF no intervalo 1 será quase exatamente igual a 1 Agora, a equação de previsão para um modelo AR 1 para uma série Y sem Se o coeficiente AR1 1 nesta equação for igual a 1, é equivalente a prever que a primeira diferença de Y é constante - ou seja, é equivalente à equação do modelo de caminhada aleatória com crescimento. PACF da série UNITS está nos dizendo que, se não fizermos diferença, então devemos ajustar um modelo AR 1 que se torne equivalente a tomar uma primeira diferença. Em outras palavras, está nos dizendo que UNITS realmente precisa de um Ordem de diferenciação a ser estacionada. Assinaturas AR e MA Se o PACF exibe um corte acentuado enquanto o ACF decai mais lentamente, ou seja, tem picos significativos em defasagens maiores, dizemos que a série estacionária exibe uma assinatura AR, significando que o padrão de autocorrelação pode ser explicar Ed mais facilmente adicionando termos AR mais do que adicionando MA termos Você provavelmente vai achar que uma assinatura AR é comumente associado com autocorrelação positiva em lag 1 - ou seja, tende a surgir em série que estão ligeiramente em diferentes A razão para isso é que um Por exemplo, em um modelo AR 1, o termo AR age como uma primeira diferença se o coeficiente autorregressivo for igual a 1, ele não faz nada se o coeficiente autorregressivo for zero e ele Atua como uma diferença parcial se o coeficiente estiver entre 0 e 1 Portanto, se a série é ligeiramente subdiferenciada - ou seja, se o padrão não estacionário de autocorrelação positiva não tiver sido completamente eliminado, pedirá uma diferença parcial exibindo uma assinatura AR , Temos a regra geral para determinar quando adicionar termos AR. Regra 6 Se o PACF da série diferenciada exibir um corte acentuado e ou a autocorrelação lag-1 for positiva --i E se a série aparece ligeiramente subdifferenced - então considerar adicionar um termo AR para o modelo O atraso em que o PACF corta é o número indicado de termos AR. Em princípio, qualquer padrão de autocorrelação pode ser removido de uma série estacionária, adicionando o suficiente Os retornos de termos autorregressivos da série estacionária para a equação de previsão eo PACF diz-lhe quantos desses termos são prováveis ​​ser necessários No entanto, esta não é sempre a maneira mais simples de explicar um determinado padrão de autocorrelação às vezes é mais eficiente para adicionar MA termos Atrasos dos erros de previsão em vez disso A função de autocorrelação ACF desempenha a mesma função para os termos MA que o PACF reproduz para termos AR - ou seja, o ACF diz-lhe quantos termos MA são susceptíveis de ser necessários para remover a autocorrelação remanescente do diferenciado Série Se a autocorrelação é significativa a lag k, mas não em qualquer maior defasagem - ou seja, se a ACF cortes no lag k - isso indica que exatamente k MA termos devem ser utilizados na Neste caso, dizemos que a série estacionária exibe uma assinatura de MA, o que significa que o padrão de autocorrelação pode ser explicado mais facilmente pela adição de termos MA do que pela adição de termos AR. Uma assinatura MA é comumente associada à autocorrelação negativa com atraso 1 - isto tende a surgir em séries que são ligeiramente mais diferenciadas A razão para isso é que um termo MA pode cancelar parcialmente uma ordem de diferenciação na equação de previsão Para ver isso, lembre-se que um modelo ARIMA 0,1,1 sem constante É equivalente a um modelo de Suavização Exponencial Simples A equação de previsão para este modelo é. Onde o coeficiente MA 1 corresponde à quantidade 1 - no modelo SES Se 1 é igual a 1, isto corresponde a um modelo SES com 0, que é Apenas um modelo CONSTANTE porque a previsão nunca é atualizada Isso significa que quando 1 é igual a 1, ele está realmente cancelando a operação de diferenciação que normalmente permite que a previsão SES se ancore novamente Na última observação Por outro lado, se o coeficiente de média móvel é igual a 0, este modelo se reduz a um modelo de caminhada aleatória - isto é, deixa a operação de diferenciação sozinha Então, se 1 for algo maior que 0, é como Se estamos cancelando parcialmente uma ordem de diferenciação Se a série já é ligeiramente mais diferenciada - ou seja, se autocorrelação negativa foi introduzida - então ele vai pedir para uma diferença a ser parcialmente cancelada, exibindo uma assinatura MA Muita agitação Está a decorrer aqui Uma explicação mais rigorosa deste efeito é encontrada na estrutura Matemática de Modelos ARIMA folheto Daí a seguinte regra adicional de polegar. Rápula 7 Se o ACF da série diferenciada exibe um corte afiado e ou a autocorrelação lag-1 é Negativo --e se a série aparece ligeiramente overdifferenced - então considerar a adição de um termo MA para o modelo O atraso em que a ACF corta é o número indicado de MA terms. A modelo para a série UNITS - ARIMA 2,1, 0 Previousl Y determinamos que a série UNITS precisava de pelo menos uma ordem de diferenciação não sazonal para ser estacionalizada. Depois de tomar uma diferença não sazonal - ou seja, montando um modelo ARIMA 0,1,0 com constante - as parcelas ACF e PACF parecem com isto. Observe que A correlação no intervalo 1 é significativa e positiva e b o PACF mostra um corte mais nítido do que o ACF Em particular, o PACF tem apenas dois picos significativos, enquanto o ACF tem quatro Assim, de acordo com a Regra 7 acima, as séries diferenciadas exibem Uma assinatura AR 2 Se, portanto, definimos a ordem do termo AR para 2 - ou seja, encaixamos um modelo ARIMA 2,1,0 - obtemos os seguintes gráficos ACF e PACF para os resíduos. A autocorrelação nos atrasos cruciais - Ou seja, retardos 1 e 2 - foi eliminada e não há nenhum padrão discernível em atrasos de ordem superior. O gráfico de séries temporais dos resíduos mostra uma tendência ligeiramente preocupante de se afastar da média. Modelo executa muito bem em t No período de validação, ambos os coeficientes AR são significativamente diferentes de zero eo desvio padrão dos resíduos foi reduzido de 1 54371 para 1 4215 quase 10 pela adição dos termos AR Além disso, não há sinal de uma raiz unitária porque a Soma dos coeficientes AR 0 252254 0 195572 não é próxima de 1 Raízes unitárias são discutidas em mais detalhes abaixo Em geral, este parece ser um bom modelo. As previsões não-transformadas para o modelo mostram uma tendência linear ascendente projetada para o futuro. A tendência nas previsões a longo prazo é devido ao fato de que o modelo inclui uma diferença não sazonal e um termo constante este modelo é basicamente uma caminhada aleatória com crescimento fino ajustado pela adição de dois termos autorregressivos - ou seja, dois atrasos da diferença Série A inclinação das previsões de longo prazo, ou seja, o aumento médio de um período para outro é igual ao termo médio no resumo do modelo 0 467566 A equação de previsão é. Onde é o termo constante no modelo summ 0 258178, 1 é o coeficiente AR 1 0 25224 e 2 é o coeficiente AR 2 0 195572. Meio versus constante Em geral, o termo médio na saída de um modelo ARIMA refere-se à média das séries diferenciadas, isto é, a tendência média Se a ordem de diferenciação é igual a 1, enquanto a constante é o termo constante que aparece no lado direito da equação de previsão Os termos médio e constante são relacionados pela equação. CONSTANTE MEAN 1 menos a soma do AR Coeficientes. Neste caso, temos 0 258178 0 467566 1 - 0 25224 - 0 195572.Modelo alternativo para a série UNITS - ARIMA 0,2,1 Lembre-se que quando começamos a analisar a série UNITS, não estávamos inteiramente certos Da ordem correta de diferenciação para uso Uma ordem de diferenças não sazonais resultou no desvio padrão mais baixo e um padrão de autocorrelação positiva moderada, enquanto duas ordens de diferenças não sazonais renderam um gráfico de séries temporais mais estacionárias, mas com autocorrelação negativa bastante forte On Aqui estão tanto o ACF quanto o PACF da série com duas diferenças não sazonais. O único ponto negativo no intervalo 1 no ACF é uma assinatura MA 1, de acordo com a Regra 8 acima. Assim, se usássemos 2 diferenças não sazonais, Também queremos incluir um termo MA 1, produzindo um modelo ARIMA 0,2,1 De acordo com a Regra 5, também queremos suprimir o termo constante Aqui, então, são os resultados da montagem de um modelo ARIMA 0,2,1 sem Constante. Notice que o desvio padrão de ruído branco estimado RMSE é apenas muito ligeiramente superior para este modelo do que o anterior 1 46301 aqui versus 1 45215 anteriormente A equação de previsão para este modelo é. onde theta-1 é o coeficiente MA 1 Lembre-se que este É semelhante a um modelo Linear Exponential Smoothing, com o coeficiente MA 1 correspondente à quantidade 2 1-alfa no modelo LES O coeficiente MA 1 de 0 76 neste modelo sugere que um modelo LES com alfa na vizinhança de 0 72 seria Caber aproximadamente ingualmente bem Realmente, quando um L O modelo ES é ajustado aos mesmos dados, o valor ótimo de alfa é de cerca de 0 61, o que não está muito longe. Aqui está um relatório de comparação de modelos que mostra os resultados do ajuste do modelo ARIMA 2,1,0 com constante , O modelo ARIMA 0,2,1 sem constante e o modelo LES. Os três modelos são quase idênticos no período de estimação eo modelo ARIMA 2,1,0 com constante aparece ligeiramente melhor que os outros dois no período de validação Com base apenas nestes resultados estatísticos, seria difícil escolher entre os três modelos. No entanto, se traçarmos as previsões a longo prazo feitas pelo modelo ARIMA 0,2,1 sem constante que são essencialmente as mesmas que as do LES, verificamos uma diferença significativa em relação àquelas do modelo anterior. As previsões apresentam uma tendência de crescimento ligeiramente inferior à do modelo anterior - porque a tendência local próxima do final da série é ligeiramente inferior à tendência média Toda a série - mas os intervalos de confiança Alargar muito mais rapidamente O modelo com duas ordens de diferenciação pressupõe que a tendência na série é variável no tempo, portanto, considera o futuro distante ser muito mais incerto do que o modelo com apenas uma ordem de diferenciação. Qual modelo devemos escolher O modelo com apenas uma ordem de diferenciação assume uma tendência média constante - é essencialmente um modelo aleatório de caminhada aleatória com crescimento - e Portanto, faz projeções de tendência relativamente conservadoras Também é bastante otimista quanto à precisão com que ele pode prever mais de um período à frente O modelo com duas ordens de diferenciação assume uma tendência local variável no tempo - é essencialmente um modelo de suavização exponencial linear - - e suas projeções de tendência são um pouco mais inconstantes Como regra geral neste tipo de situação, eu recomendaria escolher o modelo com a ordem mais baixa de diferenciação, Outras coisas sendo praticamente iguais Na prática, os modelos de aleatório-caminhada ou simples-exponencial-suavização muitas vezes parecem funcionar melhor do que os modelos lineares de suavização exponencial. Modelos mistos Na maioria dos casos, o melhor modelo resulta em um modelo que usa apenas termos AR ou apenas MA, embora em alguns casos, um modelo misto com AR e MA termos pode fornecer o melhor ajuste para os dados No entanto, cuidado deve ser exercido quando a montagem de modelos mistos É possível que um termo AR e um MA termo para cancelar uns aos outros s Assim, por exemplo, suponha que o modelo correto para uma série de tempo é um modelo ARIMA 0,1,1, mas, em vez disso, você deve ajustar um ARIMA 1,1,2 modelo - ou seja, você inclui um termo AR adicional e um termo MA adicional Em seguida, os termos adicionais podem acabar aparecendo significativa no modelo, mas internamente eles podem ser meramente trabalhar uns contra os outros As estimativas parâmetro resultante pode ser ambíguo , E o processo de estimativa de parâmetros pode levar muito, por exemplo, mais de 10 iterações para convergir Hence. Rule 8 É possível que um termo AR e um termo MA para cancelar mutuamente s efeitos, por isso, se um modelo misturado AR-MA parece caber o , Tente também um modelo com menos um termo AR e menos um termo MA - particularmente se as estimativas de parâmetro no modelo original exigirem mais de 10 iterações para convergir. Por esta razão, os modelos ARIMA não podem ser identificados pela abordagem stepwise que inclui Tanto AR e MA termos Em outras palavras, você não pode começar por incluir vários termos de cada tipo e, em seguida, jogando para fora aqueles cujos coeficientes estimados não são significativos Em vez disso, você normalmente seguir uma abordagem progressiva passo a passo, adicionando termos de um tipo ou outro como Indicada pelo aparecimento dos gráficos ACF e PACF. Raízes unitárias Se uma série é grosseiramente sub ou sobrediferenciada - ou seja, se uma ordem inteira de diferenciação precisa ser adicionada ou cancelada, isso é freqüentemente sinalizado por uma raiz unitária em t Ele estimou AR ou MA coeficientes do modelo Um modelo AR 1 é dito ter uma raiz unitária se o estimado AR 1 coeficiente é quase exatamente igual a 1 Por exatamente igual eu realmente significa não significativamente diferente em termos de coeficiente s próprio padrão Quando isso acontece, significa que o termo AR 1 está precisamente imitando uma primeira diferença, caso em que você deve remover o termo AR 1 e adicionar uma ordem de diferenciação em vez disso. Isso é exatamente o que aconteceria se você montou um modelo AR 1 para A série UNITS não diferenciada, conforme observado anteriormente. Em um modelo AR de ordem mais alta, existe uma raiz unitária na parte AR do modelo se a soma dos coeficientes AR for exatamente igual a 1. Neste caso, você deve reduzir a ordem da AR Termo por 1 e adicionar uma ordem de diferenciação Uma série temporal com uma raiz unitária nos coeficientes AR é não-estacionária --e necessita de uma ordem maior de diferenciação. Raula 9 Se houver uma raiz unitária na parte AR do modelo - Ou seja, se a soma dos coeficientes AR for Quase exatamente 1 - você deve reduzir o número de termos AR por um e aumentar a ordem de diferenciação por um. Da mesma forma, um modelo MA 1 é dito ter uma raiz unitária se o estimado MA 1 coeficiente é exatamente igual a 1 Quando este Isso significa que o termo MA 1 está exatamente cancelando uma primeira diferença, nesse caso, você deve remover o termo MA 1 e também reduzir a ordem de diferenciação por um. Em um modelo MA de ordem mais alta, existe uma raiz unitária se o A soma dos coeficientes MA é exatamente igual a 1.Rule 10 Se houver uma raiz unitária na parte MA do modelo - ou seja, se a soma dos coeficientes MA for quase exatamente 1 - você deve reduzir o número de termos MA Por exemplo, se você ajustar um modelo de suavização exponencial linear um modelo ARIMA 0,2,2 quando um modelo de suavização exponencial simples um modelo ARIMA 0,1,1 teria sido suficiente, você Pode achar que a soma dos dois coeficientes de MA é quase igual a 1 Reduzindo a ordem MA D a ordem de diferenciação por um cada, você obtém o modelo SES mais apropriado Um modelo de previsão com uma raiz unitária nos coeficientes MA estimados é dito não-reversível, significando que os resíduos do modelo não podem ser considerados como estimativas do ruído aleatório verdadeiro Que gerou a série temporal. Outro sintoma de uma raiz unitária é que as previsões do modelo pode explodir ou se comportar de outra forma bizarramente Se o gráfico de série de tempo das previsões de longo prazo do modelo parece estranho, você deve verificar os coeficientes estimados de Seu modelo para a presença de uma raiz unitária. Se as previsões de longo prazo aparecem erráticas ou instáveis, pode haver uma raiz unitária nos coeficientes AR ou MA. Nenhum destes problemas surgiu com os dois modelos aqui montados, porque nós Foram cuidadosos para começar com ordens plausíveis de diferenças e números apropriados de coeficientes AR e MA estudando os modelos ACF e PACF. Discussões mais detalhadas sobre raízes unitárias e efeitos de cancelamento entre A R e MA podem ser encontradas na estrutura Matemática de Modelos ARIMA. RIMA significa Modelos de Movimento Média Integrados Autoregressivos Único vetor univariante ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia Sua principal aplicação É na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos Funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers Às vezes chamado Box-Jenkins após os autores originais, ARIMA é geralmente superior a exponential smoothing techniques when the data is reasonably long and the correlation between past observations is stable If the data is short or highly volatile, then some smoothing method may perform better If you do not have at least 38 data points, you should consider some other method than ARIMA. The first step in applying ARIMA methodology is to check for stationarity Stationarity implies that the ser ies remains at a fairly constant level over time If a trend exists, as in most economic or business applications, then your data is NOT stationary The data should also show a constant variance in its fluctuations over time This is easily seen with a series that is heavily seasonal and growing at a faster rate In such a case, the ups and downs in the seasonality will become more dramatic over time Without these stationarity conditions being met, many of the calculations associated with the process cannot be computed. If a graphical plot of the data indicates nonstationarity, then you should difference the series Differencing is an excellent way of transforming a nonstationary series to a stationary one This is done by subtracting the observation in the current period from the previous one If this transformation is done only once to a series, you say that the data has been first differenced This process essentially eliminates the trend if your series is growing at a fairly constant rate I f it is growing at an increasing rate, you can apply the same procedure and difference the data again Your data would then be second differenced. Autocorrelations are numerical values that indicate how a data series is related to itself over time More precisely, it measures how strongly data values at a specified number of periods apart are correlated to each other over time The number of periods apart is usually called the lag For example, an autocorrelation at lag 1 measures how values 1 period apart are correlated to one another throughout the series An autocorrelation at lag 2 measures how the data two periods apart are correlated throughout the series Autocorrelations may range from 1 to -1 A value close to 1 indicates a high positive correlation while a value close to -1 implies a high negative correlation These measures are most often evaluated through graphical plots called correlagrams A correlagram plots the auto - correlation values for a given series at different lags This is referred to as the autocorrelation function and is very important in the ARIMA method. ARIMA methodology attempts to describe the movements in a stationary time series as a function of what are called autoregressive and moving average parameters These are referred to as AR parameters autoregessive and MA parameters moving averages An AR model with only 1 parameter may be written as. where X t time series under investigation. A 1 the autoregressive parameter of order 1.X t-1 the time series lagged 1 period. E t the error term of the model. This simply means that any given value X t can be explained by some function of its previous value, X t-1 , plus some unexplainable random error, E t If the estimated value of A 1 was 30, then the current value of the series would be related to 30 of its value 1 period ago Of course, the series could be related to more than just one past value For example. X t A 1 X t-1 A 2 X t-2 E t. This indicates that the current value of the series is a combination of the two immediately preceding values, X t-1 and X t-2 , plus some random error E t Our model is now an autoregressive model of order 2.Moving Aver age Models. A second type of Box-Jenkins model is called a moving average model Although these models look very similar to the AR model, the concept behind them is quite different Moving average parameters relate what happens in period t only to the random errors that occurred in past time periods, i e E t-1 , E t-2 , etc rather than to X t-1 , X t-2 , Xt-3 as in the autoregressive approaches A moving average model with one MA term may be written as follows. The term B 1 is called an MA of order 1 The negative sign in front of the parameter is used for convention only and is usually printed out auto - matically by most computer programs The above model simply says that any given value of X t is directly related only to the random error in the previous period, E t-1 , and to the current error term, E t As in the case of autoregressive models, the moving average models can be extended to higher order structures covering different combinations and moving average lengths. ARIMA methodology als o allows models to be built that incorporate both autoregressive and moving average parameters together These models are often referred to as mixed models Although this makes for a more complicated forecasting tool, the structure may indeed simulate the series better and produce a more accurate forecast Pure models imply that the structure consists only of AR or MA parameters - not both. The models developed by this approach are usually called ARIMA models because they use a combination of autoregressive AR , integration I - referring to the reverse process of differencing to produce the forecast, and moving average MA operations An ARIMA model is usually stated as ARIMA p, d,q This represents the order of the autoregressive components p , the number of differencing operators d , and the highest order of the moving average term For example, ARIMA 2,1,1 means that you have a second order autoregressive model with a first order moving average component whose series has been differenced onc e to induce stationarity. Picking the Right Specification. The main problem in classical Box-Jenkins is trying to decide which ARIMA specification to use - i e how many AR and or MA parameters to include This is what much of Box-Jenkings 1976 was devoted to the identification process It depended upon graphical and numerical eval - uation of the sample autocorrelation and partial autocorrelation functions Well, for your basic models, the task is not too difficult Each have autocorrelation functions that look a certain way However, when you go up in complexity, the patterns are not so easily detected To make matters more difficult, your data represents only a sample of the underlying process This means that sampling errors outliers, measurement error, etc may distort the theoretical identification process That is why traditional ARIMA modeling is an art rather than a science.

Comments