Wednesday 22 November 2017

Arima Moving Average Term


Esta questão já tem uma resposta aqui: Para um modelo ARIMA (0,0,1), entendo que R segue a equação: xt mu e (t) thetae (t-1) (Por favor, corrija-me se estou errado) Suponha que e (t-1) é o mesmo que o residual da última observação. Por exemplo, aqui estão as primeiras quatro observações em uma amostra de dados: 526 658 624 611 Estes são os parâmetros Arima (0,0,1) modelo deu: interceptar 246,1848 ma1 0,9893 E o primeiro valor que R ajustando usando o modelo é: 327.0773 Como eu obtenho o segundo valor que eu usei: 246.1848 (0.9893 (526-327.0773)) 442.979 Mas o 2o valor ajustado dado por R é. 434.7928 Eu suponho que a diferença é por causa do termo e (t). Mas eu não sei como calcular o termo e (t). Pediu Jul 28 14 às 16:12 marcado como duplicado por Glenb 9830. Nick Stauner. Whuber 9830 Jul 29 14 at 1:24 Esta pergunta foi feita antes e já tem uma resposta. Se essas respostas não abordarem completamente a sua pergunta, faça uma nova pergunta. Você poderia obter os valores ajustados como previsões de uma etapa usando o algoritmo de inovações. Veja por exemplo a proposição 5.5.2 em Brockwell e Davis downloable da internet eu encontrei estes slides. É muito mais fácil obter os valores ajustados como a diferença entre os valores observados e os resíduos. Neste caso, sua pergunta se resume a obter os resíduos. Vamos pegar esta série gerada como um processo MA (1): Os resíduos, hat t, podem ser obtidos como um filtro recursivo: Por exemplo, podemos obter o residual no ponto de tempo 140 como o valor observado em t140 menos a média estimada menos Hat vezes o residual anterior, t139): O filtro de função pode ser usado para fazer esses cálculos: Você pode ver que o resultado é muito próximo dos resíduos retornados por resíduos. A diferença nos primeiros resíduos é mais provável devido a alguma inicialização que eu posso ter omitido. Os valores ajustados são apenas os valores observados menos os resíduos: Na prática, você deve usar as funções residuais e montado, mas para fins pedagógicos você pode tentar a equação recursiva usada acima. Você pode começar fazendo alguns exemplos à mão como mostrado acima. Eu recomendo que você leia também a documentação do filtro de função e compare alguns de seus cálculos com ele. Uma vez que você compreende as operações envolvidas na computação dos valores residuais e ajustados você poderá fazer um uso knowledgeable das funções mais práticas residuals e cabido. Você pode encontrar algumas outras informações relacionadas à sua pergunta neste post. Um RIMA significa Autoregressive Integrated Moving Average modelos. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos. Ele funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers. Às vezes chamado Box-Jenkins (após os autores originais), ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor. Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaridade. A estacionariedade implica que a série permanece a um nível razoavelmente constante ao longo do tempo. Se existe uma tendência, como na maioria das aplicações econômicas ou de negócios, os dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e crescendo a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem que estas condições de estacionaridade sejam satisfeitas, muitos dos cálculos associados ao processo não podem ser calculados. Se um gráfico gráfico dos dados indica nonstationarity, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não-estacionária em uma estacionária. Isto é feito subtraindo a observação no período atual do anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiramente diferenciados. Este processo elimina essencialmente a tendência se sua série está crescendo em uma taxa razoavelmente constante. Se ele está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferença os dados novamente. Seus dados seriam então segundo diferenciados. As autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores 1 intervalo de tempo são correlacionados um ao outro ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo de -1 implica uma correlação negativa elevada. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de autocorrelação para uma dada série em diferentes defasagens. Isto é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em séries temporais estacionárias como uma função do que são chamados parâmetros auto-regressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessive) e parâmetros MA (média móvel). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo de ordem 1 X (t-1) (T) o termo de erro do modelo Isto simplesmente significa que qualquer valor dado X (t) pode ser explicado por alguma função de seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse .30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Naturalmente, a série poderia estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de média móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora estes modelos parecem muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, isto é, E (t-1), E (t-2), etc., em vez de X (t-1), X T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito da seguinte forma. O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para convenção e geralmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado somente ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso de modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporem parâmetros de média autorregressiva e média móvel. Estes modelos são frequentemente referidos como modelos mistos. Embora isso torne uma ferramenta de previsão mais complicada, a estrutura pode de fato simular melhor a série e produzir uma previsão mais precisa. Modelos puros implicam que a estrutura consiste apenas de AR ou MA parâmetros - não ambos. Os modelos desenvolvidos por esta abordagem são geralmente chamados de modelos ARIMA porque eles usam uma combinação de auto-regressão (AR), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e de média móvel (MA). Um modelo ARIMA é geralmente indicado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionaridade. Escolhendo a Especificação Direita: O principal problema no clássico Box-Jenkins está tentando decidir qual especificação ARIMA usar - i. e. Quantos parâmetros AR e / ou MA devem ser incluídos. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Ela dependia da avaliação gráfica e numérica das funções de autocorrelação da amostra e autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem uma certa maneira. No entanto, quando você subir em complexidade, os padrões não são tão facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isto significa que os erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte e não uma ciência. Modelos ARIMA de mínimos quadrados lineares versus não lineares que incluem apenas termos AR são casos especiais de modelos de regressão linear, portanto, podem ser ajustados por mínimos quadrados ordinários. As previsões AR são uma função linear dos coeficientes bem como uma função linear de dados passados. Em princípio, as estimativas de mínimos quadrados dos coeficientes AR podem ser calculadas com exactidão a partir de autocorrelações numa única quotiteração. Na prática, você pode ajustar um modelo de AR no procedimento de Regressão Múltipla - basta regredir DIFF (Y) (ou qualquer outro) em defasagens de si mesmo. Os modelos ARIMA que incluem termos MA são semelhantes aos modelos de regressão, mas não podem ser ajustados por mínimos quadrados ordinários: As previsões são uma função linear de dados passados, mas são Funções não lineares de coeficientes - por exemplo, Um modelo ARIMA (0,1,1) sem constante é uma média móvel exponencialmente ponderada: em que as previsões são uma função não linear do parâmetro MA (1) (quotthetaquot). Outra maneira de olhar para o problema: você não pode ajustar modelos MA usando regressão múltipla ordinária porque theres nenhuma maneira de especificar ERROS como uma variável independente - os erros não são conhecidos até que o modelo é montado Eles precisam ser calculados seqüencialmente. Período por período, considerando as estimativas dos parâmetros atuais. Os modelos de MA, portanto, exigem um algoritmo de estimação não-linear para ser usado, semelhante ao algoritmo quotSolverquot no Excel. O algoritmo usa um processo de busca que normalmente requer de 5 a 10 iterações e ocasionalmente pode não convergir. Você pode ajustar as tolerâncias para determinar os tamanhos das etapas e os critérios de parada para a pesquisa (embora os valores padrão normalmente sejam OK). QuotMeanquot versus quotconstantquot O quotmeanquot e o quotconstantquot em resultados de ajuste de modelo ARIMA são números diferentes sempre que o modelo inclui termos AR. Suponha que você encaixe um modelo ARIMA em Y em que p é o número de termos autorregressivos. (Suponha, por conveniência, que não existem termos de MA). Deixar y designar a versão diferenciada (estacionária) de Y, p. Y t Y t - Y t-1 se uma diferença não sazonal foi utilizada. Então a equação de previsão de AR (p) para y é: Este é apenas um modelo de regressão múltipla ordinário em que 956 é o termo constante, 981 1 é o coeficiente do primeiro desfasamento de y. e assim por diante. Agora, internamente, o software converte esta forma de interceptação de declive da equação de regressão para uma forma equivalente em termos de desvios da média. Seja m a média da série estacionária y. Então a equação autorregressiva p-ordem pode ser escrita em termos de desvios da média como: Recolhendo todos os termos constantes nesta equação, vemos que é equivalente à forma original da equação se: CONSTANT MEAN x (1-sum De coeficientes de AR) O software estima realmente m (juntamente com os outros parâmetros do modelo) e relata isso como o MEAN nos resultados de ajuste do modelo, juntamente com seu erro padrão e estatística t, etc. O CONSTANTE (956) é então calculado De acordo com a fórmula acima. Se o modelo não contiver quaisquer termos AR, o MEAN e o CONSTANT são idênticos. Em um modelo com uma ordem de diferenciação não sazonal (somente), o MEAN é o fator de tendência (variação média período-período). Em um modelo com uma ordem de diferenciação sazonal (apenas), o MEAN é o fator de tendência anual (variação média ano a ano). O problema básico: um modelo ARIMA (ou outro modelo de séries temporais) prevê valores futuros das séries temporais de valores passados ​​- mas como a equação de previsão deve ser inicializada para fazer uma previsão para a primeira observação (na verdade, os modelos AR podem ser Inicializado por deixar cair as primeiras observações - embora isso seja ineficiente e desperdiça dados - mas os modelos MA exigem uma estimativa de um erro prévio antes que eles possam fazer a primeira previsão.) Estranho mas verdadeiro. Uma série de tempo estacionária parece o mesmo indo para frente ou para trás no tempo, portanto. O mesmo modelo que prediz o futuro de uma série também pode ser usado para prever o seu passado. A solução: para espremer a maioria das informações dos dados disponíveis, a melhor maneira de inicializar um modelo ARIMA (ou qualquer modelo de previsão de séries temporais) é usar a previsão para trás (quotbackforecastingquot) para obter estimativas de valores de dados antes do período 1. Quando Você usa a opção backforecasting na estimativa ARIMA, o algoritmo de pesquisa realmente faz duas passagens através dos dados em cada iteração: primeiro uma passagem para trás é feita para estimar valores de dados anteriores usando as estimativas de parâmetro atual, então os valores de dados pré-estimados são usados ​​para inicializar A equação de previsão para uma passagem para a frente através dos dados. Se você NÃO usar a opção backforecasting, a equação de previsão é inicializada assumindo que os valores anteriores da série estacionária foram iguais à média. Se você usar a opção backforecasting, os backforecasts que são usados ​​para inicializar o modelo são parâmetros implícitos do modelo, que devem ser estimados juntamente com os coeficientes AR e MA. O número de parâmetros implícitos adicionais é aproximadamente igual ao maior atraso no modelo - normalmente 2 ou 3 para um modelo não sazonal e s1 ou 2s1 para um modelo sazonal com sazonalidade. (Se o modelo inclui uma diferença sazonal e um termo AR ou MA sazonal, precisa de duas estações de valores anteriores para iniciar) Note que com a opção backforecasting, um modelo AR é estimado de uma maneira diferente do que seria estimado No procedimento de Regressão Múltipla (valores em falta não são meramente ignorados - eles são substituídos quer com uma estimativa da média ou com backforecasts), portanto, um modelo AR ajustado no procedimento ARIMA nunca irá produzir exatamente as mesmas estimativas de parâmetros como um modelo AR Ajustado no procedimento de Regressão Múltipla. Sabedoria convencional: desabilite o backforecasting quando você não tiver certeza se o modelo atual é válido, ligue-o para obter estimativas de parâmetros finais, uma vez que você esteja razoavelmente certo de que o modelo é válido. Se o modelo for especificado incorretamente, o backforecasting pode levar a falhas das estimativas de parâmetros para convergir e / ou problemas de raiz unitária.

No comments:

Post a Comment