Autoregressive integrated moving average definition


A RIMA significa Autoregressive Integrated Moving Average modelos. Univariada (vetor único) ARIMA é uma técnica de previsão que projeta os valores futuros de uma série baseada inteiramente em sua própria inércia. Sua principal aplicação é na área de previsão de curto prazo, exigindo pelo menos 40 pontos de dados históricos. Ele funciona melhor quando seus dados exibem um padrão estável ou consistente ao longo do tempo com uma quantidade mínima de outliers. Às vezes chamado Box-Jenkins (após os autores originais), ARIMA é geralmente superior às técnicas de suavização exponencial quando os dados são razoavelmente longos ea correlação entre as observações passadas é estável. Se os dados forem curtos ou altamente voláteis, então algum método de alisamento pode funcionar melhor. Se você não tiver pelo menos 38 pontos de dados, você deve considerar algum outro método que ARIMA. O primeiro passo na aplicação da metodologia ARIMA é verificar a estacionaridade. A estacionariedade implica que a série permanece a um nível razoavelmente constante ao longo do tempo. Se existe uma tendência, como na maioria das aplicações econômicas ou de negócios, os dados NÃO são estacionários. Os dados também devem mostrar uma variação constante em suas flutuações ao longo do tempo. Isto é facilmente visto com uma série que é fortemente sazonal e crescendo a um ritmo mais rápido. Nesse caso, os altos e baixos da sazonalidade se tornarão mais dramáticos ao longo do tempo. Sem que estas condições de estacionaridade sejam satisfeitas, muitos dos cálculos associados ao processo não podem ser calculados. Se um gráfico gráfico dos dados indica nonstationarity, então você deve diferenciar a série. A diferenciação é uma excelente maneira de transformar uma série não-estacionária em uma estacionária. Isto é feito subtraindo a observação no período atual do anterior. Se essa transformação é feita apenas uma vez para uma série, você diz que os dados foram primeiro diferenciados. Este processo elimina essencialmente a tendência se sua série está crescendo em uma taxa razoavelmente constante. Se ele está crescendo a uma taxa crescente, você pode aplicar o mesmo procedimento e diferença os dados novamente. Seus dados seriam então segundo diferenciados. Autocorrelações são valores numéricos que indicam como uma série de dados está relacionada a si mesma ao longo do tempo. Mais precisamente, ele mede quão fortemente os valores de dados em um número específico de períodos separados estão correlacionados entre si ao longo do tempo. O número de períodos separados é geralmente chamado de atraso. Por exemplo, uma autocorrelação no intervalo 1 mede como os valores 1 intervalo de tempo são correlacionados um ao outro ao longo da série. Uma autocorrelação no intervalo 2 mede como os dados dois períodos separados estão correlacionados ao longo da série. As autocorrelações podem variar de 1 a -1. Um valor próximo a 1 indica uma alta correlação positiva, enquanto um valor próximo de -1 implica uma correlação negativa elevada. Essas medidas são mais frequentemente avaliadas através de gráficos gráficos chamados correlagramas. Um correlagram traça os valores de autocorrelação para uma dada série em diferentes defasagens. Isto é referido como a função de autocorrelação e é muito importante no método ARIMA. A metodologia ARIMA tenta descrever os movimentos em séries temporais estacionárias como uma função do que são chamados parâmetros auto-regressivos e de média móvel. Estes são referidos como parâmetros AR (autoregessive) e parâmetros MA (média móvel). Um modelo AR com apenas 1 parâmetro pode ser escrito como. X (t) A (1) X (t-1) E (t) onde X (t) séries temporais sob investigação A (1) o parâmetro autorregressivo de ordem 1 X (t-1) (T) o termo de erro do modelo Isto simplesmente significa que qualquer valor dado X (t) pode ser explicado por alguma função de seu valor anterior, X (t-1), mais algum erro aleatório inexplicável, E (t). Se o valor estimado de A (1) fosse .30, então o valor atual da série estaria relacionado a 30 de seu valor 1 período atrás. Naturalmente, a série poderia estar relacionada a mais do que apenas um valor passado. Por exemplo, X (t) A (1) X (t-1) A (2) X (t-2) E (t) Isso indica que o valor atual da série é uma combinação dos dois valores imediatamente anteriores, X (t-1) e X (t-2), mais algum erro aleatório E (t). Nosso modelo é agora um modelo autorregressivo de ordem 2. Modelos de média móvel: Um segundo tipo de modelo Box-Jenkins é chamado de modelo de média móvel. Embora estes modelos parecem muito semelhantes ao modelo AR, o conceito por trás deles é bastante diferente. Os parâmetros de média móvel relacionam o que acontece no período t apenas aos erros aleatórios que ocorreram em períodos de tempo passados, isto é, E (t-1), E (t-2), etc., em vez de X (t-1), X T-2), (Xt-3) como nas abordagens autorregressivas. Um modelo de média móvel com um termo MA pode ser escrito da seguinte forma. O termo B (1) é chamado de MA de ordem 1. O sinal negativo na frente do parâmetro é usado apenas para convenção e normalmente é impresso Automaticamente pela maioria dos programas de computador. O modelo acima diz simplesmente que qualquer valor dado de X (t) está diretamente relacionado somente ao erro aleatório no período anterior, E (t-1) e ao termo de erro atual, E (t). Como no caso dos modelos autorregressivos, os modelos de média móvel podem ser estendidos a estruturas de ordem superior cobrindo diferentes combinações e comprimentos médios móveis. A metodologia ARIMA também permite a construção de modelos que incorporem parâmetros de média móvel e autorregressiva. Estes modelos são frequentemente referidos como modelos mistos. Embora isso torne uma ferramenta de previsão mais complicada, a estrutura pode de fato simular melhor a série e produzir uma previsão mais precisa. Modelos puros implicam que a estrutura consiste apenas de AR ou MA parâmetros - não ambos. Os modelos desenvolvidos por esta abordagem são geralmente chamados de modelos ARIMA porque eles usam uma combinação de auto-regressão (RA), integração (I) - referindo-se ao processo inverso de diferenciação para produzir as operações de previsão e de média móvel (MA). Um modelo ARIMA é geralmente indicado como ARIMA (p, d, q). Isso representa a ordem dos componentes autorregressivos (p), o número de operadores de diferenciação (d) e a ordem mais alta do termo médio móvel. Por exemplo, ARIMA (2,1,1) significa que você tem um modelo autorregressivo de segunda ordem com um componente de média móvel de primeira ordem cuja série foi diferenciada uma vez para induzir a estacionaridade. Escolhendo a Especificação Direita: O principal problema no clássico Box-Jenkins está tentando decidir qual especificação ARIMA usar - i. e. Quantos parâmetros AR e / ou MA devem ser incluídos. Isto é o que muito de Box-Jenkings 1976 foi dedicado ao processo de identificação. Ela dependia da avaliação gráfica e numérica das funções de autocorrelação da amostra e autocorrelação parcial. Bem, para os seus modelos básicos, a tarefa não é muito difícil. Cada um tem funções de autocorrelação que parecem uma certa maneira. No entanto, quando você subir em complexidade, os padrões não são tão facilmente detectados. Para tornar as questões mais difíceis, seus dados representam apenas uma amostra do processo subjacente. Isto significa que os erros de amostragem (outliers, erro de medição, etc.) podem distorcer o processo de identificação teórica. É por isso que a modelagem ARIMA tradicional é uma arte em vez de uma ciência. Modelo de média móvel (ARMA) Modelo de previsão ou processo em que tanto a análise de auto-regressão quanto os métodos de média móvel são aplicados a dados de séries temporais bem comportadas. ARMA assume que a série de tempo é estacionária flutua mais ou menos uniformemente em torno de uma média invariante no tempo. As séries não-estacionárias precisam ser diferenciadas uma ou mais vezes para alcançar a estacionaridade. ARMA modelos são considerados inadequados para análise de impacto ou para os dados que incorpora choques aleatórios. Veja também o modelo de média móvel integrada (ARIMA) autoregressiva. O melhor de BusinessDictionary, entregue comunismo diário significa número primo seleção natural constituição pensamento crítico dependente variável hipótese ecologia epifania desvio padrão difusão energia globalização fundo mútuo proxy controle volátil grupo consenso corporação Garantia de qualidade versus controle de qualidade Que estrutura de negócios você deve escolher Sete maneiras de financiar Seu ensino superior Como evitar uma dispensa GMAT vs GRE Como ler uma declaração financeira A vida e os tempos do lendário Steve Jobs Office Design para fomentar a inovação Copy Copyright 2017 WebFinance Inc. Todos os direitos reservados. A duplicação não autorizada, no todo ou em parte, é estritamente proibida. Árabe Búlgaro Chinês Croata Checo Dinamarquês Holandês Inglês Estónio Finlandês Francês Alemão Grego Hebraico Hindu Húngaro Islandês Indonésio Italiano Japonês Coreano Letão Lituano Malgaxe Norueguês Persa Polonês Português Romeno Russo Sérvio Eslovaco Esloveno Espanhol Sueco Tailandês Turco Vietnamita Árabe Búlgaro Chinês Croata Tcheco Dinamarquês Holandês Estoniano Finlandês Francês Alemão Grego Hebraico Hindu Húngaro Islandês Indonésio Italiano Japonês Coreano Letão Lituano Malgaxe Norueguês Persa Polonês Português Romeno Russo Sérvio Eslovaco Esloveno Espanhol Sueco Tailandês Turco Vietnamita Definição - média móvel integrada Autoregressiva média móvel integrada Estatísticas e econometria. E em particular na análise de séries temporais. Um modelo de média móvel auto-regressiva (ARIMA) é uma generalização de um modelo de média móvel autorregressiva (ARMA). Estes modelos são ajustados a dados de séries temporais para melhor compreender os dados ou para prever futuros pontos na série (previsão). Eles são aplicados em alguns casos onde os dados mostram evidência de não-estacionaridade, onde um passo de diferenciação inicial (correspondente à parte integrada do modelo) pode ser aplicado para remover a não estacionaridade. O modelo é geralmente referido como um modelo ARIMA (p, d, q) onde p. D. E q são números inteiros não negativos que se referem à ordem das partes auto-regressivas, integradas e móveis do modelo, respectivamente. Os modelos ARIMA formam uma parte importante da abordagem Box-Jenkins para a modelagem de séries temporais. Quando um dos termos é zero, o seu habitual para cair AR. I ou MA. Por exemplo, um modelo I (1) é ARIMA (0,1,0). E um modelo MA (1) é ARIMA (0,0,1). Conteúdo Definição Suponha agora que o polinômio tem uma raiz unitária da multiplicidade d. Então ele pode ser reescrito como: Um processo ARIMA (p, d, q) expressa essa propriedade de fatoração polinomial, e é dado por: e assim pode ser pensado como um caso particular de um processo ARMA (pd, q) Polinômio regressivo com algumas raízes na unidade. Por esta razão, todos os modelos ARIMA com d gt0 não são estacionários de sentido amplo. Outras formas especiais A identificação explícita da factorização do polinômio de autorregressão em fatores como acima, pode ser estendida a outros casos, em primeiro lugar para se aplicar ao polinômio de média móvel e em segundo lugar para incluir outros fatores especiais. Por exemplo, ter um fator em um modelo é uma maneira de incluir uma sazonalidade não-estacionária do período s no modelo. Outro exemplo é o fator que inclui uma sazonalidade (não-estacionária) do período 12. O efeito do primeiro tipo de fator é permitir que o valor de cada estação flutue separadamente ao longo do tempo, enquanto que com o segundo tipo os valores das estações adjacentes se movem juntos . A identificação e especificação de fatores apropriados em um modelo ARIMA pode ser um passo importante na modelagem, pois pode permitir uma redução no número total de parâmetros a serem estimados, ao mesmo tempo que permite a imposição no modelo de tipos de comportamento que a lógica ea experiência sugerem estar lá. Previsões utilizando modelos ARIMA Os modelos ARIMA são utilizados para processos observáveis ​​não-estacionários que têm algumas tendências claramente identificáveis: Nestes casos, o modelo ARIMA pode ser visto como uma cascata de dois modelos. O primeiro é não-estacionário: enquanto o segundo é de sentido amplo estacionário: agora as técnicas padrão de previsões podem ser formuladas para o processo, e então (com o número suficiente de condições iniciais) podem ser previstas através de etapas de integração oportunas. Exemplos Alguns casos especiais bem conhecidos surgem naturalmente. Por exemplo, um modelo ARIMA (0,1,0) é dado por: Um número de variações no modelo ARIMA são comumente usados. Por exemplo, se forem usadas várias séries de tempo, então o pode ser pensado como vetores e um modelo VARIMA pode ser apropriado. Às vezes um efeito sazonal é suspeitado no modelo. Por exemplo, considere um modelo de volumes diários de tráfego rodoviário. Fins de semana claramente exibem comportamento diferente de dias úteis. Neste caso, é frequentemente considerado melhor utilizar um modelo SARIMA (ARIMA sazonal) do que aumentar a ordem das partes AR ou MA do modelo. Se a série temporal é suspeita de exibir uma dependência de longo alcance, então o parâmetro pode ser substituído por certos valores não inteiros em um modelo de média móvel fraccionadamente integrado autorregressivo, que também é chamado de modelo Fracional ARIMA (FARIMA ou ARFIMA). Implementações em pacotes de estatísticas Vários pacotes que aplicam metodologia como a otimização de parâmetros Box-Jenkins estão disponíveis para encontrar os parâmetros corretos para o modelo ARIMA. Em R. o pacote stats inclui uma função arima. A função é documentada em ARIMA Modelagem de séries temporais. Além da parte ARIMA (p, d, q), a função também inclui fatores sazonais, um termo de interceptação e variáveis ​​exógenas (xreg., Chamados de regressores externos). O pacote de previsão em R pode selecionar automaticamente um modelo ARIMA para uma determinada série temporal com a função auto. arima (). O pacote também pode simular modelos sazonais e não sazonais ARIMA com sua função simulate. Arima (). Ele também tem uma função Arima (), que é um wrapper para o arima do pacote stats. O SAS (R) do SAS Institute Inc. inclui extenso processamento ARIMA em seu sistema de Análise Econométrica e de Séries Temporais: SAS / ETS. O Stata inclui a modelagem ARIMA (usando seu comando arima) como do Stata 9. Veja também Este artigo inclui uma lista de referências. Relacionadas ou links externos. Mas suas fontes permanecem obscuras porque faltam citações em linha. Favor melhorar este artigo introduzindo citações mais precisas. (Maio de 2017) Referências Mills, Terence C. (1990) Time Series Techniques for Economists. Cambridge University Press Percival, Donald B. e Andrew T. Walden. (1993) Análise Espectral para Aplicações Físicas. Cambridge University Press. Ligações externas Esta entrada é de Wikipedia, a principal enciclopédia contribuída por usuários. A ordem de um modelo ARIMA (média móvel-automática integrada) é normalmente indicada pela notação ARIMA (p, d, q), onde está a ordem da parte autorregressiva É a ordem da diferenciação é a ordem do processo da média móvel Se não for feita nenhuma diferenciação (d 0), os modelos são geralmente chamados de modelos ARMA (p. O modelo final do exemplo anterior é um modelo ARIMA (1,1,1) desde que a instrução IDENTIFY especificou d 1 e a instrução ESTIMATE final especificada p 1 e q 1. Notação para modelos ARIMA puros Matematicamente, o modelo ARIMA puro é escrito Como é a série de resposta ou uma diferença da série de resposta é o termo médio é o operador autorregressivo, representado como um polinômio no operador backshift: é o operador de média móvel, representado como um polinômio no operador backshift: é a perturbação independente , Também chamado de erro aleatório A série é calculada pela instrução IDENTIFY e é a série processada pela instrução ESTIMATE. Assim, é a série de resposta Y ou uma diferença de especificado pelos operadores de diferenciação na instrução IDENTIFY. Para diferenças simples (não sazonais),. Para a diferenciação sazonal, onde d é o grau de diferenciação não sazonal, D é o grau de diferenciação sazonal, e s é o comprimento do ciclo sazonal. Por exemplo, a forma matemática do modelo de ARIMA (1,1,1) estimado no exemplo anterior é a média móvel agressiva ARMA (p, q) Modelos para análise de séries temporais - Parte 1 Por Michael Halls-Moore em 17 de agosto de 2017 Em O último artigo que olhamos para caminhadas aleatórias e ruído branco como modelos de séries temporais básicas para certos instrumentos financeiros, como os preços diários de ações e de índices de ações. Descobrimos que, em alguns casos, um modelo de caminhada aleatória foi insuficiente para captar o comportamento de autocorrelação total do instrumento, o que motiva modelos mais sofisticados. No próximo par de artigos vamos discutir três tipos de modelo, a saber, o modelo de ordem p autorregressivo (AR), o modelo de Ordem Mínima (MO) da ordem q eo modelo de média móvel movimentada (ARMA) de ordem p , Q. Estes modelos nos ajudarão a tentar capturar ou explicar mais da correlação serial presente dentro de um instrumento. Em última análise, eles nos fornecerão um meio de prever os preços futuros. No entanto, é bem conhecido que as séries de tempo financeiro possuem uma propriedade conhecida como agrupamento de volatilidade. Ou seja, a volatilidade do instrumento não é constante no tempo. O termo técnico para esse comportamento é conhecido como heterocedasticidade condicional. Uma vez que os modelos AR, MA e ARMA não são condicionalmente heteroscedásticos, ou seja, eles não levam em conta o agrupamento de volatilidade, em última análise, precisamos de um modelo mais sofisticado para nossas previsões. Tais modelos incluem o modelo condutor condicional condicional (ARCH) e modelo Heteroskedastic condicional condicional generalizado (GARCH), e as muitas variantes dele. GARCH é particularmente bem conhecido em finanças de quant e é usado primeiramente para simulações financeiras da série de tempo como um meio de estimar o risco. No entanto, como todos os artigos do QuantStart, eu quero construir esses modelos a partir de versões mais simples para que possamos ver como cada nova variante muda nossa capacidade de previsão. Apesar do fato de AR, MA e ARMA serem modelos de séries temporais relativamente simples, eles são a base de modelos mais complicados, como a Média Móvel Integrada Autoregressiva (ARIMA) ea família GARCH. Por isso, é importante que os estudemos. Uma de nossas primeiras estratégias de negociação na série de artigos de séries temporais será combinar ARIMA e GARCH, a fim de prever preços n períodos de antecedência. No entanto, teremos que esperar até discutimos ambos ARIMA e GARCH separadamente antes de aplicá-los a uma estratégia real. Como vamos prosseguir Neste artigo vamos esboçar alguns novos conceitos de séries de tempo que bem precisam para os restantes métodos, Estacionário eo critério de informação Akaike (AIC). Após esses novos conceitos, seguiremos o padrão tradicional para estudar novos modelos de séries temporais: Racional - A primeira tarefa é fornecer uma razão por que estavam interessados ​​em um determinado modelo, como quants. Por que estamos introduzindo o modelo de séries temporais Que efeitos podemos capturar O que ganhamos (ou perdemos) adicionando complexidade extra Definição - Precisamos fornecer a definição matemática completa (e notação associada) do modelo de séries temporais para minimizar Qualquer ambiguidade. Propriedades de Segunda Ordem - Vamos discutir (e em alguns casos derivar) as propriedades de segunda ordem do modelo de séries temporais, que inclui sua média, sua variância e sua função de autocorrelação. Correlograma - Usaremos as propriedades de segunda ordem para traçar um correlograma de uma realização do modelo de séries temporais para visualizar seu comportamento. Simulação - Vamos simular realizações do modelo de série de tempo e, em seguida, ajustar o modelo para estas simulações para garantir que temos implementações precisas e compreender o processo de montagem. Dados Financeiros Reais - Ajustaremos o modelo da série de tempo aos dados financeiros reais e consideraremos o correlograma dos resíduos para ver como o modelo explica a correlação serial na série original. Previsão - Vamos criar n-passo adiante previsões do modelo de série de tempo para realizações específicas, a fim de produzir sinais de negociação. Quase todos os artigos que escrevo sobre modelos de séries temporais cairão nesse padrão e nos permitirá comparar facilmente as diferenças entre cada modelo à medida que adicionamos mais complexidade. Vamos começar por olhar para a estacionária rigorosa ea AIC. Estritamente estacionário Nós fornecemos a definição de estacionário no artigo sobre correlação serial. No entanto, como estaremos entrando no reino de muitas séries financeiras, com várias freqüências, precisamos ter certeza de que nossos (eventuais) modelos levem em conta a volatilidade variável no tempo dessas séries. Em particular, precisamos considerar sua heterocedasticidade. Encontraremos este problema quando tentarmos ajustar certos modelos a séries históricas. Geralmente, nem toda a correlação seriada nos resíduos dos modelos ajustados pode ser considerada sem levar em consideração a heterocedasticidade. Isso nos leva de volta à estacionária. Uma série não é estacionária na variância se tiver volatilidade variável no tempo, por definição. Isso motiva uma definição mais rigorosa de estacionariedade, ou seja, a estacionariedade estrita: estritamente estacionária série A série de tempo modelo, é estritamente estacionário se a distribuição estatística conjunta dos elementos x, ldots, x é o mesmo que xm, ldots, xm, Para todos os ti, m. Pode-se pensar nesta definição como simplesmente que a distribuição da série temporal é inalterada para qualquer deslocamento abritário no tempo. Em particular, a média ea variância são constantes no tempo para uma série estritamente estacionária ea autocovariância entre xt e xs (digamos) depende apenas da diferença absoluta de t e s, t-s. Estaremos revisitando estritamente séries estacionárias em futuras postagens. Critério de Informação Akaike Eu mencionei em artigos anteriores que eventualmente precisaria considerar como escolher entre melhores modelos separados. Isto é verdade não só de análise de séries temporais, mas também de aprendizagem de máquinas e, em termos mais gerais, de estatísticas em geral. Os dois principais métodos que usaremos (por enquanto) são o Critério de Informação Akaike (AIC) e o Critério de Informação Bayesiano (conforme avançamos com nossos artigos sobre Estatísticas Bayesianas). Bem, brevemente considerar a AIC, como ele será usado na Parte 2 do ARMA artigo. AIC é essencialmente uma ferramenta para auxiliar na seleção do modelo. Ou seja, se tivermos uma seleção de modelos estatísticos (incluindo séries temporais), então a AIC estima a qualidade de cada modelo, em relação aos outros que temos disponíveis. Baseia-se na teoria da informação. Que é um tópico altamente interessante, profundo que infelizmente não podemos entrar em muito detalhes sobre. Ele tenta equilibrar a complexidade do modelo, que neste caso significa o número de parâmetros, com o quão bem ele se encaixa os dados. Vamos fornecer uma definição: Critério de Informação Akaike Se tomarmos a função de verossimilhança para um modelo estatístico, que tem k parâmetros, e L maximiza a probabilidade. Então o Critério de Informação Akaike é dado por: O modelo preferido, a partir de uma seleção de modelos, tem o mínimo AIC do grupo. Você pode ver que o AIC cresce à medida que o número de parâmetros, k, aumenta, mas é reduzido se a probabilidade de log negativo aumentar. Essencialmente penaliza modelos que são overfit. Vamos criar modelos AR, MA e ARMA de várias ordens e uma maneira de escolher o melhor modelo para um conjunto de dados específico é usar o AIC. Isto é o que bem estar fazendo no próximo artigo, principalmente para os modelos ARMA. Modelos autoregressivos de ordem p O primeiro modelo que irão considerar, que forma a base da Parte 1, é o modelo Autoregressivo de ordem p, muitas vezes abreviado para AR (p). Fundamentação No artigo anterior consideramos a caminhada aleatória. Onde cada termo, xt é dependente unicamente do termo anterior, x e um termo estocástico de ruído branco, wt: O modelo autorregressivo é simplesmente uma extensão da caminhada aleatória que inclui termos mais atrás no tempo. A estrutura do modelo é linear. Que é o modelo depende linearmente sobre os termos anteriores, com coeficientes para cada termo. Isto é de onde o regressivo vem em autorregressivo. É essencialmente um modelo de regressão onde os termos anteriores são os preditores. Modelo auto-regressivo de ordem p Um modelo de série temporal,, é um modelo autorregressivo de ordem p. AR (p), se: begin xt alfa1 x ldots alfa x wt soma p alphai x wt fim Onde está o ruído branco e alphai em mathbb, com alfap neq 0 para um processo autorregressivo p-order. Se considerarmos o operador de mudança de marcha para trás. (Veja o artigo anterior), então podemos reescrever o acima como uma função theta de: begin thetap () xt (1 - alpha1 - alpha2 2 - ldots - alphap) xt wt end Talvez a primeira coisa a notar sobre o modelo AR (p) É que uma caminhada aleatória é simplesmente AR (1) com alfa igual a unidade. Como já dissemos acima, o modelo autogressivo é uma extensão da caminhada aleatória, então isso faz sentido. É fácil fazer previsões com o modelo AR (p), para qualquer tempo t, uma vez que temos os coeficientes alfa determinados, nossa estimativa Simplesmente torna-se: comece hat t alfa1 x ldots alfa x extremidade Portanto, podemos fazer n-passo adiante previsões produzindo chapéu t, chapéu, chapéu, etc até chapéu. De fato, quando considerarmos os modelos ARMA na Parte 2, usaremos a função R predict para criar previsões (juntamente com bandas de intervalo de confiança de erro padrão) que nos ajudarão a produzir sinais de negociação. Estacionaridade para Processos Autoregressivos Um dos aspectos mais importantes do modelo AR (p) é que nem sempre é estacionário. De fato, a estacionaridade de um modelo particular depende dos parâmetros. Ive tocou sobre isso antes em um artigo anterior. Para determinar se um processo AR (p) é parado ou não, precisamos resolver a equação característica. A equação característica é simplesmente o modelo autorregressivo, escrito em forma de mudança para trás, definido como zero: resolvemos esta equação para. Para que o processo autorregressivo particular seja estacionário, precisamos que todos os valores absolutos das raízes dessa equação excedam a unidade. Esta é uma propriedade extremamente útil e nos permite calcular rapidamente se um processo AR (p) está parado ou não. Vamos considerar alguns exemplos para tornar essa idéia concreta: Random Walk - O processo AR (1) com alfa1 1 tem a equação característica theta 1 -. Claramente isto tem a raiz 1 e como tal não é estacionária. AR (1) - Se escolhemos fração alfa, obtemos xt frac x wt. Isto nos dá uma equação característica de 1 - frac 0, que tem uma raiz 4 gt 1 e assim este processo particular de AR (1) é estacionário. AR (2) - Se definimos alpha1 alpha2 frac, então temos xt frac x frac x wt. Sua equação característica se torna - frac () () 0, que dá duas raízes de 1, -2. Uma vez que esta tem uma raiz unitária é uma série não-estacionária. No entanto, outras séries AR (2) podem ser estacionárias. Propriedades da segunda ordem A média de um processo AR (p) é zero. No entanto, as autocovariâncias e autocorrelações são dadas por funções recursivas, conhecidas como as equações de Yule-Walker. As propriedades completas são dadas abaixo: begin mux E (xt) 0 end começo gammak soma p alphai gama, enspace k 0 fim começo rhok soma p alphai rho, enspace k 0 end Note que é necessário conhecer os valores dos parâmetros alfai antes de Calculando as autocorrelações. Agora que weve declarou as propriedades de segunda ordem podemos simular várias ordens de AR (p) e traçar os correlogramms correspondentes. Simulações e Correlogramas AR (1) Vamos começar com um processo AR (1). Isso é semelhante a uma caminhada aleatória, exceto que alfa1 não tem que igualar a unidade. Nosso modelo vai ter alpha1 0,6. O código R para criar esta simulação é dado como se segue: Note que o nosso loop for é executado de 2 a 100, não 1 a 100, como xt-1 quando t0 não é indexável. Similarmente para processos AR (p) de ordem mais alta, t deve variar de p a 100 neste loop. Podemos traçar a realização deste modelo e seu correlogram associado usando a função de layout: Vamos agora tentar montar um processo AR (p) para os dados simulados que acabamos de gerar, para ver se podemos recuperar os parâmetros subjacentes. Você pode se lembrar que nós realizamos um procedimento semelhante no artigo sobre ruído branco e passeios aleatórios. Como se vê, R fornece um comando útil ar para caber modelos autorregressivos. Podemos usar este método para nos dizer primeiramente a melhor ordem p do modelo (conforme determinado pela AIC acima) e fornecer-nos com estimativas de parâmetros para o alphai, que podemos então usar para formar intervalos de confiança. Para completar, vamos recriar a série x: Agora usamos o comando ar para ajustar um modelo autorregressivo ao nosso processo AR (1) simulado, usando estimativa de máxima verossimilhança (MLE) como procedimento de ajuste. Primeiramente, extrairemos a melhor ordem obtida: O comando ar determinou com sucesso que nosso modelo de série temporal subjacente é um processo AR (1). Podemos então obter as estimativas dos parâmetros alfai: O procedimento MLE produziu uma estimativa, somando 0,523, que é ligeiramente inferior ao valor verdadeiro de alfa1 0,6. Finalmente, podemos usar o erro padrão (com a variância assintótica) para construir 95 intervalos de confiança em torno do (s) parâmetro (s) subjacente (s). Para isso, simplesmente criamos um vetor c (-1.96, 1.96) e depois o multiplicamos pelo erro padrão: O parâmetro verdadeiro está dentro do intervalo de confiança de 95, como esperamos do fato de termos gerado a realização a partir do modelo especificamente . Como se mudarmos o alpha1 -0.6 Como antes podemos ajustar um modelo AR (p) usando ar: Mais uma vez recuperamos a ordem correta do modelo, com uma estimativa muito boa hat -0.597 de alpha1-0.6. Verificamos também que o verdadeiro parâmetro está dentro do intervalo de confiança de 95 vezes mais uma vez. AR (2) Vamos adicionar um pouco mais de complexidade aos nossos processos autorregressivos, simulando um modelo de ordem 2. Em particular, vamos definir alpha10.666, mas também definir alpha2 -0.333. Heres o código completo para simular e traçar a realização, bem como o correlograma de uma série como: Como antes podemos ver que o correlogram difere significativamente do ruído branco, como wed esperar. Existem picos estatisticamente significativos em k1, k3 e k4. Mais uma vez, iríamos usar o comando ar para ajustar um modelo AR (p) à nossa realização subjacente AR (2). O procedimento é semelhante ao do ajuste AR (1): A ordem correta foi recuperada e as estimativas do parâmetro hat 0.696 e hat -0.395 não estão muito longe dos valores dos parâmetros verdadeiros de alfa10.666 e alfa2-0.333. Observe que recebemos uma mensagem de aviso de convergência. Observe também que R realmente usa a função arima0 para calcular o modelo AR. Como aprendemos em artigos subseqüentes, os modelos AR (p) são simplesmente modelos ARIMA (p, 0, 0) e, portanto, um modelo AR é um caso especial de ARIMA sem componente de Moving Average (MA). Bem, também estar usando o comando arima para criar intervalos de confiança em torno de vários parâmetros, razão pela qual weve negligenciado fazê-lo aqui. Agora que nós criamos alguns dados simulados, é hora de aplicar os modelos AR (p) às séries temporais de ativos financeiros. Dados financeiros Amazon Inc. Permite começar por obter o preço da ação para a Amazônia (AMZN) usando quantmod como no último artigo: A primeira tarefa é sempre traçar o preço para uma breve inspeção visual. Neste caso, bem usando os preços de fechamento diário: Você vai notar que o quantmod acrescenta alguma formatação para nós, ou seja, a data, e um gráfico um pouco mais bonito do que os gráficos R habituais: Vamos agora tomar os retornos logarítmicos de AMZN e, em seguida, o primeiro - order diferença da série, a fim de converter a série de preços originais de uma série não-estacionário para um (potencialmente) estacionário. Isso nos permite comparar maçãs com maçãs entre ações, índices ou qualquer outro ativo, para uso em estatísticas multivariadas posteriores, como no cálculo de uma matriz de covariância. Se você quiser uma explicação detalhada sobre por que os retornos de log são preferíveis, dê uma olhada neste artigo mais em Quantivity. Permite criar uma nova série, amznrt. Para manter nossos logs diferenciados retorna: Mais uma vez, podemos plotar a série: Nesta fase, queremos traçar o correlograma. Estavam olhando para ver se a série diferenciada parece ruído branco. Se não houver, então há inexplicável correlação serial, o que pode ser explicado por um modelo autorregressivo. Observamos um pico estatisticamente significativo em k2. Daí há uma possibilidade razoável de correlação seriada inexplicada. Esteja ciente, porém, que isso pode ser devido a viés de amostragem. Como tal, podemos tentar montar um modelo AR (p) para a série e produzir intervalos de confiança para os parâmetros: Ajustar o modelo autorregressivo ar à série de ordem diferenciada de preços de log produz um modelo AR (2), com hat -0.0278 E chapéu -0,0687. Ive também saída a variância austóptica para que possamos calcular erros padrão para os parâmetros e produzir intervalos de confiança. Queremos ver se zero é parte do intervalo de confiança 95, como se fosse, ele reduz a nossa confiança de que temos um verdadeiro processo AR (2) subjacente para a série AMZN. Para calcular os intervalos de confiança no nível 95 para cada parâmetro, usamos os seguintes comandos. Tomamos a raiz quadrada do primeiro elemento da matriz de variância assintótica para produzir um erro padrão, então criamos intervalos de confiança multiplicando-o por -1,96 e 1,96, respectivamente, para o nível 95: Note que isso se torna mais direto quando se usa a função arima , Mas esperar bem até a parte 2 antes de introduzi-la corretamente. Assim, podemos ver que para alfa1 zero está contido dentro do intervalo de confiança, enquanto que para alfa2 zero não está contido no intervalo de confiança. Portanto, devemos ter muito cuidado ao pensar que realmente temos um modelo generative AR (2) subjacente para AMZN. Em particular, observamos que o modelo autorregressivo não leva em conta o agrupamento da volatilidade, o que leva ao agrupamento da correlação serial em séries temporais financeiras. Quando consideramos os modelos ARCH e GARCH em artigos posteriores, vamos explicar isso. Quando chegarmos a usar a função arima completo no próximo artigo, faremos previsões da série diária de preços de registro para nos permitir criar sinais comerciais. SampP500 US Equity Index Junto com ações individuais, podemos também considerar o US Equity Index, o SampP500. Vamos aplicar todos os comandos anteriores a esta série e produzir as parcelas como antes: Podemos traçar os preços: Como antes, bem criar a diferença de primeira ordem do log preços de fechamento: Mais uma vez, podemos traçar a série: É claro Deste gráfico que a volatilidade não é estacionária no tempo. Isto também se reflete na trama do correlograma. Existem muitos picos, incluindo k1 e k2, que são estatisticamente significativos para além de um modelo de ruído branco. Além disso, vemos evidências de processos de memória longa, pois existem picos estatisticamente significativos em k16, k18 e k21: Em última análise, precisamos de um modelo mais sofisticado do que um modelo autorregressivo de ordem p. No entanto, nesta fase ainda podemos tentar ajustar esse modelo. Vamos ver o que temos se fizermos isso: Usando ar produz um modelo AR (22), ou seja, um modelo com 22 parâmetros não-zero O que isso nos diz É indicativo que há provavelmente muito mais complexidade na correlação serial do que Um modelo linear simples de preços passados ​​pode realmente explicar. No entanto, já sabíamos disso porque podemos ver que há uma correlação serial significativa na volatilidade. Por exemplo, considere o período altamente volátil em torno de 2008. Isso motiva o próximo conjunto de modelos, ou seja, a Média Móvel Mínima (q) e a Média Móvel Autoresgressiva ARMA (p, q). Bem, aprender sobre estes dois na parte 2 deste artigo. Como repetidamente mencionaremos, estes acabarão por nos levar à família de modelos ARIMA e GARCH, ambos proporcionando um ajuste muito melhor à complexidade de correlação serial do Samp500. Isso nos permitirá melhorar significativamente nossas previsões e, em última instância, produzir estratégias mais rentáveis. Michael Halls-Moore Mike é o fundador da QuantStart e tem estado envolvido na indústria de finanças quantitativas nos últimos cinco anos, principalmente como desenvolvedor quantitativo e, mais tarde, como consultor de comerciante de quant para hedge funds.

Comments

Popular posts from this blog

Binary option signal indicator xm

Bonus forex sem depósito

D3 forex