Ads Top

[Aprenda Time Series] - Variações da ARIMA

No artigo anterior, vimos como o modelo ARIMA funciona e suas limitações de não poder lidar com dados sazonais ou séries temporais multivariadas e, portanto, novos modelos foram introduzidos para incluir esses recursos.


Um vislumbre desses novos modelos é dado aqui:


Auto-regressão vetorial (VAR)


É uma versão generalizada do modelo de auto regressão para séries temporais estacionárias multivariadas. É caracterizado pelo parâmetro 'p'.


Média móvel vetorial (VMA)


É uma versão generalizada do modelo de média móvel para séries temporais estacionárias multivariadas. É caracterizado pelo parâmetro 'q'.


Média móvel de regressão automática vetorial (VARMA)


É a combinação de VAR e VMA e uma versão generalizada do modelo ARMA para séries temporais estacionárias multivariadas. É caracterizado pelos parâmetros 'p' e 'q'. Muito parecido, ARMA é capaz de agir como um modelo AR definindo o parâmetro 'q' como 0 e como um modelo MA definindo o parâmetro 'p' como 0, VARMA também é capaz de agir como um modelo VAR definindo o parâmetro 'q' como 0 e como um modelo VMA definindo o parâmetro 'p' como 0.






O código acima mostra como o modelo VARMA pode ser usado para modelar séries temporais multivariadas, embora esse modelo possa não ser o mais adequado em nossos dados.


VARMA com variáveis ​​exógenas (VARMAX)


É uma extensão do modelo VARMA, onde variáveis ​​extras chamadas covariáveis ​​são usadas para modelar a variável primária em que estamos interessados.


Média Móvel Sazonal Auto Regressiva Integrada (SARIMA)


Esta é a extensão do modelo ARIMA para lidar com dados sazonais. Ele divide os dados em componentes sazonais e não sazonais e os modela de maneira semelhante. É caracterizado por 7 parâmetros, para os parâmetros da parte não sazonal (p, d, q) iguais aos do modelo ARIMA e para os parâmetros da parte sazonal (P, D, Q, m) onde 'm' é o número de períodos sazonais e P, D, Q são semelhantes aos parâmetros do modelo ARIMA. Esses parâmetros podem ser calibrados usando busca em grade ou algoritmo genético.


SARIMA com variáveis ​​exógenas (SARIMAX)


Esta é a extensão do modelo SARIMA para incluir variáveis ​​exógenas que nos ajudam a modelar a variável que nos interessa.


Pode ser útil fazer uma análise de correlação nas variáveis ​​antes de colocá-las como variáveis ​​exógenas.




A correlação de Pearson mostra uma relação linear entre 2 variáveis, para interpretar os resultados, primeiro olhamos para o valor p, se for menor que 0,05, então o valor do coeficiente é significativo, caso contrário, o valor do coeficiente não é significativo. Para um valor p significativo, um valor positivo do coeficiente de correlação indica correlação positiva e um valor negativo indica correlação negativa.


Média Móvel Fracionária Auto Regressiva Integrada (FARIMA)


Às vezes, pode acontecer que nossa série não seja estacionária, mas diferenciar com o parâmetro 'd' tomando o valor 1 pode superá-la. Portanto, precisamos diferenciar a série temporal usando um valor fracionário.


No mundo da ciência de dados, não existe um modelo superior; o modelo que funciona com seus dados depende muito do seu conjunto de dados. O conhecimento de vários modelos nos permite escolher um que funcione em nossos dados e fazer experiências com esse modelo para obter os melhores resultados. E os resultados devem ser vistos como gráfico, bem como métricas de erro, às vezes um pequeno erro também pode ser ruim, portanto, traçar e visualizar os resultados é essencial.


No próximo artigo, veremos outro modelo estatístico, suavização exponencial.



Nenhum comentário:

Tecnologia do Blogger.