Ads Top

[Aprenda Time Series] - Método Naïve

Métodos Naïve, como assumir que o valor previsto no tempo 't' seja o valor real da variável no tempo 't-1' ou média móvel da série, são usados para avaliar o quão bem os modelos estatísticos e modelos de aprendizado de máquina podem executar e enfatizar sua necessidade.


Neste artigo, vamos experimentar esses modelos em um dos recursos de nossos dados de série temporal.


Primeiro, veremos a média do recurso de "temperatura" de nossos dados e o desvio em torno dele. 


Também é útil ver os valores máximos e mínimos de temperatura. Podemos usar as funcionalidades da biblioteca numpy aqui:




Temos as estatísticas para todas as 9357 observações na linha do tempo com espaçamento igual, que são úteis para entendermos os dados.


Agora vamos tentar o primeiro método naïve, definindo o valor previsto no momento igual ao valor real no momento anterior e calcular a raiz do erro quadrático médio (RMSE) para quantificar o desempenho desse método.



Vejamos o próximo método naïve, onde o valor previsto no tempo presente é igualado à média dos períodos de tempo que o precedem. Iremos calcular o RMSE para este método também.



Aqui, você pode experimentar vários períodos anteriores também chamados de "atrasos" que deseja considerar, que são mantidos como 3 aqui. Nestes dados, pode ser visto que conforme você aumenta o número de defasagens e o erro aumenta. Se o lag for mantido em 1, ele se tornará o mesmo método ingênuo usado anteriormente.


Pontos a serem observados:


  • Você pode escrever uma função muito simples para calcular a raiz do erro quadrático médio. Aqui, usamos a função de erro quadrático médio do pacote ‘sklearn’ e, em seguida, obtemos sua raiz quadrada.
  • No pandas, df [‘column_name’] também pode ser escrito como df.column_name, no entanto, para este conjunto de dados df.T não funcionará da mesma forma que df [‘T’] porque df.T é a função para transpor um dataframe. Portanto, use apenas df [‘T’] ou considere renomear esta coluna antes de usar a outra sintaxe.

Nenhum comentário:

Tecnologia do Blogger.