Ads Top

[Aprenda Time Series] - Introdução

Uma série temporal é uma sequência de observações durante um determinado período. Uma série de tempo univariada consiste nos valores tomados por uma única variável em instâncias de tempo periódicas ao longo de um período, e uma série de tempo multivariada consiste nos valores tomados por várias variáveis nas mesmas instâncias de tempo periódicas ao longo de um período. O exemplo mais simples de uma série temporal que todos nós encontramos no dia a dia é a mudança de temperatura ao longo do dia, semana, mês ou ano.


A análise de dados temporais é capaz de nos dar insights úteis sobre como uma variável muda ao longo do tempo, ou como ela depende da mudança nos valores de outra (s) variável (s). Esta relação de uma variável com seus valores anteriores e / ou outras variáveis pode ser analisada para previsão de séries temporais e tem inúmeras aplicações em inteligência artificial.





Python tem uma popularidade estabelecida entre os indivíduos que realizam aprendizado de máquina por causa de sua estrutura de código fácil de escrever e entender, bem como uma ampla variedade de bibliotecas de código aberto. Algumas dessas bibliotecas de código aberto que usaremos nos próximos artigos são apresentadas a seguir.


Bibliotecas Python para Time Series


NumPy


Python Numérica é uma biblioteca usada para computação científica. Ele funciona em um objeto de matriz N-dimensional e fornece funcionalidade matemática básica, como tamanho, forma, média, desvio padrão, mínimo, máximo, bem como algumas funções mais complexas, como funções algébricas lineares e transformada de Fourier. Você aprenderá mais sobre isso à medida que avançarmos neste tutorial.


Pandas


Esta biblioteca fornece estruturas de dados altamente eficientes e fáceis de usar, como séries, dataframes e painéis. Ele aprimorou a funcionalidade do Python, desde a simples coleta e preparação de dados até a análise de dados. As duas bibliotecas, Pandas e NumPy, tornam muito simples qualquer operação em conjuntos de dados pequenos a muito grandes. Para saber mais sobre essas funções, siga este tutorial.


SciPy


Science Python é uma biblioteca usada para computação científica e técnica. Oferece funcionalidades de otimização, processamento de sinais e imagens, integração, interpolação e álgebra linear. Essa biblioteca é útil durante a execução do aprendizado de máquina. Discutiremos essas funcionalidades à medida que avançamos neste tutorial.


Scikit Learn


Esta biblioteca é um kit de ferramentas SciPy amplamente utilizado para modelagem estatística, aprendizado de máquina e aprendizado profundo, pois contém vários modelos personalizáveis ​​de regressão, classificação e agrupamento. Funciona bem com Numpy, Pandas e outras bibliotecas, o que o torna mais fácil de usar.


Statsmodels


Como o Scikit Learn, esta biblioteca é usada para exploração de dados estatísticos e modelagem estatística. Ele também funciona bem com outras bibliotecas Python.


Matplotlib


Esta biblioteca é usada para visualização de dados em vários formatos, como gráfico de linha, gráfico de barra, mapas de calor, gráficos de dispersão, histograma, etc. Ela contém todas as funcionalidades relacionadas ao gráfico necessárias desde a plotagem até a rotulagem. Discutiremos essas funcionalidades à medida que avançamos neste tutorial.


Essas bibliotecas são muito essenciais para iniciar o aprendizado de máquina com qualquer tipo de dado.


Datetime

Esta biblioteca, com seus dois módulos - datetime e calendar, fornece todas as funcionalidades datetime necessárias para ler, formatar e manipular o tempo.


Usaremos essas bibliotecas nos próximos artigos.

Nenhum comentário:

Tecnologia do Blogger.