3 elementos chave de séries temporais

3 elementos chave de séries temporais

Introdução:

Vivemos numa realidade onde o tempo é uma dimensão que avança em apenas um sentido. Estamos cercados por dados que se atualizam a todo momento, e entender como esses dados se comportam ao longo do tempo é uma das ferramentas primordiais para qualquer atuante na área de dados.

Um exemplo de série temporal é o número de casos novos por covid-19. Na figura 1, temos o número de casos novos na Bahia, de 25 de fevereiro a 17 de setembro de 2020.

 

                Figura 1. Casos novos de COVID-19 na Bahia em 2020.

 

A série da figura 1, é um exemplo de série univariada, onde temos apenas uma informação para cada informação de tempo.  Quando se observa mais de uma informação ao longo do tempo, é chamada série temporal multivariada.

                Figura 2. Casos novos de COVID-19 na Bahia e em Minas Gerais em 2020.

Elementos da séries temporal:

Tendência:

Ao analisar a série temporal o elemento mais frequentemente observado é a tendência. A tendência indica o comportamento um da série ao longo do tempo. Quando uma série tem tendência positiva, indica que o valor da variável resposta aumenta com o passar do tempo. Na Figura 1 podemos observar um comportamento de possível tendência positiva. A tendência negativa indica que a variável resposta diminui seu valor ao passar do tempo. Quando a série não apresenta tendência positiva nem negativa, é chamada série sem tendência ou tendência nula.

OBS: Afirmar sobre tendência apenas observando o comportamento do gráfico pode levar a conclusões erradas, pois o comportamento observado pode ser extrapolado pela variabilidade da série. Para afirmar sobre tendência com precisão deve-se realizar testes estatísticos que avaliarão o comportamento probabilístico da série, como o Teste de Wald e o de Cox-Stuart.

Sazonalidade:

Outro elemento na análise de séries temporais é a sazonalidade, que indica a repetição de padrões por intervalos de periodicidade. Na figura 3 observa-se o comportamento sazonal para novos casos de covid-19 na Bahia.

 

Figura 3. Casos novos de COVID-19 Bahia em 2020.

É possível observar um comportamento repetido a cada semana de subida e decida da curva. Repare que esse comportamento tem duração semelhante a uma semana para quase todos os dados dispostos. Nesse caso isso se deve ao fato dos casos novos de COVID-19 serem sub-registrados nos finais de semana, logo, a informação acumula-se para o próximo dia útil, o que apresenta esse “salto” cíclico na série.

Variabilidade:

A variabilidade é outro elemento chave para análise de séries temporais. A variabilidade nos informa se existe um comportamento único de variabilidade ou múltiplos comportamentos.

Figura 4. Novos óbitos por COVID-19 no Brasil em 2020.

 

Na figura 4 podemos observar os distintos comportamentos de variabilidade da série. No período de abril a maio observa-se uma variabilidade distinta, do período a partir de julho. No segundo trimestre de 2020 a variabilidade cresce a medida que o número de mortes cresce. Já no período de junho a agosto a variabilidade apresenta comportamento constante. Uma série com único comportamento de variabilidade apresenta conclusões e previsões mais precisas em suas análises, da mesma forma que uma série com maior variabilidade apresenta previsões com menor precisão.

Conclusão:

Cada um dos elementos da série temporal, contribui com um tipo distinto de informação . Um estudo que visa prever, explicar ou classificar deve considerar cada uma delas em sua análise. Nos próximos posts identificaremos, como testar e aplicar as informações de cada elemento no ajuste de um série temporal.

Sobre o Autor

Leonardo Salvi
Leonardo Salvi

Bacharelando em Estatística pela Universidade Federal da Bahia, Pesquisador, Programador e Cientista de dados

0 Comentários

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

plugins premium WordPress