Análise de dados públicos – SAE Louveira Parte 2

Análise de dados públicos – SAE Louveira Parte 2

No primeiro artigo vimos boas práticas para analisarmos a qualidade da água de Louveira, agora vamos aprimorar nosso painel com outros tipos de informações.

A qualidade de água não pode ser medida somente pelos compostos, pois se não tivermos a disponibilidade da água em nossa residência, de pouco importa que ela seja límpida, correto? Talvez o nome Qualidade da água não seja o melhor nome que se encaixe aqui, mas deixemos assim por enquanto.

Neste artigo vamos analisar a disponibilidade da água em Louveira e suas interrupções, para tal, vamos aproveitar os dados disponibilizados pela ARES PCJ (Agência Reguladora dos Serviços de Saneamento das Bacias dos rios Piracicaba, Capivari e Jundiaí) sobre interrupções programadas e emergenciais no período de jan. 2020 à mai. 2021 e também utilizar publicações diversas no site da prefeitura de Louveira.

1º Passo – Mineração de dados.

As informações de interrupções no abastecimento estão na página da ARES PCJ, e confesso que levei uma hora e trinta minutos para pegar todos os dados, primeiro filtrei por Louveira e após entrei em todas as linhas e montei a tabela no Excel, só cataloguei de uma forma organizada para o Power Bi entender. Criei um ID para facilitar a contagem de interrupções distintas.

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-1024x258.png
Dados

Repare que temos várias linhas para o mesmo ID, isso ocorre quando a paralização é em mais de um bairro ao mesmo tempo, deixei dessa forma para analisarmos quantidades de interrupções por bairros também.

E agora? Será que é possível exibir as informações mais pertinentes no Power BI?

2º Passo – Importar dados e montar análise

Após importar a base de dados, vamos estruturar nosso painel colocando o brasão, título e algumas informações gerais obtidas tanto no site da prefeitura como nos dados catalogados no excel.

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-1-1024x310.png

Vamos elaborar uma visão para quantidade de interrupções por bairros, e destacar aqueles que tiveram mais de 10 interrupções no ano. O gráfico de coluna horizontal é uma boa aqui, pois mostra o nome completo do bairro e é simples comparar as dimensões das colunas.

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-2.png
Análise de interrupção no abastecimento de água por bairro de Louveira

Mas e a distribuição das interrupções por mês?

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-4.png
Interrupções no abastecimento de água em Louveira por mês

Neste gráfico além das interrupções distintas no mês temos em linha a quantidade de interrupções em ralação à bairros. Janeiro por exemplo, em média cada interrupção distinta afetou 6 bairros por vez, já em abril cada interrupção afetou em média 2 bairros por vez. Veja que o número 55 de janeiro não indica 55 bairros diferentes, podemos ter o mesmo bairro afetado várias vezes no mês.

Uma análise interessante é verificar se as interrupções foram programadas e avisadas com antecedência ou se foram interrupções emergenciais sem planejamento prévio.

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-5.png

Podemos parar por aqui em relação a 2020 e tirar algumas conclusões:

3º Passo – Conclusões

  • Tivemos 8 grandes interrupções no ano.
  • Tivemos em média 8 interrupções distintas por mês.
  • Tivemos em média 25 interrupções em bairros por mês.
  • Podemos ver que a distribuição de ocorrências não é uniforme entre os bairros, provavelmente temos variáveis que condicionam esses números como por exemplo as idades dos encanamentos.
  • Praticamente 75% das interrupções não são programadas e não temos aviso prévio da falta de água.
  • Agora possuímos apenas 3 bairros sem água encanada, já que o bairro Abadia foi contemplado com sua rede em 2020.

4º Passo – Comparações 2020 x 2021

Vamos realizar algumas comparações entre os anos de 2020 e 2021, pois temos os dados até maio de 2021.

Novas perguntas:
A) Quantas interrupções tivemos por mês?
B) Qual a diferença acumulada até maio?
C) Quais os bairros mais afetados?
D) Tivemos melhorias em relação a interrupções não programadas?

Começando, com o gráfico de linhas é possível ver as interrupções de janeiro a maio para ambos os anos, e visualmente é fácil verificar que a linha azul (2021) na maior parte do tempo fica a baixo da cinza (2020).

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-6.png
Interrupções distintas 2020 x 2021

Vamos rapidamente gerar a diferença entre as interrupções para esse período:

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-7.png

Tivemos a diminuição de 29% em relação a interrupções distintas entre os anos para o período selecionado.

Para respondermos quais bairros foram mais afetados, não vamos repetir o gráfico de colunas lá de cima, quero mostrar um outro tipo bem interessante chamado Árvore hierárquica, veja.

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-8.png
Interrupção por ano e bairro

Neste visual é só clicar no ano que quiser que irá abrir a ramificação dos bairros em ordem de maior ocorrência.
Caso esteja se perguntando se é possível acrescentar mais informações na Árvore, a resposta é sim! Podemos colocar por exemplo se a interrupção foi programada ou emergencial.

Esta imagem possuí um atributo alt vazio; O nome do arquivo é image-9.png

Aproveitando esta visualização, é possível ver que a quantidade de interrupções emergenciais e programadas em 2021 é de 48 para 1, mas isso contando os bairros. Interrupções distintas são 22, conforme vimos no gráfico de colunas, e dessas 22 temos 1 programada, o que nos da um fator de aproximadamente 95% de interrupções não programadas.

Veja que rapidamente respondemos as perguntas, “rapidamente” é sarcasmo pois levei um bom tempo testando as visualizações e simplificando os gráficos até estarem com estas aparências.

Seguindo, quais as conclusões podemos tirar?

4º Passo – Conclusões 2021

  • Em média tivemos um pouco mais de 4 interrupções por mês no abastecimento de água.
  • Redução de 29% em relação a interrupções distintas de abastecimento comparando com o mesmo período de 2020, um total de 31 em 2020 para 22 em 2021.
  • Redução mais acentuada se tratando de contagem de interrupções em bairros, de 101 em 2020 para 49 em 2021, totalizando uma redução de 51% neste período.
  • Tivemos um aumento na taxa de interrupções emergenciais x programadas, totalizando 95% de não programadas.
  • Dos 5 primeiros meses, tivemos 2 em que o número de interrupções foram maior que 2020: Fevereiro e Março.
  • Em relação aos bairros mais afetados ainda temos o bairro Parque dos Estados na posição mais alta, que em 2021 divide a posição com Capivari e Videiras.

Caso queira acessar o painel: Clique aqui
Os arquivos utilizados neste artigo podem ser baixados aqui: Arquivos

Como já descrito no primeiro artigo, ainda temos muitos pontos que podemos analisar, logo volto com uma 3ª parte!

Qualquer dúvida ou sugestão por favor comente neste artigo ou me encontre em uma de minhas redes sociais: Instagram ou Linkedin.

Até a próxima!

Sobre o Autor

Victor Sponchiado
Victor Sponchiado

Apaixonado por tecnologia, sonho em me tornar programador quântico, atualmente navegando pelas águas do Data Science. Pai, marido, estudante, empreendedor, educador, amigo, e tantos outros papeis. Sempre muito feliz com a vida :)

0 Comentários

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *