Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Implementar script de coleta para AL #34

Open
endersonmaia opened this issue Mar 23, 2020 · 8 comments · May be fixed by #138
Open

Implementar script de coleta para AL #34

endersonmaia opened this issue Mar 23, 2020 · 8 comments · May be fixed by #138
Assignees
Labels

Comments

@endersonmaia
Copy link
Collaborator

endersonmaia commented Mar 23, 2020

Temos microdados :

http://www.dados.al.gov.br/dataset/painel-covid19-alagoas

Segue link do CSV : http://www.dados.al.gov.br/dataset/painel-covid19-alagoas/resource/0371d543-3b57-4177-aea3-394d1f009bfd

--

A apuração para Alagoas está bem irregular em relação aos sites que disponibilizam os dados.

É possível encontrá-los em 3 endereços :

neste link existe uma seção Boletins, as vezes desatualizada com as notícias

neste link aparece junto com as notícias do site

aqui é o mais estruturado, contém uma lista de links para os boletins em PDF a partir do boletim de número 16

Segue o link de um PDF para tomar como referência : http://www.saude.al.gov.br/wp-content/uploads/2020/04/Informe-COVID-19-nº-27-02-DE-ABRIL-02_04_2020.pdf.pdf.pdf

@mojimi
Copy link

mojimi commented Mar 24, 2020

Não entendi o uso do script, o que ele deveria fazer? Quais os passos?

@endersonmaia
Copy link
Collaborator Author

Não entendi o uso do script, o que ele deveria fazer? Quais os passos?

baixar o PDF e tentar extrair os dados de forma automatizada, e gerar os dados, assim como outros script do repositório já estão fazendo ou tem PR abertas para fazer

vide : https://github.com/turicas/covid19-br/blob/master/corona_pr_spider.py

@endersonmaia
Copy link
Collaborator Author

Até a nomenclatura dos arquivos não tem padrão, não ajuda 😞

estes são os disponíveis no site do IFAL

informe-covid-19-no-15-20-de-marco-16h-50.pdf
informe-covid-19-no-16-21-de-marco-16h-29-pdf.pdf
informe-covid-19-no-17-22-de-marco17h-51-1.pdf
informe-covid-19-n-18-23-marco-17h-29-pdf-pdf.pdf

@endersonmaia
Copy link
Collaborator Author

O PDF deu uma estabilizada desde o boletim do dia 29/03/2020, existe agora uma tabela com os casos, dia a dia, por município.

@endersonmaia endersonmaia added data-scraping enhancement New feature or request labels Apr 3, 2020
@endersonmaia
Copy link
Collaborator Author

O PDF do Boletim parou de exibir a tabela com os casos por municipio desde o dia 08/04/2020.

Agora só tem informação textual, e a situação de casos suspeitos e descartados, em uma tabela que não dá pra inferir os casos confirmados.

http://www.saude.al.gov.br/wp-content/uploads/2020/04/Informe-COVID-19-nº-33-08-DE-ABRIL.pdf

@endersonmaia
Copy link
Collaborator Author

como comentei em #19 (comment) o boletim voltou a exibir tabela

@endersonmaia
Copy link
Collaborator Author

O CSV disponível em https://envio.seplag.al.gov.br/covid19/public/dados/sintomas tem um pouco de atraso em relação aos Boletins, mas por ser estruturado permite automatizar.

@endersonmaia endersonmaia linked a pull request May 18, 2020 that will close this issue
@endersonmaia endersonmaia self-assigned this May 21, 2020
@endersonmaia
Copy link
Collaborator Author

O CSV disponível em https://envio.seplag.al.gov.br/covid19/public/dados/sintomas tem um pouco de atraso em relação aos Boletins, mas por ser estruturado permite automatizar.

parece que as atualizações estão bem mais frequentes, e agora pode ser que esteja até mais adiantado que os boletins divulgados em PDF

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

Successfully merging a pull request may close this issue.

2 participants