Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Adicionar opção para limpar cache ao rodar o scrapping #66

Open
guites opened this issue Sep 19, 2024 · 0 comments
Open

Adicionar opção para limpar cache ao rodar o scrapping #66

guites opened this issue Sep 19, 2024 · 0 comments
Labels
data-science Issues sobre IA e tratamento de dados enhancement New feature or request good first issue Good for newcomers

Comments

@guites
Copy link
Collaborator

guites commented Sep 19, 2024

Atualmente, quando rodamos o webscrapping em um cinema pela primeira vez no dia, criamos um cache em HTML pra evitar precisarmos revisitar as páginas.

Acontece que alguns cinemas, como o CineBancarios, publicam os novos horários em algum momento do dia (por ex. de tarde).

Caso eu já tenha rodado o scrapping nesse dia, e verificar que os dados estão antigos, não vou conseguir rodá-lo novamente depois que o blog tiver publicado os novos filmes.

Por causa disso, é necessário uma forma de rodar o scrapping e sobrescrever o cache.

Idealmente, isso seria uma opção na hora de rodar o scrapping pelo painel.

image

@guites guites added enhancement New feature or request good first issue Good for newcomers labels Sep 19, 2024
@guites guites added the data-science Issues sobre IA e tratamento de dados label Oct 1, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
data-science Issues sobre IA e tratamento de dados enhancement New feature or request good first issue Good for newcomers
Projects
None yet
Development

No branches or pull requests

1 participant