Skip to content

Commit

Permalink
ajout de documentation pou le script d'analyse de la source de données
Browse files Browse the repository at this point in the history
  • Loading branch information
kolok committed Dec 17, 2024
1 parent 7a90ddd commit 5871d45
Show file tree
Hide file tree
Showing 6 changed files with 845 additions and 1 deletion.
3 changes: 2 additions & 1 deletion dev-requirements.in
Original file line number Diff line number Diff line change
Expand Up @@ -18,4 +18,5 @@ pytest-dotenv
python-Levenshtein
ratelimit
ruff
shapely
shapely
ydata_profiling
823 changes: 823 additions & 0 deletions dev-requirements.txt

Large diffs are not rendered by default.

Binary file added docs/_static/resume-champs-source.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added docs/_static/resume-siret-example.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
17 changes: 17 additions & 0 deletions docs/comment-faire/auditer-une-source-de-donnees.md
Original file line number Diff line number Diff line change
@@ -0,0 +1,17 @@
# Script d'audit d'une source de données

`scripts/source_data_audit.py` permet de gagner du temps dans la création du `DAG` en explorant la donnée au préalable pour anticiper/prévenir des potentiels problèmes.

## Execution du script

_To be continued_

## Exemple: un résumé des champs pour le mapping

![image](../_static/resume-champs-source.png)

## Exemple: problèmes de données

On peut voir qu'on a des problèmes sur le `siret`

![image](../_static/resume-siret-example.png)
3 changes: 3 additions & 0 deletions scripts/source_data_audit.py
100644 → 100755
Original file line number Diff line number Diff line change
Expand Up @@ -2,6 +2,9 @@
Script pour auditer la donnée d'une source, détecter
des problèmes potentiels, et accélérer le développement
des DAGs (en identifiant les problèmes en amont).
Ce script est un outil de développement, et n'est pas destiné à être exécuté en
production.
"""

import os
Expand Down

0 comments on commit 5871d45

Please sign in to comment.