neobanbou/banbou.py
David Castex 8f1a42785c Ajout Fonctionnalités et tests
preparer_dossier_travail()
formatter_vers_ArcGIS() pour le fichier CSV
2025-05-22 16:43:13 +02:00

541 lines
18 KiB
Python

## Script Banbou pour le prétraitement des données des dossiers de recollement
## de fibre optique.
import os, shutil
# DEFINITIONS DE FONCTIONS
def formatter(chaine):
"""Formate selon nomenclature.
Formate la chaine de caractères passée en paramètre :
Enlève tous les accents français. Enlève la cédille du C.
Remplace les espaces ' ' et les traits d'union '-' par
des tirets bas '_'.
Ne traite pas pour le moment le AE et OE ligaturé.
Si plusieurs '_' se suivent, les réduire à un seul.
"""
#TODO : gérer les accents sur majuscules
#TODO : amélioration ou exercice, utiliser la méthode str.translate() et maketrans
resultat = ""
precedent = None
for c in chaine:
match c:
case "à" | "â" | "ä":
resultat+= "a"
case "é" | "è" | "ê" | "ë":
resultat+= "e"
case "î" | "ï":
resultat+= "i"
case "ô" | "ö":
resultat+= "o"
case "ù" | "û" | "ü":
resultat+= "u"
case "ÿ":
resultat+= "y"
case "ç":
resultat+= "c"
case " " | "-" | "_":
if('_' not in precedent ):
resultat+= "_"
c = "_"
case _:
resultat+= c
precedent = c
return resultat
def creer_liste(dossier):
"""
Construit une liste avec les fichiers de 'dossier'
Parcourt le dossier et ses sous-dossier, ajoute TOUS les fichiers
dans une liste de _Fichier.
Chaque _Fichier ajouté a ses attributs mis a jour.
Retourne la liste.
:param user_input: nom complet du dossier
:return: liste d'élements de type _Fichier
"""
liste = []
for dossier_courant, list_sousdossiers, list_fichiers in os.walk(dossier):
for fichier_courant in list_fichiers:
print(f"fichier courant : {fichier_courant}")
ce_Fichier = _Fichier.lire(dossier_courant, fichier_courant)
liste.append(ce_Fichier)
return liste
# TODO surcharger la fonction print native pour cet affichage
def afficher(liste):
"""
Affiche le nom des fichiers de la liste des _Fichiers
"""
for courant in liste:
print(courant.nom + "." + courant.extension)
def controller_projection(id_point, point_x, point_y):
"""
regarde si les coordonnées du point sont bien dans une des projections
autorisées
Contrainte :
- Pour le moment, ne peut reconnaitre que des projections
de points situés en France métropolitaine (Lambert93 et les 9 zones CC).
- Ce sont toutes des projections coniques depuis le pole nord --> la longitude (axe Ouest Est) n'est pas déformé par ces projections et donc reste valide.
Mais je vais aussi contraindre la longitude à la France métropolitaine, pour pas qu'un point situé en Russie par exemple apparaisse comme valide.
param user_input: un point de type (int, float, float) TODO: avoir si conversion nécessaire ou faire en chaine de carac
return: Une chaine nommant la projection trouvé sinon "Mauvaise projection"
"""
# Valeurs constantes définie par IGN
projections_conformes = [
{
"nom" : "GPS",
"E0" : 0,
"N0" : 0,
"fenetreE0" : 180,
"fenetreN0" : 90,
"EPSG" : 4326 # Correspond à la projection des GPS
},
{
"nom" : "Lambert93",
"E0" : 700000,
"N0" : 6600000,
"fenetreE0" : 600000,
"fenetreN0" : 600000,
"EPSG" : 2154 # Attention la plus recente est 9794
},
{
"nom" : "CC42",
"E0" : 1700000,
"N0" : 1200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3942
},
{
"nom" : "CC43",
"E0" : 1700000,
"N0" : 2200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3943
},
{
"nom" : "CC44",
"E0" : 1700000,
"N0" : 3200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3944
},
{
"nom" : "CC45",
"E0" : 1700000,
"N0" : 4200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3945
},
{
"nom" : "CC46",
"E0" : 1700000,
"N0" : 5200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3946
},
{
"nom" : "CC47",
"E0" : 1700000,
"N0" : 6200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3947
},
{
"nom" : "CC48",
"E0" : 1700000,
"N0" : 7200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3948
},
{
"nom" : "CC49",
"E0" : 1700000,
"N0" : 8200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3949
},
{
"nom" : "CC50",
"E0" : 1700000,
"N0" : 9200000,
"fenetreE0" : 600000,
"fenetreN0" : 111000,
"EPSG" : 3950
}
# TODO : ajouter les projections DOMTOMs
]
# projection à retourner
projection = "Mauvaise projection"
# définie la projection conique Nord en regardant dans quelle intervalle la valeur se situe
for elem in projections_conformes:
borne_basse = elem["N0"] - elem["fenetreN0"]
borne_haute = elem["N0"] + elem["fenetreN0"]
if borne_basse < point_y < borne_haute :
projection = elem["nom"]
print(f"Proj. trouvé : {projection}")
# Controle la longitude
# Si c'est Lambert93 alors
# TODO: refaire cette partie avec des variables et non des entiers literraux
longitude_correcte = False
match projection:
case "Lambert93":
if 100000 < point_x < 1300000 :
longitude_correcte = True
case "CC42" | "CC43" | "CC44" | "CC45" | "CC46" | "CC47" | "CC48" | "CC49" | "CC50":
if 900000 < point_x < 2300000 :
longitude_correcte = True
case _:
pass
if not longitude_correcte :
projection = "Mauvaise projection"
print(f"Avertissement : Longitude du point id {id_point} pas en métropole.")
return projection
# REPRÉSENTATION DES DONNÉES
class _Fichier:
def __init__(self,
nom_original="Pas de nom original",
chemin="Pas de chemin",
extension="Pas d'extension",
nom= "Pas de nom",
implication="Non-conforme",
taille=0):
self.nom_original = nom_original # - son nom original
self.chemin = chemin # - son chemin absolue (dossier+fichier)
self.extension = extension # - son extension
self.nom = nom # - son nom formaté
self.implication = implication # - son implication dans le projet
self.taille = taille
def afficher(self):
"""
Affiche dans la sortie standard les éléments du fichier
"""
print("nom :".ljust(16) + self.nom)
print("nom orig :".ljust(16) + self.nom_original)
print("ext :".ljust(16) + self.extension)
print("chemin :".ljust(16) + self.chemin)
print("implication :".ljust(16) + self.implication)
print("taille :".ljust(16) + str(self.taille) )
def lire(dossier, fichier):
"""
Lit le nom du fichier et du dossier
Construit un élement _Fichier et met à jour tous ses attributs
:param user_input: chemin absolue du dossier, nom du fichier
:return: un element _Fichier
"""
# initialiser un _Fichier
ce_Fichier = _Fichier()
# lire son chemin
ce_Fichier.chemin = dossier + "\\" + fichier
# déterminer son nom original et son extension
ce_Fichier.nom_original, ce_Fichier.extension = fichier.split(".", maxsplit=1) # maxsplit permet de spliter qu'une fois au cas ou on a plusieurs . dans le nom de fichier)
# formatter et écrire le nom
ce_Fichier.nom = formatter(ce_Fichier.nom_original)
# déterminer son implication
ce_Fichier.impliquer()
# calculer sa taille
ce_Fichier.taille = os.path.getsize(ce_Fichier.chemin)
return ce_Fichier
def impliquer(self):
"""Définir l'implication d'un fichier
Les fichiers nécessaires seront copiés dans le répertoire "Travail"
L'implication est définie en fonction de l'extension du fichier.
Les fichiers nécessaires sont les DWGs, les CSVs pour les datas.
Pour les shémas et relevés de topo :
- PDFs, DOCs, ODTs (Doc LibreOffice),
"""
match self.extension:
case "pdf" | "dwg" | "csv" | "doc" | "docs" | "odt" | "PDF" | "DWG" | "CSV" | "DOC" | "ODT" | "DOCS":
self.implication = "Necessaire"
case _:
self.implication = "A-ignorer"
class _Projet:
def __init__(self,
nom="Pas de nom",
date="Pas de date",
racine="Pas de chemin",
liste=[],
nb_fichiers=0,
taille=0,
rapport="Pas de fichier",
nb_shemas=0,
nb_releves=0,
nb_csv=0,
nb_dwgs=0,
nb_points = 0,
liste_notifs=[]):
self.nom = nom # nom du projet
self.date = date # date du traitement
self.racine = racine # chemin racine du projet
self.liste = liste # liste de _Fichier
self.nb_fichiers = nb_fichiers # nb de fichiers dans "Travail"
self.taille = taille # taille des fichiers dans "Travail"
self.rapport = rapport # chemin vers le visa
self.nb_shemas = nb_shemas # nb de plans de la mise en place
self.nb_releves = nb_releves # nb de rapports de relevés topo
self.nb_csv = nb_csv # nb de fichiers CSV
self.nb_dwgs = nb_dwgs # nb de fichiers DWG
self.nb_points = nb_points # nb de points des CSVs
self.liste_notifs = liste_notifs # liste contenant les notifs du VISA
def enraciner(self):
"""
récupère le repertoire de travail (working directory) courant
met à jour l'attribut 'racine'
"""
self.racine = os.getcwd()
print("Racine : ".ljust(16), f"{self.racine}\n")
def calculer_taille(self):
"""
calcule la taille des fichiers necessaires d'un liste
d'élements _Fichier.
Met à jour l'attribut 'taille' dans le projet
"""
taille = 0.0
for courant in self.liste:
if courant.implication in "Necessaire":
taille += courant.taille
self.taille = taille
# Affichage adapté à la bonne unité
if taille < 1024 :
unite = "octets"
elif taille < 1024**2 :
unite = "Ko"
taille /= 1024
else :
unite = "Mo"
taille /= 1024**2
print(f"Taille totale : {taille:.2f} {unite}.\n")
def dater_projet(self):
"""
recupère la date du jour
met à jour l'attribut 'date' du projet
"""
self.date = datetime.datetime.today().strftime('%Y%m%d')
def nommer_projet(self):
"""
met à jour l'attribut 'nom' en composant un nom.
Le nom est constitué du nom du dossier racine et de la date
courante formatté.
"""
self.nom = f"{os.path.basename(os.getcwd())}_{self.date}"
def preparer_dossier_travail(self):
"""
Créer un dossier "Travail" dans la racine du working directory et
le peuple des fichiers nécessaires
"""
travail = "Travail"
# création du dossier "Travail et dossier"
chemin = f"{self.racine}\\{travail}"
print(f"CHEMIN FABRIQUE : {chemin}")
try:
os.mkdir(chemin)
print (f'Dossier "{travail}" créé.')
except FileExistsError as erreur:
print(f'Avertissement: Le dossier "{travail}" existe déja.')
except OSError as err:
print(f"Fichier non trouvé. Surement un pb de chemin en amont.")
# peuplement du dossier Travail avec les fichiers necessaires
for fichier in self.liste:
source = fichier.chemin
print(f"source : {source}")
# lors du peuplement préfixer et suffixer les noms des fichiers concernés comme suit : "Plan_nomfichierdwg.dwg" et "Point_nomfichiercsv_IN.csv"
# Confirmation par Audrey qu'il n'y a nécessairement qu'un fichier CSV par projet --> Le script s'occupe de le renommer.
# Mais parfois il peut y avoir plusieurs DWGs dont un seul est utile --> PASS -- Je laisse l'opérateur choisir lequel utiliser et le renommer manuellement.
match fichier.extention:
case "csv":
dest = self.racine + "\\" + travail + "\\" + "Point_" + fichier.nom + "_IN" + "." + fichier.extension
case _:
dest = self.racine + "\\" + travail + "\\" + fichier.nom + "." + fichier.extension
print(f"dest : {dest}")
if fichier.implication in "Necessaire":
try:
shutil.copyfile( source , dest)
print(fichier.nom.ljust(40,".") + "copié")
except shutil.SameFileError as err :
print(f"Le fichier {fichier.nom + fichier.extension} existe déjà.")
#TODO :
# Confirmation par Audrey qu'il n'y a necessairement qu'un fichier CSV par projet --> On peut le renommer.
# Mais parfois il peut y avoir plusieurs DWGs dont un seul est utile --> PASS -- Je laisse l'opérateur choisir lequel utiliser et le renommer manuellement.
shutil.move()
#TODO : verifier aussi la longueur des noms de fichiers. Notifier si nécessaire
def formatter_vers_ArcGIS(self, fichier):
"""
Lit et formatte un fichier CSV pour son importation dans ArcGIS.
Lit la 1ère ligne et s'assure de la présence des titres de colonnes,
formatte cette 1ère ligne, supprime les lignes vides puis change le séparateur d'élements en
',' -- séparateur adapté pour ArcGIS --
Notifie si nécessaire les points de controles qui ne passent pas.
Renomme le fichier formatté en "Point_fichier_IN.csv"
Contraintes :
- Le fichier CSV NÉCESSITE des ';' comme séparateur d'élements.
- Le fichier doit avoir exactement 5 colonnes.
param user_input: nom complet d'un fichier csv
return: Le nombre de points du csv
"""
# titres des colonnes correctement formattés.
titres = "id_point;TYPE;X;Y;Z"
# On va traiter ligne par ligne le fichier, puis cette ligne sera ajouté
# a une liste. Finalement, on écrasera chaque ligne du fichier avec cette liste
df = open(fichier)
sortie = []
# analyser la premier ligne et formatter cette ligne
ligne = df.readline()
# Si le premier mot est un nombre Alors il manque les titres, dans
# ce cas insérer une ligne.
mots = ligne.split(sep=";", maxsplit=1)
if mots[0].isalpha():
#insérer ligne
sortie.append(titres)
else:
sortie.append(ligne)
# la tête de lecture du descripteur de fichier ne reset pas sa position
# donc on peut continuer le parcours des lignes directement
for ligne_courante in df :
# enlever les espaces
ligne_courante = ligne_courante.replace(" ", "")
# si la ligne n'est pas vides alors
# TODO : changer le match en if ligne_courante not in ["", ";;;;"]:
match ligne_courante:
case "" | ";;;;":
pass
case _:
# controler la projection de ce point
id_point, type_, point_x, point_y, *autres = ligne_courante.split(sep=";")
projection = controller_projection(id_point, float(point_x), float(point_y))
#TODO: notifier si pas bonne projection
# puis ajouter la ligne a la liste
sortie.append(ligne_courante)
# compter ce point
self.nb_points += 1
df.close()
# je reouvre le descripteur en mode w only pour ecrire le fichier
df
# structure représetant des messages à mentionner dans le rapport VISA
# chaque notification possède un texte et sa catégorie concernée.
class _Notification:
def __init__(self,
categorie="Pas de catégorie",
texte="Pas de texte"):
self.categorie = categorie
self.texte = texte
# MAIN
racine = os.getcwd()
print("Répertoire courant : ".center(18), racine)
# --recupérer le chemin du dossier à traiter
pas_de_dossier = True
for a in os.scandir():
print("courant scandir() = ", a.name.ljust(25), " ", a.is_dir())
if a.is_dir():
#il y a un dossier
pas_de_dossier = False
print(f"Dossier à Traiter trouvé : {a.name}")
racine = a
if pas_de_dossier:
print("Pas de dossier trouvé...\nFin de programme\n")
os.system("pause")
# fin du programme
exit()