- Google Drive et le stockage des fichiers mobilisés
Pour l’ensemble des outils développés dans le projet, un compte Gmail est indispensable. Ce dernier donne accès à service de stockage et de partage de fichiers Google Drive. Ce service est utilisée pour stocker les fichiers/dossiers mobilisés lors de l’exécution des scripts développés dans le cadre du projet.
Pour accéder à son espace Google Drive, deux chemins sont possible :
– taper dans un navigateur web « Google Drive », cliquer sur le premier lien puis rentrer ses identifiants gmail.
– se connecter à son espace Gmail, cliquer sur les « Applications Google » (icône à droite de celle des paramètres) puis sur « Drive ».
- Google Colab et l’exécution des scripts
Pour exécuter un script, l’outil qui a été privilégié dans ce projet, est Google Colaboratory couramment appelé Google Colab. Ce service basé sur Jupyter Notebook, permet l’exécution de notebook sans qu’il soit nécessaire d’installer un logiciel. En outre, par sa capacité à entraîner des modèles de Machine Learning, l’utilisation de cet outil est en cohérence avec les besoins du projet.
Pour ouvrir un fichier Google Colab, il faut au préalable activer le service via son compte Google Drive. Pour cela, il faut cliquer sur « Nouveau » puis « Plus ». Si l’option Google Colaboratory ne s’affiche pas, cliquer sur « Afficher plus d’applications », rechercher Google Colaboratory et enfin, cliquer sur « Connecter ».
- GitHub
L’entièreté des scripts développés dans le cadre de ce projet se trouve sur la plateforme GitHub, un service web d’hébergements et de gestion de développement de logiciels, à l’adresse suivante https://github.com/baoia. Pour pouvoir travailler sur les scripts du projet, le plus simple est de télécharger le dossier ou repository qui vous intéresse et l’insérer à votre Google Drive. Pour cela, sélectionner le repository concerné puis cliquer sur « Code » et enfin, « Download ZIP ». Une fois téléchargé, glisser le repository dans votre espace de travail Google Drive.
Actuellement le dépôt GitHub est composé de 3 repositories :
– « scripts » contenant les principaux scripts développés dans le projet.
– « FabLab » correspondant aux outils pour la séance de séminaire du 08.11.2021.
– « Tutoriel extraction cartographie » qui fait référence au tutoriel décrit à cette page.
- Notebook
Dans le cadre de ce projet, les scripts prennent la forme de notebook écrit en python. En programmation, un notebook ou calepin électronique en français, est une interface de programmation permettant à un utilisateur d’exécuter un script de manière simplifiée. Pour cela, l’utilisateur exécute des cellules qui sont elles-mêmes reliées à une partie de code. L’extension d’un fichier notebook est .ipynb
.
Par exemple, le notebook Test ouvert avec Google Colab se présente de la manière suivante :
Dans le carré rouge est visible la connexion avec le compte Gmail utilisé. Dans le rectangle vert, la connexion avec les caractéristiques de stockage et de mémoire de l’ordinateur utilisé. Enfin, dans le rectangle bleu, une cellule de code vide avec un bouton » Play » à gauche pour lancer l’exécution de la cellule.
Si l’on remplit la cellule vide par un simple calcul et qu’on l’exécute :
Le résultat de l’exécution de la cellule est visible au dessus (encadré bleu) et le temps d’exécution apparaît à gauche du bouton d’exécution (encadré marron).
- Première étape générale : Connexion du notebook au compte Google Drive
Dans la plupart des notebooks du projet, la première cellule permet de connecter le notebook à son compte Google Drive sur lequel va être téléchargés les documents obtenus après l’exécution du script.
La vidéo suivante indique les étapes de cet accès (elles sont écrites en dessous de la vidéo) :
- Cliquer sur l’exécution pour lancer la cellule
- Cliquer sur « Exécuter malgré tout » lors de l’apparition du message d’avertissement indiquant que le notebook n’a pas été créé par Google
- Cliquer sur « Se connecter à Google Drive » lors de l’apparition du second message d’avertissement pour donner l’autorisation au notebook d’accéder à vos fichiers Google Drive
- Choisir le compte Gmail concerné
- Cliquer sur « Autoriser »
Une fois qu’un flèche verte est apparue à côté de la cellule, vous pouvez avoir accès à l’arborescence de vos fichiers de la manière suivante :
- Cliquer sur l’icône représentant un dossier à gauche de votre écran
- Cliquer sur Drive
- Cliquer sur MyDrive et vos fichiers apparaissent
- Chemins et arborescence de fichiers
Lors de l’exécution des notebooks, il est nécessaire d’indiquer l’emplacement du dossier de travail dans lequel le notebook se trouve ou bien encore, l’emplacement du dossier dans lequel vont être téléchargés les fichiers générés. Pour cela, il faut renseigner un chemin d’accès à un dossier ou à un fichier. Un chemin d’accès est une liste de noms de dossiers séparés par des barres obliques, suivis d’un nom de dossier ou d’un nom de fichier.
Dans le cadre de notre projet, le chemin d’accès aux dossiers Google Drive – une fois, la connexion établie entre le notebook et Google Drive -, est toujours le même : /content/drive/My Drive/
. Lorsque le chemin d’accès termine par une barre oblique, cela signifie qu’il donne accès à l’ensemble du contenu du dernier dossier cité : ici, ils ‘agit du contenu du dossier « My Drive ».
Lorsque le chemin d’accès désigne un fichier en particulier dans un dossier, il prend la forme suivante : /content/drive/My Drive/un
fichier.txt
. Ici, le chemin d’accès mène au fichier nommé « un fichier », situé dans le dossier « My Drive » et dont l’extension est .txt
.