Vous aurez besoin de glob
la librairie Python pour utiliser cette astuce
Deux lignes de code en Python pour joindre des fichier
Si vous souhaitez créer un script et combiner plusieurs fichiers en un seul et tout faire dans le même script Python, vous pouvez utiliser ces deux lignes de code.
extension = 'csv'
combined_files = [i for i in glob.glob('*.{}'.format(extension))]
fichiers_conbines
est la variable que vous allez créer qui va ensuite vous permettre de créer votre data frame. Si vous souhaitez rester avec des termes anglais et ne pas avoir de soucis d'accent dans la façon de nommer vos fichier, utilisezcombined_files
Installer et charger glob
Il y a bien sûr deux pré-requis pour utiliser ces deux lignes de code:
- Insataller glob
- Charger/importer la librairie
Pour l'installation utilisez pip install
ou pip3 install
, vous n'aurez à le faire qu'une seule fois, sauf si vous utilisez des environnements Python spécifiques ou une machine différente.
Pour importer glob, insérer import glob
, cette ligne sera nécessaire à chque nouveau script dès le démarrage.
Généralement, ce que je fais, c'est que je charge toutes les librairies en une seule fois au début de mon script ; mais vous pouvez aussi les charger au fur et à mesure.
La première solution donnerai:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import glob
La seconde pourrait être la suivante si vous utilisez le même exemple avec des fichiers csv
:
import glob
extension = 'csv'
combined_files = [i for i in glob.glob('*.{}'.format(extension))]
Cette fonction Python est comme cat dans votre Terminal
Si vous n'avez "que" des fichiers de même extension à concaterner, vous pouvez utiliser aussi le Terminal de votre machine. Dans ce cas la commande sera:
cat *.csv > fichier_sortie.csv
Vous pouvez bien sûr changer le nom du fichier de sortie (exemple de output
pour rester dans le vocabulaire anglais) et même son extension (ici csv
est plus approprié pour des fichiers .csv
)
A noter aussi que cette fonction est simple (et efficace), mais ne supprime pas les en-têtes de chacun fichiers.
En apprendre plus sur la fonction cat et la façon de joindre des fichiers.
Quelques exemples d'utilisation de glob dans le cadre du SEO
Pour lancer vos scripts glob
peut dont être bien utile, de mon côté je l'utilise régulièrement dans mes missions SEO au quotidien.
- Plusieurs crawls de Screaming Frog (plusieurs site Internet de géolocalisations différentes)
- Des exports de Google Search Console ou Google Analytics (plusieurs exports par date par exemple)
- Différents exports de logs
Il y a bien des exemples, je n'en cite que 3 ci-dessus, mais n'hésitez pas à jouer avec glob :-)