Vous aurez besoin de glob la librairie Python pour utiliser cette astuce

Deux lignes de code en Python pour joindre des fichier

Si vous souhaitez créer un script et combiner plusieurs fichiers en un seul et tout faire dans le même script Python, vous pouvez utiliser ces deux lignes de code.

extension = 'csv'
combined_files = [i for i in glob.glob('*.{}'.format(extension))]
  • fichiers_conbines est la variable que vous allez créer qui va ensuite vous permettre de créer votre data frame. Si vous souhaitez rester avec des termes anglais et ne pas avoir de soucis d'accent dans la façon de nommer vos fichier, utilisez combined_files

Installer et charger glob

Il y a bien sûr deux pré-requis pour utiliser ces deux lignes de code:

  • Insataller glob
  • Charger/importer la librairie

Pour l'installation utilisez pip install ou pip3 install, vous n'aurez à le faire qu'une seule fois, sauf si vous utilisez des environnements Python spécifiques ou une machine différente.

Pour importer glob, insérer import glob, cette ligne sera nécessaire à chque nouveau script dès le démarrage.

Généralement, ce que je fais, c'est que je charge toutes les librairies en une seule fois au début de mon script ; mais vous pouvez aussi les charger au fur et à mesure.

La première solution donnerai:

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import glob

La seconde pourrait être la suivante si vous utilisez le même exemple avec des fichiers csv:

import glob
extension = 'csv'
combined_files = [i for i in glob.glob('*.{}'.format(extension))]

Cette fonction Python est comme cat dans votre Terminal

Si vous n'avez "que" des fichiers de même extension à concaterner, vous pouvez utiliser aussi le Terminal de votre machine. Dans ce cas la commande sera:

cat *.csv > fichier_sortie.csv

Vous pouvez bien sûr changer le nom du fichier de sortie (exemple de output pour rester dans le vocabulaire anglais) et même son extension (ici csv est plus approprié pour des fichiers .csv)

A noter aussi que cette fonction est simple (et efficace), mais ne supprime pas les en-têtes de chacun fichiers.

En apprendre plus sur la fonction cat et la façon de joindre des fichiers.

Quelques exemples d'utilisation de glob dans le cadre du SEO

Pour lancer vos scripts glob peut dont être bien utile, de mon côté je l'utilise régulièrement dans mes missions SEO au quotidien.

  1. Plusieurs crawls de Screaming Frog (plusieurs site Internet de géolocalisations différentes)
  2. Des exports de Google Search Console ou Google Analytics (plusieurs exports par date par exemple)
  3. Différents exports de logs

Il y a bien des exemples, je n'en cite que 3 ci-dessus, mais n'hésitez pas à jouer avec glob :-)

Article suivant Article précédent