Parfois lorsque vous êtes en train de lire des données dans un tableur comme Excel de Microsoft, il est plus simple de mettre une formule directement dans le tableur que d'aller chercher à traiter de nouveau les informations via R, Python, ou toutes autres solutions. Ce "nettoyage" des données que je propose dans cet article, va permettre de supprimer des caractères qui ne vous intéressent pas comme des "stop words" (tirets, points, espaces…) ; mais aussi d'apporter une meilleur harmonisation.

Découvrons ensemble comment substituer des caractères dans le logiciels Microsoft Excel ... voir les supprimer automatiquement. Ça vous tente ? Allons-y !

Supprimer des données : supprimer les premiers caractères d'une cellule

La formule que vous attendez pour supprimer les X derniers caractères d'une cellelue sur Excel est :

=GAUCHE(A;NBCAR(A2)-X

GAUCHE permet de donner le point de départ ; où

Exemple de 1 caractères c'est assez simple =GAUCHE(A2;NBCAR(A2)-1

Exemple de 19 caractères c'est sur le même principe (la formule étant assez simple à comprendre) : =GAUCHE(A2;NBCAR(A2)-19)

Note : cela peut avoir un intérêt lors du tri de données, mais aussi lors de mise en forme d'URL pour le SEO ou d'informations complémentaires.

Supprimer des données : supprimer les derniers caractères d'une cellule

Si vous avez compris le principe pour la fin de la cellule, c'est exactement la même chose pour début de la cellule Excel ; mis à part le fait d'utiliser DROITE au lieu de GAUCHE

=DROITE(A2;NBCAR(A2)-X

Note: tu peux tout à fait remplacer DROITE par GAUCHE ou inversement comme tu le vois !

Supprimer des données : rechercher/remplacer

Parfois, il est plus simple de dupliquer une colonne et d'y effectuer un "simple" rechercher + remplacer et pour supprimer vous pourrez rechercher le ou les caractères que vous souhaitez enlever des cellules et ensuite les remplacer par rien, enfin dans le champ remplacer ne rien mettre ou alors mettre un espace.

Supprimer les espaces en trop dans votre cellelule

Votre cellelule Excel peut parfois être mal encodée selon la source que vous avez récupéré ... et donc parfois il peut y avoir certains espaces qui vous empêchent de réaliser un travail optimal! La formule que vous pourriez utiliser est: =SUPPRESPACE()

Exemple avec du texte de =SUPPRESPACE("Meilleure formule de suppression d ' espaces") qui deviendra "Meilleure formule de suppression d'espaces" ... quand même mieux que le faire cellule par celule, non? Pour une cellule c'est plus rapide de le faire manuellement, mais lorsque vous en avez plus de 5 ... ça devient trop pour moi !

Et le meilleur, c'est que comme c'est une formule vous pouvez la copier et l'adapter pour une celiulle:

Pour A2="Meilleure formule de suppression d ' espaces" ; la formule =SUPPRESPACE(A2) donnera le même résultat "Meilleure formule de suppression d'espaces"

Supprimer des catactères en les substituant

Cette formule peut être utilisée pour supprimer des catactères comme des doubles caractères ou des espaces, comme vu au paragraphe précédent. Mais aussi remplacer - comme son nom l'indique en anglais - des caratères par des autres.

Exemple avec des espaces en trop (comme une suppression de caractères) : =SUBSTITUE(“La meilleure... ... chose c'est le ..SEO”;”. . ”;” ”) ce qui permettra de transformer la phrase en La meilleure chose c'est le SEO

Exemples avec un caractères (je passe ici de minuscule à majuscule sur SEO ) : =SUBSTITUE(“La meilleure chose c'est le seo”;”le seo”;”le SEO”) ce qui permettra de transformer la phrase en La meilleure chose c'est le SEO

Exemple avec un mot à remplacer : =SUBSTITUE(“La meilleure chose c'est le SEO”;”le SEO”;”la Data”) ce qui permettra de transformer la phrase en La meilleure chose c'est la Data

À noter que les formules sont sensibles à la casse (case sensitive en anglais)

Cet article s'inscrit dans la thématique de l'analyse de données, mais peut servir à différents niveaux ; le SEO comme nous l'avons vu, mais parfois de la mise en forme de textes ou des tableaux de calculs plus complexes.

Article suivant Article précédent