L'objectif ici est bien de ne pas supprimer les valeurs vide ou NaN — ou même leur lignes complètes —pour garder le maximum de données sur le data frame. C'est assez simple à faire et je vous recommande de remplacer ces valeurs par un 0. En Python, vous utiliserez soit pandas soit numpy.

Remplacer les valeur NaN en python

Avec les librairies, vous aurez deux solutions afin de remplacer les valeurs Nan par des 0: soit fillna() — avec la librairie pandas—, soit replace() —avec la librairie numpy—voyons ensemble quelques exemples.

Dans ces exemples nous utilisons le même dataframe et "écrasons" les données directement. Mais au lieu de df vous pouvez toujours utiliser un autre nom df2 ou dfnan our tester.

Première solution avec fillna() - pandas

Utilisons en premier la librairie pandas

Sur une colonne du dataframe

df['colonne'] = df['colonne'].fillna(0)

df est le nom du dataframe

Sur tout le dataframe

df = df.fillna(0)

df est le nom du dataframe

Seconde solution avec replace() - numpy

Utilisons en second la librairie numpy

Sur une colonne du dataframe

df['Colonne'] = df['Colonne'].replace(np.nan, 0)

df est le nom du dataframe

Sur tout le dataframe

df = df.replace(np.nan, 0)

df est le nom du dataframe

En apprendre plus sur NaN

NaN est l'abréviation de Not A Number (signifiant pas un nombre). NaN représente les valeurs manquantes dans les dataframe.

Pour le SEO cela peut servir par exemple lorsque vous exportez les données de Google Search Console (GSC) et lorsque vous avez des divisions par zero, quant il n'y a pas de clics

Source de l'image: https://www.geeksforgeeks.org/ (Merci ;-) )

Article suivant Article précédent