L'objectif ici est bien de ne pas supprimer les valeurs vide ou NaN — ou même leur lignes complètes —pour garder le maximum de données sur le data frame. C'est assez simple à faire et je vous recommande de remplacer ces valeurs par un 0. En Python, vous utiliserez soit pandas soit numpy.
Remplacer les valeur NaN en python
Avec les librairies, vous aurez deux solutions afin de remplacer les valeurs Nan par des 0: soit fillna()
— avec la librairie pandas—, soit replace()
—avec la librairie numpy—voyons ensemble quelques exemples.
Dans ces exemples nous utilisons le même dataframe et "écrasons" les données directement. Mais au lieu de df
vous pouvez toujours utiliser un autre nom df2
ou dfnan
our tester.
Première solution avec fillna() - pandas
Utilisons en premier la librairie pandas
Sur une colonne du dataframe
df['colonne'] = df['colonne'].fillna(0)
Où df
est le nom du dataframe
Sur tout le dataframe
df = df.fillna(0)
Où df
est le nom du dataframe
Seconde solution avec replace() - numpy
Utilisons en second la librairie numpy
Sur une colonne du dataframe
df['Colonne'] = df['Colonne'].replace(np.nan, 0)
Où df
est le nom du dataframe
Sur tout le dataframe
df = df.replace(np.nan, 0)
Où df
est le nom du dataframe
En apprendre plus sur NaN
NaN est l'abréviation de Not A Number (signifiant pas un nombre). NaN représente les valeurs manquantes dans les dataframe.
Pour le SEO cela peut servir par exemple lorsque vous exportez les données de Google Search Console (GSC) et lorsque vous avez des divisions par zero, quant il n'y a pas de clics
Source de l'image: https://www.geeksforgeeks.org/ (Merci ;-) )