Lorsque j'ai commencé à toucher un peu à R, je me suis intéressé à plein de docs différents dont des articles de blog. Et étant un ancien consultant SEO, j'ai bien sûr cherché des applications pour le SEO ... ou sur le blog de certains SEO.
Pour les curieux, l'article complet est ici : http://gameofseo.fr/2017/10/apprendre-r-commandes-a-connaitre/ ; ce que je retiens dans cet article est ce dont je me sers ou me suis servi ;-)
Lire un fichier read.csv
df=read.csv(file = "monfichier.csv",header=T, sep=";",encoding = "UTF-8")
Personnellement je préfère toujours <-
à =
; mais ça revient - presque - au même. Ca donne donc :
df <- read.csv(file = "monfichier.csv",header=T, sep=";",encoding = "UTF-8")
Avec read.csv
la fonction, sep
pour le séparateur du csv et encoding
pour l'encodage à utiliser. De base je pense que vous utiliserez plus sep
selon votre csv et un skip
si votre fichier possède des lignes que vous ne souhaitez pas importer (je pense par exemple aux fichiers exportés de Screaming Frog).
Quant à la gestion des espaces, vous faites ce que vous voulez, j'ai tendance à laisser des espaces entre df
, <-
et la formule.
Pour toutes les infos sur le package read.csv : https://stat.ethz.ch/R-manual/R-devel/library/utils/html/read.table.html
Enregistrer/sauvegarder un fichier/votre datafram
write.table(df, file = "/fichier.csv", sep = ";", quote = FALSE)
Avec toujours sep
pour indique le séparateur, ici un ;
et quote
pour spécifier si le texte doit être mis entre guillements.
Renommer les colonnes d'un dataframe (df)
colnames(df) <- c("colonne 1","colonne 2","colonne 3")
Joindre deux dataframe ensemble
Ici cela nécessite d'avoir préalablement chargé deux fichiers en deux dataframe. Et d'avoir installé le package dplyr
df_final <- inner_join(x=df1=df2, by = c("colonne commune 1" = "colonne commune 2"))
L'utilisation est faite ici de inner_join
, mais vous trouverez aussi du left_join
; sans oublier qu'il y a la fonction merge
qui permet par exemple de faire merge(df1, df2, by=”colonne commune”)
qui revient à la même chose que inner_join(x=df1=df2, by = c("colonne commune 1" = "colonne commune 2"))
Toutes les informations complètes se retrouvent sur https://www.rdocumentation.org/packages/plyr/versions/1.8.4/topics/join et https://stat545.com/bit001_dplyr-cheatsheet.html