Analyse de données avec R


TP 2: Introduction au data.frame (2h)

Prof. Patrick E. Meyer

Version 3.0

Matrice et liste (ex: 25 min + sol: 10min)

  1. Soit y <- matrix(45:64, nr=5, byrow=TRUE)
    Que s'affiche-t-il après chacune de ces lignes (faire mentalement)?
      > y[1,]
      > y[3:4,3:4]
      > y[-c(2,3),-c(1,4)]
      > cbind(y,c(2,3,5,8,13))  #utilisez l'aide (avec ?cbind) si besoin
    

  2. Soit l'assignation suivante:
     > a <- list(valeurs=rep(c(1,2),3), motif=c("acgt","tgca") )
    

    Que s'affiche-t-il après chacune de ces lignes (faire mentalement)?
     > a[[1]]
     > a[[2]][2]
     > a$motif
     > a$valeurs[3]
    

Data.frame (ex: 30 min + sol: 10 min)

A l'aide des fonctions data(), names(), cor(), intersect(), which() et which.max() (utilisez l'aide si besoin)
Charger le dataset CO2 (dataset interne) et
  1. Écrire un code R qui crée un vecteur composé des noms des variables du dataset à l'exception de la première variable.

  2. Écrire un code R qui calcule la corrélation entre l'absoprtion en $CO_2$ (des plantes du dataset) avec la concentration en $CO_2$ dans l'athmosphère.
  3. Écrire un code R qui compte le nombre de plantes provenant du Quebec qui ont, une absorption en $CO_2$ supérieur à 35 ( $\frac{\mu mol}{m^2.sec}$), et qui n'ont pas été refroidie dans la nuit qui précède la mesure.
  4. Écrire un code R qui retourne la plante (l'indice de la ligne) du dataset CO2 qui absorbe le plus de $CO_2$ lorsque la concentration en $CO_2$ dans l'atmosphère est la plus basse.

Données d'expression (ex: 30 min + sol: 10 min)

  1. Soit le jeu de données d'expressions génétiques d'E.coli stocké dans le fichier testset3.Rdata situé dans le répertoire /public/STAT0077-OCEA0224-INFO0956/tests/ sur le serveur Rstudio (et par ailleurs téléchargeable ici). On vous demande de donner ci-dessous, parmi les gènes de votre jeu de données, les noms des 6 gènes qui sont les plus positivement corrélés à l'expression du premier gène du dataset (en utilisant la corrélation de Pearson), et en les ordonnant par ordre de corrélation DÉCROISSSANTE.



<--- BACK