Cet enseignement est une ouverture vers le traitement et l’analyse des données, la data science. L’objectif est de donner du sens à ces données et en extraire de la valeur pour aider les entreprises à prendre des décisions stratégiques ou opérationnelles.
Le langage R s’est imposé comme un des langages outils de la data science pour traiter, visualiser et modéliser les données hétérogènes.
Savoir-faire
· Manipuler une session de travail R et l’interface RStudio
· Distinguer les objets R (vecteurs, facteurs, matrices ; listes, data.frames)
· Installer les packages et utiliser les fonctions
· Mettre en œuvre des fonctions de R pour manipuler un jeu de données : importer, exporter, créer, recoder, sélectionner, filtrer (package tidyverse et dplyr)
· Mettre en œuvre des graphes avec R (package ggplot)
· Acquérir les outils et techniques permettant d’effectuer des traitements sur les données :
o Premières analyses de statistiques descriptives avec R : édition des caractéristiques de position (moyenne, médiane, quantiles, …) et de caractéristiques de dispersion (variance, écart-type, …)
o Premières analyses avec des tests statistiques : édition d’indicateurs de liaison entre variables (statistique du khi-deux, coefficient de corrélation linéaire, régression linéaire, ANOVA, …)
· Utiliser RMarkdown pour générer des rapports automatiques, mettre en forme les résultats
- Enseignant: Durand Drouhin Olivier