Collecter et analyser des données numériques

Samuel Coavoux, post-doctorant, Université Paris-8

S1

Ce cours porte sur la collecte automatisée de données web pour les sciences sociales, à l’aide du langage R. Il est utile pour les étudiants qui souhaitent mener un travail de terrain au moins en partie sur Internet, et qui souhaitent aisément récupérer des données sous un format exploitable pour l’analyse, qualitative ou statistique.

Les séances porteront sur :

  1. la structure des données web
  2. la programmation avancée dans R
  3. l’aspiration de données avec le package rvest
  4. l’extraction d’informations, la mise en forme et le nettoyage des données

Pré-requis : maîtriser les fondamentaux du langage R (cours quantifier en pratique (1) ou équivalent). Besoin d’un ordinateur portable avec une version à jour de R, de l’IDE Rstudio, et des packages dplyr, tidyr, et rvest.

SÉANCES LE LUNDI DE 14H À 16H EN SALLE 10 DU CAMPUS JOURDAN, LES 14, 21, 28 NOVEMBRE ET LE 12 DÉCEMBRE. PAS DE VALIDATION.