Évènement

Ateliers du LADIREC 2023 | Initiation à l’analyse de textes assistée par ordinateur

Jeudi, 12 janvier, 2023àJeudi, 6 avril, 2023
Série d'ateliers en ligne pour l'initiation à l'analyse de textes assistée par ordinateur - McGill University Co-Curricular Record Approved

Du 12 janvier au 6 avril 2023 (14h à 16h), dans le cadre du Pôle d’analyse de données sociales, le Laboratoire d’analyse des discours et des récits collectifs (LADIREC) offrira six ateliers en ligne d’initiation aux méthodes et outils d’analyse de textes assistée par ordinateur. Ces ateliers libres sont complémentaires à ceux proposés par le Digital Scholarship Hub de la Bibliothèque McLennan et par la Computational and Data Systems Initiative de la Faculté des sciences de McGill. Donnés en français, ils sont spécifiquement orientés vers l’acquisition, la structuration, la manipulation, l’analyse et la visualisation des données textuelles.

Les ateliers sont d’abord destinés aux étudiant·e·s et chercheur·se·s en lettres et sciences humaines, mais ils sont ouverts à toutes et à tous. Nous invitons les personnes qui s’intéressent aux humanités numériques ainsi que les membres de la communauté de Montréal en commun à y participer. Il est nécessaire de disposer d’un ordinateur personnel. Aucune formation préalable n’est requise pour participer aux premiers ateliers. Toutefois, les trois dernières séances sont d'un niveau plus avancé et nécessitent d'avoir assister aux ateliers précédents (ou de posséder des connaissances de base en programmation).

La série est organisée dans une logique de continuité; les participant·e·s peuvent toutefois s’inscrire à l’un ou plusieurs des ateliers de façon indépendante. Ceux-ci se tiendront à distance (Zoom). Les personnes qui auront pris part à tous les ateliers de la série obtiendront une reconnaissance de participation ajoutée à leur dossier d’implication (Co-Curricular Record ou CCR) de McGill.   

*Il est nécessaire de s'inscrire pour obtenir le lien Zoom de chaque atelier.

 

 

 


Programmation hiver 2023

1) Les essentiels de la programmation : logique et raisonnement formel 

Date : 12 janvier 2023 (14h à 16h)

Responsable : doyon.elisabeth [at] courrier.uqam.ca (Elisabeth Doyon)  (UQAM)

Description

Cet atelier d’introduction vise à fournir aux étudiant·e·s et aux chercheur·euse·s qui ne sont pas familiers avec la programmation quelques notions de base qui les prépareront à plonger dans l’analyse de textes assistée par ordinateur. Qu’est-ce que la formalisation des données? Qu’est-ce qu’une chaîne de traitement et une structure de contrôle? Quels sont les opérateurs logiques utilisés en programmation?  Les participant·e·s apprendront à modéliser leurs données, à formaliser un raisonnement et à penser l’analyse d’un corpus textuel comme une série d’opérations. 

 

2) La constitution de corpus pour l’analyse textuelle 

Date :  26 janvier 2023 (14h à 16h)

Responsables : yu.c.shi [at] mail.mcgill.ca (Yu Chen Shi) et julien.vallieres-gingras [at] mcgill.ca (Julien Vallières-Gingras) (McGill) 

Description

Préalable à toute analyse, la constitution de corpus recouvre un ensemble de tâches parmi lesquelles il s’agit ici de proposer un parcours accessible à toutes et à tous. Quels sont les problèmes les plus fréquents que présente l’extraction de textes et quels sont les moyens de les résoudre? Cet atelier offrira une introduction pratique à l’utilisation des expressions régulières (regex) dans Microsoft Word, ainsi qu’à OpenRefine, un logiciel libre spécialisé dans la manipulation de données tabulaires. On y apprendra à extraire d’un lot de fichiers au format PDF les textes qu’il contient, à les nettoyer et à les structurer dans Microsoft Word, à les verser et réunir dans OpenRefine au sein d’une table unique à deux dimensions, et à structurer la table ainsi obtenue. 

 

3) Explorer les données textuelles avec Voyant Tools 

Date : 9 février 2023 (14h à 16h)

Responsables : lisa.teichmann [at] mcgill.ca (Lisa Teichmann)  et julien.vallieres-gingras [at] mcgill.ca (Julien Vallières-Gingras) (McGill)

Description

Voyant Tools est un progiciel d’analyse de texte gratuit disponible en ligne. Il s’agit d’un projet universitaire conçu pour faciliter les pratiques de lecture distante pour les étudiant·e·s et les chercheur·euse·s en humanités numériques. Dans cet atelier, les participant·e·s apprendront quelles sont les applications de base offertes par le progiciel; iels apprendront également à créer des visualisations interactives de données textuelles à l’aide de celui-ci. Une brève introduction aux carnets Spyral, une interface développée dans le prolongement de Voyant Tools permettant d’intégrer texte, code et données dans une même pratique rédactionnelle, terminera la séance. 

 

4) Explorer les données textuelles avec R 

Date : 23 février 2023 (14h à 16h)

Responsable : pascal.brissette [at] mcgill.ca (Pascal Brissette) (McGill)

Prérequis : Avoir suivi l’atelier « Les essentiels de la programmation : logique et raisonnement formel », ou l’équivalent.

Description

R est un langage de programmation largement utilisé par les chercheur·euse·s et les étudiant·e·s universitaires pour analyser des données, y compris les données textuelles. Il est gratuit et ouvert, tout comme son puissant et convivial environnement de programmation, RStudio, et des milliers d’extensions sont offertes par la communauté pour faciliter l’exécution de tâches comme celles liées au traitement du langage naturel (Natural language processing). Dans cet atelier, les participant·e·s auront l’occasion d’installer R et de se familiariser avec son environnement de programmation, d’importer et de manipuler un corpus textuel dans cet environnement et de produire des statistiques sur les textes du corpus et les métadonnées. 

 

5) Visualiser les résultats d’analyses avec ggplot2 (R) 

Date : 9 mars 2023 (14h à 16h)

Responsable : lisa.teichmann [at] mcgill.ca (Lisa Teichmann)  et pascal.brissette [at] mcgill.ca (Pascal Brissette) (McGill)

Prérequis : Avoir suivi l’atelier « Explorer les données textuelles avec R », ou l’équivalent

Description

Les graphiques constituent un outil du plus grand intérêt pour « faire parler » les données. Qui n’a pas suivi avec plaisir ou anxiété, selon les moments, les effets de vague de la COVID à travers les courbes présentées par la Santé publique du Québec? Les courbes, les colonnes et les points permettent de dévoiler toutes sortes de dimensions des jeux de données et peuvent utilement accompagner la présentation d’analyses. Dans cet atelier, les participant·e·s apprendront diverses méthodes de visualisation de jeux de données et se familiariseront avec l’extension ggplot2 (Hadley Wickham et al.) et la grammaire des graphiques sur laquelle repose cette extension de R. 

 

6) Géolocaliser des données avec tydigeocoder et leaflet (R) 

*NOUVELLE DATE: 6 avril 2023 (14h à 16h)* 23 mars 2023 (14h à 16h)

Responsable : lisa.teichmann [at] mcgill.ca (Lisa Teichmann)  et  pascal.brissette [at] mcgill.ca (Pascal  Brissette)  (McGill)

Prérequis : Les participant·e·s devraient avoir suivi les ateliers d’initiation à R ou posséder une connaissance de base (débutant) de l’environnement RStudio et du langage R.

Description

La géolocalisation est un utile moyen de présenter des données et de les explorer en faisant apparaître une dimension qui échappe souvent à leur examen sous la forme de tables ou de graphiques à barres, soit leur distribution dans l’espace géographique. Cependant, ce passage de la table simple à la carte n’est pas toujours facile. Cet atelier partira d’un cas particulier, la représentation spatiale de crimes sur le territoire montréalais. On verra comment importer un jeu de données depuis le site de Données Québec, puis on utilisera les extensions tidygeocoder et leaflet for R pour projeter ces données sur une carte de la Ville de Montréal. 

 


À propos du LADIREC

Le LADIREC est un laboratoire de recherche de la Faculté des arts de l’Université McGill. Il constitue l’un des trois modules du Pôle d’analyse de données sociales piloté par le Centre de recherches interdisciplinaires en études montréalaises et financé par Montréal en commun. Consultez notre page Web pour en savoir plus.

Back to top