18-22 mai 2026 Paris (France)

Programme > Ateliers

Les deux journées qui précèdent la conférence Humanistica 2026 (lundi 18 et mardi 19 mai) sont consacrées à des ateliers.

Chaque atelier, d’une demi-journée, permet d’entrer au cœur des méthodes, des outils et des pratiques des humanités numériques, dans un format plus interactif et plus expérimental que les sessions de communication. Ils s’adressent avant tout aux personnes débutantes, ainsi qu’aux participant·e·s disposant de quelques connaissances en code et souhaitant consolider leurs bases.

Les inscriptions aux ateliers ouvriront en même temps que celles du colloque (courant février). Chaque atelier comportera un nombre minimal et un nombre maximal de participant·e·s : si le seuil minimal n’est pas atteint, l’atelier n’aura pas lieu et les frais d’inscription seront remboursés aux personnes inscrites. À l’inverse, aucune place supplémentaire ne pourra être ajoutée une fois l’atelier complet : l’attribution des places se fera selon le principe « premier arrivé, premier inscrit ». En cas de demande supplémentaire sur certains ateliers, une liste d’attente sera mise en place.

A noter : il sera possible de s'inscrire à plusieurs ateliers (2 par jour). Il sera également possible de suivre les ateliers sans être inscrit·e à la conférence (l'inscription aux ateliers sera séparée).

Pour tous les ateliers, chaque participant·e devra disposer d’un ordinateur.

La liste des ateliers sera mise à jour au fil de l’eau.

Corpusense : transformez vos documents sériels en données structurées

Résumé

Développé dans le cadre du projet Mezanno, financé par le plan quadriennal de la BnF, Corpusense (https://mezanno.xyz/corpusense/) est une interface en ligne (sans installation requise), ouverte et conçue pour répondre de la manière la plus simple possible à la question suivante : comment transformer des sources sérielles (annuaires, dictionnaires, index, etc.) en données structurées (tableaux, graphes de connaissances) ?
Cet atelier propose de prendre en main Corpusense en deux temps. D’abord, une présentation générale de l’outil sera faite, illustrée par des exemples concrets. Ensuite, les participants seront invités à travailler sur des données de leur choix, avec l’assistance des formateurs.

Intervenants

Jonathan Perrinet, EPITA, développeur principal de l'application Corpusense
Joseph Chazalon, EPITA, initiateur du projet Mezanno/Corpusense
Edwin Carlinet, EPITA, initiateur du projet Mezanno/Corpusense

Public visé

Débutant

Durée

3 heures

Prérequis

Apporter un ordinateur portable, de préférence avec une souris.

De l'image à la TEI : bonnes pratiques pour les textes en français du Moyen Âge à aujourd'hui

Résumé

Comment OCRiser un texte ? Comment accélérer la conversion des données en TEI? De quels outils a-t-on besoin pour explorer les données produites ? Depuis plusieurs années, un groupe de chercheur.se.s s'est engagé dans la rédaction d'un manuel de travail afin de proposer des solutions communes et de régler les multiples problèmes que posent la documentation.

Cet atelier propose de présenter pour la première fois des propositions concrètes, qui concernent tous les types de documents (manuscrits, imprimés, etc.) pour tous les siècles du français. Il vise aussi à créer un espace d’échange autour des choix méthodologiques, à confronter les retours d’expérience et à favoriser la discussion entre praticiens, en fonction des types de corpus et des objectifs de recherche. Quatre principales tâches informatiques seront abordées : l'analyse de mise en page, la reconnaissance automatique de l’écriture, la normalisation du texte et son annotation linguistique.

Intervenant·e·s

Ariane Pinche est chargée de recherche CNRS en études médiévales et en humanités numériques au CIHAM (UMR 5648). Ses recherches portent sur l’édition numérique de textes hagiographiques en ancien français. Aujourd’hui, ses intérêts de recherche se portent tout particulièrement sur la reconnaissance automatique d’écriture pour les manuscrits médiévaux et sur les mécanismes de compilation dans les légendiers français.
Lucence Ing est ingénieure de recherche au sein du projet COLaF (Corpus et Outils pour les Langues de France), ALMAnaCH, Inria. Ses recherches portent sur l’évolution du français médiéval à travers l’étude diachronique de témoins de textes arthuriens. Dans ce cadre, elle s’intéresse tant aux questions d’alignement automatique de témoins d’un même texte qu’à celles de l’étiquetage linguistique automatique.
Sonia Solfrini est doctorante en humanités numériques et en littérature de la Renaissance, dans le cadre du projet FNS SETAF (IHR, Université de Genève). Ses recherches portent sur le traitement numérique des textes de la Renaissance et sur les œuvres du poète Matthieu Malingre (ca. 1500-1572).
Simon Gabay est maître-assistant en humanités numériques à l’Université de Genève. Ses recherches sont au croisement de l’histoire de la langue et de la littérature, et s’intéressent tout particulièrement à l’histoire de l’orthographe ou à l’étude du style. Une part importante de son travail est dévolue à la conception des outils informatiques permettant ces analyses.

Public visé

Débutant

Durée

2 heures

Prérequis

Une première expérience avec la constitution ou la manipulation d'un corpus numérique est recommandée (mais n'est pas obligatoire).

Du prétraitement aux LLM : TAL pour textes classiques

Résumé

L'atelier a pour but de familiariser les chercheurs en lettres classiques à l'usage des techniques modernes adaptées à l'étude des langues anciennes. Les notebooks Python proposés (qui ne nécessiteront pas d'installation) seront utilisés pour les tâches de TAL (lemmatisation, postagging, dependency), vectorisation sémantique simple, et autres tâches attenantes aux capacités actuelles des transformers (NER, classification, analyse de réseau, et autres).

Intervenante

Marianne Reboul (ENS de Lyon) est maîtresse de conférences en lettres classiques et humanités numériques (spécialisée dans l'usage des LLMs pour l'alignement automatique des langues anciennes et détection d'intertexte multilingue).

Public visé

Débutant

Durée

3 heures

Prérequis

Pas de prérequis obligatoire ; un peu de Python peut être utile.

Écrire et éditorialiser ses recherches avec Stylo et le Crieur

Résumé

Dans cet atelier, nous nous pencherons sur l'éditeur de texte en ligne sémantique et collaboratif Stylo, ainsi que sur le générateur de site de revue ou de blog le Crieur, qui prend en entrée des corpus structurés sur Stylo. Proposés par le Laboratoire de recherche sur les écritures numériques à l'Université de Montréal, ces logiciels libres entendent fournir des instruments adaptés aux activités d'écriture et de publication de la recherche en sciences humaines et sociales, en contrepoint des solutions de la Big Tech, tout en engageant leurs practiciens·nes à une maîtrise de leurs outils de travail. Après une présentation des principes théoriques qui orientent leur développement, nous les prendrons en main collectivement en se répartissant en groupes. Sur la fin, nous discuterons des développement potentiels pour ces outils.

Intervenant·e·s

Victor Chaix, doctorant en Littérature et Humanités Numériques, Laboratoire de recherche sur les écritures numériques (Université de Montréal) et Chaire d'Excellence en Édition Numérique (Université de Rouen Normandie).

Avec l'appui de :

Alexia Schneider, doctorante en Littérature et Humanités Numériques au Laboratoire de recherche sur les écritures numériques (Université de Montréal)
Giulia Ferretti, doctorante en Littérature et Humanités Numériques au Laboratoire de recherche sur les écritures numériques (Université de Montréal)

Public visé

Intermédiaire / avancé

Durée

2 heures

Prérequis

Si possible, se créer un compte Stylo en amont. Voir la documentation de Stylo : https://stylo-doc.ecrituresnumeriques.ca/fr/fonctionnalites/creer-compte/

Idéalement, télécharger en amont le gestionnaire de paquets Python intitulé 'UV'. Les indications sont à ce lien : https://docs.astral.sh/uv/getting-started/installation/

Initiation à la Distant Viewing

Résumé

Cet atelier présentera des méthodes modernes pour travailler avec des collections d’images numériques. Nous débuterons avec des outils open source en ligne, faciles à utiliser, avant de passer à des approches reposant sur la programmation. Aucune expérience préalable n’est nécessaire. Tout le contenu de l’atelier sera librement accessible via votre navigateur.

Intervenant

Taylor Arnold (Université de Richmond) est professeur en sciences des données, spécialisé dans l’analyse de données visuelles et multimodales appliquées aux humanités numériques et computationnelles.

Public visé

Intermédiaire / avancé

Durée

3 heures

Prérequis

Aucun.

Pandore : boîte à outils pour les humanités numériques

Résumé

Cet atelier est consacré à Pandore, une boîte à outils dédiée aux humanités numériques, développée par l'équipe ObTIC (Sorbonne Université) pour faciliter l’analyse, l’exploration et le traitement de corpus de recherche.
Animé par deux ingénieurs et un chercheur, l'atelier proposera une présentation des fonctionnalités de Pandore ainsi que des démonstrations pratiques illustrant ses usages concrets dans des projets en sciences humaines et sociales.

Intervenant·e·s

Floriane Chiffoleau, post-doctorante à SU (ObTIC)
Alina Miasnikova, ingénieure d'étude à SU (ObTIC)
Motasem Alrahabi, ingénieur de recherche, SU (ObTIC)

Public visé

Débutant

Durée

3 heures

Prérequis

Un ordinateur et une connexion Internet.

Flux RSS | Vie privée | Accessibilité