|
|
|
Programme > AteliersLes deux journées qui précèdent la conférence Humanistica 2026 (lundi 18 et mardi 19 mai) sont consacrées à des ateliers. Chaque atelier, d’une demi-journée, permet d’entrer au cœur des méthodes, des outils et des pratiques des humanités numériques, dans un format plus interactif et plus expérimental que les sessions de communication. Ils s’adressent avant tout aux personnes débutantes, mais ils peuvent également intéresser des participant·e·s disposant de quelques connaissances en code et souhaitant consolider leurs bases. Les inscriptions aux ateliers ouvriront en même temps que celles du colloque. Chaque atelier comporte un nombre minimal et un nombre maximal de participant·e·s : si le seuil minimal n’est pas atteint, l’atelier n’aura pas lieu. À l’inverse, aucune place supplémentaire ne pourra être ajoutée une fois l’atelier complet : l’attribution des places se fera selon le principe « premier arrivé, premier inscrit ». A noter : il sera possible de s'inscrire à plusieurs ateliers (2 par jour). L'inscription est d'abord ouverte aux participant·e·s du colloque. Dans un deuxième temps, il sera également possible de suivre les ateliers sans être inscrit·e à la conférence (l'inscription aux ateliers sera séparée). Pour tous les ateliers, chaque participant·e devra disposer d’un ordinateur. Vous trouverez la liste des ateliers ci-dessous, par ordre alphabétique de titre. Corpusense : transformez vos documents sériels en données structuréesDéveloppé dans le cadre du projet Mezanno, financé par le plan quadriennal de la BnF, Corpusense (https://mezanno.xyz/corpusense/) est une interface en ligne (sans installation requise), ouverte et conçue pour répondre de la manière la plus simple possible à la question suivante : comment transformer des sources sérielles (annuaires, dictionnaires, index, etc.) en données structurées (tableaux, graphes de connaissances) ?
Cet atelier propose de prendre en main Corpusense en deux temps. D’abord, une présentation générale de l’outil sera faite, illustrée par des exemples concrets. Ensuite, les participants seront invités à travailler sur des données de leur choix, avec l’assistance des formateurs. Intervenants
Public viséDébutant Durée3 heures PrérequisApporter un ordinateur portable, de préférence avec une souris. De la source au graphe RDF et aux données liées ouvertes. Le workflow LOD4HSS pour la modélisation, la collecte et l’analyse de données de recherche en SHSRésuméL'objectif de l'atelier est de proposer aux participant·e·s la prise en main d’outils et de méthodologies pour la production de données interopérables et réutilisables dans le contexte de la recherche en Sciences Humaines et Sociales, ceci en mobilisant les méthodes et les outils - gratuits et open source - de l’écosystème proposé par le projet Linked Open Data for Humanities and Social Sciences (LOD4HSS). Après une rapide présentation de la vision du projet, de l'environnement technique mobilisé et des notions de base nécessaires pour suivre l'atelier, une prise en main de cet environnement sera proposée. Celle-ci permettra de s'approprier les différentes étapes du processus de travail : configuration d'un triple store, définition du modèle dans l'application de gestion des ontologies OntoMe, importation de données dans le triple store, édition, enrichissement et exploration des données via l'application Logre (Local Graph Editor). Cet atelier s'adresse aux chercheurs, aux doctorants et aux ingénieurs. Intervenant·e·s
Public viséAvancé / intermédiaire Durée3 heures Prérequis
De l'image à la TEI : bonnes pratiques pour les textes en français du Moyen Âge à aujourd'hui RésuméComment OCRiser un texte ? Comment accélérer la conversion des données en TEI? De quels outils a-t-on besoin pour explorer les données produites ? Depuis plusieurs années, un groupe de chercheur.se.s s'est engagé dans la rédaction d'un manuel de travail afin de proposer des solutions communes et de régler les multiples problèmes que posent la documentation. Cet atelier propose de présenter pour la première fois des propositions concrètes, qui concernent tous les types de documents (manuscrits, imprimés, etc.) pour tous les siècles du français. Il vise aussi à créer un espace d’échange autour des choix méthodologiques, à confronter les retours d’expérience et à favoriser la discussion entre praticiens, en fonction des types de corpus et des objectifs de recherche. Quatre principales tâches informatiques seront abordées : l'analyse de mise en page, la reconnaissance automatique de l’écriture, la normalisation du texte et son annotation linguistique. Intervenant·e·s
Public viséDébutant Durée2 heures PrérequisUne première expérience avec la constitution ou la manipulation d'un corpus numérique est recommandée (mais n'est pas obligatoire). Du prétraitement aux LLM : TAL pour textes classiquesRésuméL'atelier a pour but de familiariser les chercheurs en lettres classiques à l'usage des techniques modernes adaptées à l'étude des langues anciennes. Les notebooks Python proposés (qui ne nécessiteront pas d'installation) seront utilisés pour les tâches de TAL (lemmatisation, postagging, dependency), vectorisation sémantique simple, et autres tâches attenantes aux capacités actuelles des transformers (NER, classification, analyse de réseau, et autres). Intervenante
Public viséDébutant Durée3 heures PrérequisPas de prérequis obligatoire ; un peu de Python peut être utile. Écrire et éditorialiser ses recherches avec Stylo et le CrieurRésuméDans cet atelier, nous nous pencherons sur l'éditeur de texte en ligne sémantique et collaboratif Stylo, ainsi que sur le générateur de site de revue ou de blog le Crieur, qui prend en entrée des corpus structurés sur Stylo. Proposés par le Laboratoire de recherche sur les écritures numériques à l'Université de Montréal, ces logiciels libres entendent fournir des instruments adaptés aux activités d'écriture et de publication de la recherche en sciences humaines et sociales, en contrepoint des solutions de la Big Tech, tout en engageant leurs practiciens·nes à une maîtrise de leurs outils de travail. Après une présentation des principes théoriques qui orientent leur développement, nous les prendrons en main collectivement en se répartissant en groupes. Sur la fin, nous discuterons des développement potentiels pour ces outils. Intervenant·e·s
Public viséIntermédiaire / avancé Durée2 heures PrérequisSi possible, se créer un compte Stylo en amont. Voir la documentation de Stylo : https://stylo-doc.ecrituresnumeriques.ca/fr/fonctionnalites/creer-compte/ Initiation au Distant ViewingRésuméCet atelier présentera des méthodes modernes pour travailler avec des collections d’images numériques. Nous débuterons avec des outils open source en ligne, faciles à utiliser, avant de passer à des approches reposant sur la programmation. Aucune expérience préalable n’est nécessaire. Tout le contenu de l’atelier sera librement accessible via votre navigateur. Intervenant
Public viséIntermédiaire / avancé Durée3 heures PrérequisAucun. Introduction à la Récupération Augmentée par GénérationLe but est d'introduire les principes de base de la Récupération Augmentée par Génération (RAG) appliquant à un corpus de documents textuels.
Intervenants
Public viséAvancé / intermédiaire Durée3 heures PrérequisMaîtrise basique de Python. Modéliser les objets culturels littéraires leurs métadonnées avec une ontologie. Introduction à l’ontologie CAO_CRM (Atelier AMIS)et atelier propose une introduction à l'ontologie CAO-CRM, une ontologie conçue par le Consortium-HN ARIANE pour décrire et structurer des corpus textuels. Qu’est-ce que CAO-CRM ?
Pourquoi une ontologie ?
Un lien direct avec les outils : le robot AMIS L’atelier sera organisé en deux temps complémentaires : 1. Partie théorique L’introduction permettra de découvrir les principes de base d’une ontologie, ainsi que le modèle CAO_CRM : ses objectifs, sa structure et la manière dont il organise les informations. Des exemples concrets appliqués à des corpus textuels illustreront ces notions. 2. Pratique pratique : atelier en groupes Les participants travailleront en petits groupes à partir d’un cas d’étude et apprendront à identifier différentes entités (œuvre, édition, fichier…), à en décrire les caractéristiques et à établir des relations entre elles à l’aide du modèle. Selon les modalités retenues, cette activité pourra être organisée à l’aide de supports papier (cartes de modélisation) ou via une interface interactive permettant de manipuler visuellement les concepts. Intervenants
Public viséL'atelier est ouvert à toutes et tous :
Durée3 heures PrérequisAucune compétence technique préalable n’est requise. Il faut apporter un ordinateur personnel Pandore : boîte à outils pour les humanités numériques RésuméCet atelier est consacré à Pandore, une boîte à outils dédiée aux humanités numériques, développée par l'équipe ObTIC (Sorbonne Université) pour faciliter l’analyse, l’exploration et le traitement de corpus de recherche. Intervenant·e·s
Public viséDébutant Durée3 heures PrérequisUn ordinateur et une connexion Internet. |
Chargement...