Présentation des travaux des projets lauréats de l’Appel à projet conjoint BnF DataLab/Huma-Num (9/12)

Bibliotheques Paris

Bibliotheques / Bibliotheques Paris 538 Views comments

A l’été 2021, le BnF DataLab et l’IR Huma-Num lançaient leur premier appel à projet conjoint afin d’accueillir et de financer pendant un an des projets innovants autour des collections numériques de la BnF (collections numérisées ou nativement numériques). Fort de son succès, cet appel à projet a permis l’accueil de 5 projets lauréats.

Au moment de clore cette première année check, il nous est apparu essential d’inviter les membres des équipes de recherche à présenter leurs travaux, mais aussi leurs méthodologies de recherche, les succès mais aussi parfois les difficultés qu’ils auraient pu rencontrer au cours de cette année.
Vous êtes donc cordialement invité/es à venir écouter, partager et échanger avec les équipes de la BnF et les projets lauréats, pour un premier bilan de ce dispositif d’accueil de chercheurs au BnF DataLab.

DataLab

AUREJ (Accès Unifié aux REssources de la Jouabilité)

Porté par Fabrice Pirolli, Le Mans Université / IUT de Laval

AUREJ porte sur les modalités d’exploitation des collections qui environnent le jeu vidéo, dont la consultation sur un seul et même environnement soulève des contraintes methods encore difficiles à surmonter. L’équipe évoquera quelques unes des solutions expérimentée pour permettre un accès à ces ressources disparates.

GallicaEnv

Porté conjointement par Guillaume Sapriel (Université de Paris-Saclay/Versailles Saint-Quentin-en-Yvelines) et Grégory Quenet (Université de Paris-Saclay/Versailles Saint-Quentin-en-Yvelines)

Le projet GallicaEnv a pour objectif d’étudier, à travers les collections de Gallica, l’émergence et la viralité de la notion d’environnement sur une chronologie longue. La relative nouveauté de la notion dans son acception actuelle rend difficile la structure de corpus. A partir d’ouvrage de référence (dictionnaires textes de loi, encyclopédies and so on.), les équipes ont pu définir une méthodologie et construire des outils de catégorisation des savoirs qui seront versés dans la boîte à outils du BnF DataLab.&

Buzz-F

Porté par Valérie Schafer (Université du Luxembourg, C²DH (Luxembourg Centre for Modern and Digital History) ; avec la participation de Fred Pailler

Se fondant sur les archives de l’web de la BnF, le projet Buzz-F avait pour ambition d’explorer quelques formes de viralité numériques depuis les années 1990 à nos jours. Prenant en particulier pour objet l’analyse des circulations des contenus vidéo que sont le Lip Dub ou Harlem Shake (début des années 2010), le projet a cherché à restituer la circulation des contenus et la réception de ces phénomènes internationaux dans le cadre d’un espace net national. Cette présentation sera l’event de rappeler dans un premier temps les enjeux scientifiques et méthodologiques de l’analyse de la viralité dans les archives du net, puis les méthodologies nouvelles expérimentées conjointement avec les équipes BnF et l’IR Huma-Num pour interroger l’archive net, créer un corpus, l’évaluer et le documenter. Enfin, un rapide bilan des activités de dissémination et du dialogue engagé à l’international avec les communautés scientifiques intéressées sera présenté.

AGODA (Analyse sémantique et graphes relationnels pour l’ouverture et l’étude des débats à l’Assemblée nationale)

Porté conjointement par Pierre Vernus, Université Lumière Lyon 2 et Marie Puren, Epitech Paris

L’objectif du projet AGODA était de proposer par le biais d’une plateforme de consultation et d’exploration des débats parlementaires de la Chambre des députés, sur la période 1881-1940. La complexité des fonds, les contraintes autour de la numérisation et de l’océrisation ont amené l’équipe à remettre en cause la méthodologie initialement prévue et à trouver des options de contournement.

Gallic(orpor)a

Porté conjointement par Benoît Sagot, INRIA ; Simon Gabay, Université de Genève ; Ariane Pinche, École nationale des chartes

Le projet Gallic(orpor)a proposait de mettre en place une chaîne de traitement des paperwork anciens de Gallica, des premiers manuscrits aux imprimés& révolutionnaires, afin de permettre aux chercheurs d’accéder non seulement aux extractions de textes (OCR, HTR) et aux pictures, mais également à des& données enrichies. Le corpus de départ, d’une centaine de document mêlant manuscrits du 15e siècle, incunables et imprimés, a permis de rédiger des scripts d’entraînement et de produire des jeux de données& et des modèles d’apprentissage machine, à partir desquels le projet avait l’ambition de proposer une utilisation check sur 500 paperwork issus du catalogue de Gallica.

Programme

  • 9h30 : Accueil et mot de bienvenue
  • 10h : Introduction
    Marie Carlin, coordinatrice du BnF DataLab
  • Modération
    Arnaud Laborderie, chef de projet Gallica
  • 10h15 : Présentation du projet AGODA (Analyse sémantique et graphes relationnels pour l’ouverture et l’étude des débats à l’Assemblée nationale).
    Pierre Vernus, maître de conférences en histoire contemporaine, université Lumière Lyon 2
    Marie Puren, enseignante-chercheuse en histoire et humanités numériques, Epitech Paris
  • 10h45 : Questions
  • 10h55 : Présentation du projet GallicaEnv
    Guillaume Sapriel, maître de conférences, université de Paris-Saclay/Versailles Saint-Quentin-en-Yvelines (UVSQ)
    Grégory Quenet, professeur des universités, université de Paris-Saclay/Versailles Saint-Quentin-en-Yvelines (UVSQ)
  • 11h30 : Questions
  • 11h35 : Présentation du projet Gallic(orpor)a
    Ariane Pinche, chargée de recherche CNRS
    Kelly Christensen, ingénieure de recherche, médialab de Sciences Po Paris
    Simon Gabay, maître assistant, université de Genève
  • 12h05 : Questions et échanges avec la salle
  • 12h30-14h : pause déjeuner
  • 14h : Introduction
    Vladimir Tybin, chef de service du Dépôt légal numérique, département du Dépôt légal
  • Modération
    David Benoist, adjoint du chef du service Multimédia, département Son, vidéo, multimédia
  • 14h15 : Présentation du projet BuzzF
    Frédéric Pailler, chercheur post-doctoral au C²DH (Luxembourg Centre for Modern and Digital Historical past), université du Luxembourg
    Alexandre Faye, chargé de collections numériques, responsable projets de recherche et motion internationale, département du Dépôt légal
  • 14h45 : Questions
  • 14h55 : Présentation du projet AUREJ (Accès Unifié aux REssources de la Jouabilité)
    Fabrice Pirolli, maître de conférences HDR en Sciences de l’Info et de la Communication, Le Mans Université / IUT de Laval
    Laurent Collet, professeur des universités en Sciences de l’info et de la communication, université Paul-Valéry Montpellier three
    Raphaëlle Crétin, maître de conférences en Sciences de l’Info et de la Communication, Le Mans Université
    Valérie Renault, maître de conférences en informatique, Le Mans Université
  • 15h30 : Questions et échanges avec la salle
  • 16h : Conclusion
    Laurence Tarin, directrice du département de la Découverte des collections et de l’accompagnement à la recherche

Informations pratiques

Contact

  • BnF Knowledge Lab : datalab[at]bnf[point]fr

Comments