Conception et développement d'une plateforme d'édition de diagrammes astronomiques. H/F
Portail > Offres > Offre UMR8630-MATHUS-016 – Conception et développement d’une plateforme d’édition de diagrammes astronomiques. H/F
Conception et développement d’une plateforme d’édition de diagrammes astronomiques. H/F
Cette offre est disponible dans les langues suivantes : Date Limite Candidature : mercredi 28 décembre 2022
Assurez-vous que votre profil candidat soit correctement renseigné avant de postuler. Les informations de votre profil complètent celles associées à chaque candidature.Afin d’augmenter votre visibilité sur notre Portail Emploi et ainsi permettre aux recruteurs de consulter votre profil candidat, vous avez la possibilité de déposer votre CV dans notre CVThèque en un clic !
Informations générales
Référence : UMR8630-MATHUS-016Lieu de travail : PARIS 14 Date de publication : mercredi 7 décembre 2022 Type de contrat : CDD Technique/Administratif Durée du contrat : 12 moisDate d’embauche prévue : 1 février 2023Quotité de travail : Temps complet Rémunération : entre 2280 et 2897 Brut mensuels selon expérience Niveau d’études souhaité : Bac+3 Expérience souhaitée : 1 à 4 années
Missions
En lien avec les chercheurs du projet DISHAS/Diagram-exploration, l’ingénieur⋅e d’étude aura pour mission de concevoir une chaîne de traitement pour l’extraction, l’annotation et l’analyse de diagrammes astronomiques provenant de manuscrits médiévaux.La chaîne de traitement devra intégrer des algorithmes de vision artificielle pour le repérage, la segmentation et le clustering des diagrammes, développés dans le cadre de divers autres projets de recherche, notamment le projet VHS, ainsi que des fonctionnalités spécifiques à l’analyse de diagramme..Intégré à l’équipe d’ingénierie de l’Observatoire de Paris et en partenariat avec l’équipe Imagine, ingénieur⋅e développera des outils qui permettront aux chercheurs de prendre en main ces algorithmes et constituer in fine une plateforme de mise à disposition, d’édition et d’analyse de diagrammes astronomiques.
Activités
Dans le détail, les tâches effectuées durant le contrat comprendront les éléments suivants :Définition du cahier des chargesLes outils à développer comprennent une base de données et des outils de traitement de diagrammes. Leurs architectures s’appuiera sur les choix effectués pour la plateforme d’édition de tables déjà existante (dishas.obspm.fr) développée dans le cadre du projet DISHAS :Discussion avec les chercheurs du projet pour établir une liste d’exigences concernant les outils à développerÉtablissement d’un cahier des charges fonctionnel pour la chaîne de traitement et plateformeParticipation à la délimitation du corpus de sources à considérer et définition d’un vocabulaire opérationnel pour leur manipulation informatiséeConstitution d’un modèle de donnée pour accueillir le corpus de diagrammes à traiter ainsi que des métadonnées descriptivesRéflexion concernant les formats de sortie des algorithmes afin de produire des données en accord avec les principes FAIRRédaction de documentation à destination des chercheurs et des ingénieursConception et amélioration de la pipeline de traitement des sourcesEn s’appuyant sur l’application d’extraction et d’annotation automatique développée dans le projet VHS :Établissement d’une chaîne de traitement prenant en entrée des scans de manuscrits dans une variété de format (jpg, pdf, IIIF, etc.) > extrayant les diagrammes > créant des clusters de diagrammes “similaires” > labellisant automatiquement les diagrammesInteropérabilité des formats d’entrée et de sortie avec l’environnement de travail des chercheurs, notamment à l’aide de formats ouverts et documentésTests de la pipelineRédaction de documentation et publication du code dans un repository ouvertCréation d’une application pour l’exploration et l’analyse de diagrammes astronomiquesBenchmark des outils existants pour l’affichage et l’annotation d’imageDéveloppement d’un prototype d’application web à partir de l’application VHS intégrant la chaîne de traitement constituéeCréation de fonctionnalités pour l’exploration et la modification manuelle des clusters et labels constitués automatiquementDialogue avec les chercheurs de l’équipe pour la création de fonctionnalités ergonomiques adaptées à leurs besoins et pratiques de rechercheRédaction de documentation et publication du code dans un repository ouvertAmélioration des modèles de traitement automatique des sourcesA partir des diagrammes annotés à la main, constituer plusieurs corpus de ground truths pouvant permettre l’ajustement des modèles génériques utilisésÉvaluer la performance du modèle à l’aide de baselines / comparaisonsEn partenariat avec des projet tels que SegmOnto ou HTR-United, participer à la mise à disposition de données d’entraînement ouvertes et de bonnes pratiques vis-à-vis de l’utilisation du Machine Learning dans des projets liés aux Humanités
Compétences
Compétences opérationnellesDéveloppement web (Flask, Django, javascript)Développement en PythonPratiques des bases de données et établissement de modèles conceptuelsCréation d’application mettant en communication plusieurs APIUtilisation de GitSouhaitable : pratique de la librairie PytorchSouhaitable : notions en vision artificielleVeille sur les projets en Humanités numériques aux objectifs proches et sur les développements en ML en lien avec la missionCompétences humainesCapacité au travail en équipe, collaboration avec plusieurs équipes de chercheurs au sein de l’Observatoire et du laboratoire ImagineCollaboration avec les chercheurs et compréhension des problématiques et besoins spécifiques à leur travail de rechercheAnglais, lu écrit
Contexte de travail
Le projet DISHAS/Diagram-exploration porte sur la collection, l’analyse et le traitement de diagrammes astronomiques : il se base sur la constitution d’un corpus iconographique original de diagrammes provenant de sources variées, connectées à l’échelle afro-eurasienne. Il vise à développer des outils numériques innovants permettant une analyse inédite de ces sources. Dans l’histoire de l’astronomie, cela établira une nouvelle norme pour l’édition critique nativement numérique des diagrammes, pour l’étude de leurs dimensions matérielles et épistémologiques, et produira une base solide pour une étude approfondie des circulations de connaissances liés aux diagrammes. Dans le domaine de la vision par ordinateur, le projet ouvrira la voie à une nouvelle génération de méthodes d’analyse d’images et de vectorisation non supervisées, qui s’appuieront sur les récentes avancées de l’apprentissage profond.Le projet est hébergé au sein de l’équipe d’histoire de l’astronomie du laboratoire SYRTE-UMR8630. Ce laboratoire est une unité mixte du CNRS, de l’Observatoire de Paris et de l’Université Pierre et Marie Curie, implantée sur le site parisien de l’Observatoire. L’unité compte 95 personnes, dont 57 permanents incluant 13 ITA CNRS. L’unité mène des recherches et assure des services scientifiques dans les domaines de l’astronomie fondamentale, la métrologie du temps et des fréquences et de l’histoire de l’astronomie. Les services fournis par le laboratoire sont utilisés par l’État (le CNES, la Marine, etc), l’industrie, la recherche, le grand public en France et à l’étranger.Le groupe de recherche IMAGINE de l’Ecole des Ponts ParisTech (ENPC). Il est situé en région parisienne. Il fait partie du laboratoire d’informatique Gaspard-Monge (LIGM), qui fait lui-même partie du labex Bézout de l’Université Paris-Est (UPE). Les chercheurs du groupe IMAGINE travaillent principalement sur la vision artificielle (en particulier la reconstruction 3D et la reconnaissance de scènes), l’apprentissage automatique (notamment l’apprentissage profond), et l’optimisation (méthodes exactes et approximatives).L’ingénieur pourra s’appuyer sur un corpus numérisé de plus de 1500 manuscrits astronomiques arabe et latin construit par les projets partenaires d’ALFA, soit une banque de plusieurs dizaines de milliers de pages. L’expertise des historiens et des ingénieurs en humanités numériques du projet ALFA sera un support essentiel pour l’analyse de ce jeu de données. Il pourra également bénéficier du savoir-faire des chercheurs de l’équipe IMAGINE, en vision artificielle et apprentissage profond sur des sources historiques avec déjà plusieurs projets réalisés dans ce domaine. En particulier, il aura accès à une base de code permettant de générer des données synthétiques et d’apprendre un réseau permettant de segmenter les illustrations et le texte. Il sera également possible à l’ingénieur d’interagir avec l’équipe du projet ANR VHS, qui s’intéresse à l’évolution et la transformation des images dans les corpus scientifiques illustrés du Moyen- ge et de la période moderne, notamment sur le développement d’une interface pour effectuer des recherches automatiques à grande échelle adaptées à ces corpus, basées sur la détection de similarités iconographiques.
RAS
On en parle sur Twitter !
EmploiCNRS @EmploiCNRS · Suivre Conception et développement d’une plateforme d’édition de diagrammes astronomiques. H/F (PARIS 14) https:// emploi.cnrs.fr/Offres/CDD/UMR 8630-MATHUS-016/Default.aspx … #Emploi #OffreEmploi #Recrutement 11:16 AM · 7 déc. 2022 Répondre Copier le lien Lire plus sur Twitter