Equipe
-
Dr. Florence Amardeilh - Directrice R&D
Université Paris X Nanterre – MoDyCo
Thèse : Web Sémantique et Informatique Linguistique : propositions méthodologiques et applications logicielles.
Cette thèse aborde les problématiques liées à l’annotation sémantique et au peuplement d’ontologies dans le cadre défini par le Web Sémantique. L’idée proposée ici est de combiner les outils d’extraction d’information avec les outils de représentation des connaissances du Web Sémantique, tel ITM. Mais il existe actuellement un fossé entre les formats de représentation utilisés par chacun de ces outils. Cette thèse propose de combler ce fossé en concevant un médiateur capable de :
- Constituer semi-automatiquement des vocabulaires / terminologies multilingues d’un domaine à partir d’un corpus documentaire représentatif
- Alimenter semi-automatiquement des bases de connaissances avec les entités nommées et relations sémantiques extraites des documents textuels
- Annoter sémantiquement ces mêmes documents avec les concepts modélisés dans l’ontologie
Mots-clefs : Web Sémantique, Informatique Linguistique, Extraction d’Information, Représentation et Acquisition de Connaissances, Ontologies, Annotation Sémantique.
-
Bernard Vatant - Senior Consultant
Expertise : Ingénierie des connaissances, Langages et technologies du Web Sémantique, Modélisation Ontologies
Expérience : Professeur de mathématiques, diplômé de l'ENSET (1975)
Activités de standardisation
W3C Semantic Web Activity
- WebOnt (OWL) Working Group (2002-2003)
- Semantic Web Best Practices and Deployment Group (2004-2005)
- Collaboration à SKOS (depuis 2005)
ISO Topic Maps
- Topic Maps XTM working group (2000-2001)
- OASIS Topic Maps Published Subjects Technical Committee (Chair 2001-2003)
Page personnelle : univers immedia http://perso.orange.fr/universimmedia/index.htm
Blogs : Leçons de Choses http://mondeca.wordpress.com/
The wheel and the hub http://universimmedia.blogspot.com/
-
Dr Hondjack Dehainsala - Ingénieur R&D
Université de Poitiers - LISI-ENSMA
La problématique de ma thèse s'inscrit dans la difficulté d'intégration des sources de données. Cette difficulté est essentiellement due à l'hétérogénéité des sources de données portant sur un domaine. Cette hétérogénéité étant elle-même causée par des besoins applicatifs légèrement différents lors de la conception de ces sources.
Notre travail de thèse a consisté à définir une plate-forme idéale pour une intégration automatique des sources de données. Notre proposition est basée sur l'utilisation des ontologies. Les ontologies offrent la possibilité d'expliciter et de partager une conceptualisation. D'ou l'intituler de notre sujet : ‘Une proposition d'un modèle d'architecture pour les bases de données à base ontologique : le modèle OntoDB'. Une BDBO est une base de données (BdD) qui permet de gérer à la fois les données et, associer à chaque données le concept ontologique qui en définit le sens et inversement.
L'originalité de notre approche par rapport aux autres existantes utilisant des ontologies est que celle-ci permet de :
- représenter explicitement le sens des données dans l' intérieur de la BdD ;
- préparer à priori les sources de données pour des intégrations futures ;
- partager (partiellement) les conceptualisations de différents domaines.
Nous avons donc proposé une architecture pour de BDBO nommée OntoDB. L'architecture OntoDB est caractérisée par le fait de représenter à la fois les ontologies, les données à base ontologique et le lien entre ontologies et données dans une unique base de données. Cette architecture a été définie et nous l'avons validé par un prototype sur le SGBD PostgreSQL. Le modèle d'ontologie que nous avons utilisée est de PLIB (Parts Library) défini par mon laboratoire d'acceuil LISI-ENSMA.
Mots-clefs : Base de données, Ontologies, données à base ontologique, PLIB, RDF Schema, OWL.
-
Olivier Carloni - Doctorant
Université de Montpellier - LIRMM, France
L’objectif de cette thèse est de doter le système d’acquisition et de gestion de connaissances ITM de Mondeca de capacités de raisonnements. Une des particularités du travail envisagé est de mettre en œuvre ces raisonnements par des opérations de théorie des graphes sur des représentations graphiques des connaissances. Ainsi le système envisagé permettra à terme :
(1) l’acquisition, l’importation et l’exportation de connaissances dans les formalismes standards de représentation et d’échange de connaissances
(2) la représentation, le stockage et la gestion des connaissances dans un formalisme graphique à base d’hypergraphes étiquetés (formalisme support à l’environnement ITM de Mondeca)
(3) l’exploitation automatique de ces connaissances à l’aide du formalisme des graphes conceptuels. .
-
Laurence Noel - Doctorante
Cette thèse vise à exploiter les connaissances issues d'applications basées sur des ontologies pour améliorer l'expérience utilisateur en termes d'accès à l'information et d'acquisition de nouveaux savoirs. Elle permettra à terme de définir des modes d’articulation permettant de passer d'un système de représentation formelle des connaissances à un système de représentation hypermédia de l'information, l'objectif étant de pouvoir répondre aux besoins utilisateurs suivants :
- explorer et découvrir l'espace informationnel (navigation transversale et recherche exploratoire)
- comparer les éléments de cet espace informationnel (hiérarchisation de l'information et contextualisation des données suivant quatre modes de présentation : spatial, temporel, thématique et iconique)
- sélectionner et réorganiser ces éléments en fonction de critères personnels (adaptation des interfaces et appropriation des données).
Mots-clefs : Interfaces Utilisateurs pour le Web sémantique, Hypermedia, design d'interaction, architecture de l'information, design d'information, expérience utilisateur
-
Pierre-Yves Vandenbussche - Doctorant
Université Paris 6 – SPIM INSERM
Thèse : Définition et mise en oeuvre d'un méta-modèle de référentiel et définition des ressources, services et interfaces nécessaires : application à la médecine.
Les ressources d'information d'un domaine sont disponibles sous différents systèmes d'organisation : ontologiques, terminologiques, thesauri... La définition d'un cadre plus formel de description de ces différentes ressources améliorerait :
- l'intéropérabilité avec ressources et applications, entrées/sorties d'une telle plateforme (APIs, web services, sérialisations...) en tant que serveur d'application ou de référentiel.
- le découpage du flux de connaissance en niveaux d'expression, selon la formalisation et la complexité du référentiel à utiliser ainsi que ses interactions avec d'autres ressources informationnelles. Ce découpage permettrait de fournir de meilleurs services, adaptés au niveau visé.
Mots-clefs : Web Sémantique, Meta-modèle de référentiel, Ontologies, Ressources d'information, Intéropérabilité, Niveaux d'expression.
