DataLift - Projet ANR Contint (National Research Agency) - 2010-2013 - Mondeca

DataLift - Projet ANR Contint (National Research Agency) - 2010-2013

  • Le Datalift porte les données brutes structurées venant de plusieurs formats (bases de données, CSV, XML) vers des données sémantiques interconnectées sur le Web de données .

    Le but du projet est de développer une plateforme pour publier et interconnecter des jeux de données sur le web de données. Datalift à la fois publie des jeux de données provenant d'un réseau de partenaires et propose un ensemble d'outils facilitant le processus de publication de jeux de données : sélection des ontologies pouvant décrire les données, conversion des données en RDF en rapport avec la ou les ontologies selectionnées, publication sur le web de données, interconnexion des données avec d'autres.

Un catalyseur pour le web de données

Partenaires :

Fournisseurs de données

Autres partenaires

Résultats attendus :

Datalift va construire un catalogue d'ontologies facilitant la tâche des fournisseurs de données consistant à sélectionner les ontologies nécessaires pour décrire leurs données. Ce catalogue inclura des fonctionnalités de recherche de concept, qualité d'ontologie et similarité d'ontologies. Datalift va de plus fournir une suite d'outils de conversion des données qui permettra la conversion semi-automatique des données brutes en RDF. Cette suite d'outils intègrera intelligemment plusieurs outils de conversion et sera capable de sélectionner automatiquement l'outil correspondant à la source de données à convertir. Datalift va aussi développer une suite d'outils pour l'interconnexion automatique de jeux de données. Utilisant ces outils, une expérimentation d'interconnexion de jeux de données à grande échelle sera conduite sur les données de la plateforme et d'autres jeux de données. Une infrastructure pour stocker et accéder aux données sera mise en place, incluant une suite d'outils permettant de naviguer dans les données et d'interagir avec elles. En étendant les formalismes de description et de requête du web sémantique pour la gestion des licences et des informations de provenance, nous nous attendons à surmonter l'un des principaux obstacles pour que les fournisseurs de données publient leurs données. Avoir des informations sur les licenses leur permettra de garder les droits sur leurs données.

> site web DataLift > Tous les projets