................................
Retrouvez Mondeca à Documation 2008 le 12 & 13 Mars
CARTO 2.0 : « Où en êtes-vous de la mise en scène de vos informations ? » coorganisé par Mondeca
Mondeca Contribute to the Orange Business Services Enterprise Briefing on the Semantic Web
Mondeca to Present Legal Information Management Success at Semantic Technology Conference
Mieux connaître nos solutions et la terminologie du Web Sémantique |
![]() |
![]() | |
|
Documentation, Terminologie... |
Centre de Ressources
Documentation produits et solutions..............................................................................
Le Blog Mondeca - Partager nos expériences et connaissances..............................................................................
Le blog de Mondeca Leçon de Choses permet aux équipes Mondeca de partager avec vous des réflexions et expériences et de tester de nouvelles idées. Toutes vos retours, remarques et suggestions sur les articles sont les bienvenus. L'équipe de rédaction. Terminologie Mondeca de «Assertion» à «Vocabulaire»..............................................................................
Petite leçon de choses en forme de glossaire Nomina si nescis, perit et cognitio rerum [1] Carl von Linné (1707-1778) On dit que c’est toujours le cordonnier le plus mal chaussé. C’est à contredire cet adage que ce petit document s’efforce. Attaché à la description et à l’organisation efficace du vocabulaire métier de ses clients, Mondeca se doit de donner l’exemple avec son propre vocabulaire, même s’il s’agit là d’un exercice périlleux à plus d’un titre. Mais c’est le propre de Mondeca de ne reculer devant aucun défi conceptuel ou technique. En effet notre métier concerne des domaines très proches des points de récursivité du langage, où des mots très abstraits et très génériques risquent de se renvoyer les uns aux autres sans vraiment clarifier leur sens. De plus, ces mêmes mots sont souvent employés depuis longtemps dans des sens différents, dans des contextes variés, par des métiers et communautés de pratiques diverses. Mais c’est une caractéristique singulière des technologies de l’information d’amener de plus en plus aujourd’hui les métiers à échanger et fédérer leurs données, un décloisonnement difficile mais salutaire, dont un point de passage obligé est la clarification des vocabulaires de chacun, et la définition de leur interopérabilité. Savoir qu’on parle de la même chose sous des noms divers, ou au contraire qu’on emploie le même nom pour des choses différentes, ou plus subtilement pour des conceptions différentes de la même chose … c’est pour paraphraser Confucius, le « véritable savoir » [2] dans un tel contexte. Par ailleurs la forme imposée du glossaire, qui doit rester raisonnablement compact, ne facilite pas la tâche. Définir ce qu’est une Chose, un Concept ou une Catégorie en quelques mots semble une gageure, quand tant de philosophes ont écrit tant de pages à ce sujet. Tout ceci amène à la conclusion évidente que ce glossaire ne prétend être ni exhaustif, ni normatif. Aux définitions académiques, on a préféré les définitions constatées par l’usage, en notant chaque fois que nécessaire l’imprécision ou l’ambiguïté de cet usage. Bernard Vatant – 22 décembre 2006 AssertionEn mathématiques et en logique, phrase utilisant un langage possédant une sémantique formelle, et dont la valeur de vérité (vrai ou faux) peut être déclarée ou déduite. Dans une base de connaissance, les assertions sont des axiomes ou des faits déduits de ces axiomes par des règles. AttributDonnée typée attribuée à une chose, autrement dit valeur d’une propriété de cette chose. Par abus de langage, attribut est parfois employé comme synonyme de propriété. AssociationEn Topic Maps, représentation formelle d’une relation entre deux ou plusieurs sujets. Les associations permettent de représenter des relations n-aires, c’est-à-dire de relier plusieurs sujets par une seule relation. Les associations sont utilisées dans ITM pour faciliter la navigation et les requêtes dans une base de connaissance. AutopostageDans un corpus documentaire indexé par un vocabulaire hiérarchique de type Thesaurus, accès automatique au contenu indexé par les termes spécifiques d’un terme donné (autopostage descendant) ou par les termes génériques (autopostage ascendant). AxiomeAssertion déclarée a priori comme vraie. On utilise le terme en logique de description pour désigner les assertions déclarées dans une ontologie, comme par exemple une relation de subsomption, ou une restriction concernant une propriété. Par extension, mais plus rarement, on emploie le terme pour désigner une assertion déclarée a priori vraie pour une instance, par exemple « Pierre est une Personne ». Par contre, si la même assertion est déduite par une règle, ce n’est pas un axiome. Base de connaissanceReprésentation, en général dans une base de données, d’un ensemble de faits décrits suivant une ontologie commune. Suivant les auteurs, une base de connaissance comprend ou non la description des concepts de l’ontologie, ou seulement les faits concernant les instances. Dans ITM, on appelle aussi base de connaissance un espace de travail contrôlé par une ontologie, elle-même définie dans un autre espace de travail. Dans un tel espace de travail, l’utilisateur a accès à l’ontologie en lecture seule, et il peut créer des instances et des faits conformes à cette ontologie, via des interfaces dynamiques contrôlées par cette ontologie. La notion de base de connaissance est aussi définie de façon formelle en logique de description. Catégorie
ChoseTerme générique désignant tout ce qui est susceptible d’être représenté, identifié ou décrit dans un système d’information, et en particulier dans une base de connaissance. Dans ce cadre, une chose est le référent d’un nom ou identifiant (signifiant) dont le signifié est un concept décrit formellement. ClasseReprésentation formelle d’un type dans une ontologie. Les classes sont organisées par des relations hiérarchiques de classe à sous-classe, ou axiomes de subsomption, définissant l’héritage des propriétés. Classe énuméréeSynonyme utilisé en OWL pour Table de référence. Une classe énumérée définit la liste, finie et contrôlée, de ses instances. ClassementApplication d’un système de classification à un ensemble de ressources. En particulier, affectation de ressources documentaires à des rubriques dans un plan de classement ou une taxonomie. Classification1. Dans son sens original en biologie, système de classes ou taxons organisant les espèces d’êtres vivants. On emploie aujourd’hui plutôt « Systématique » dans ce sens. 2. Dans le monde documentaire, terme souvent employé informellement pour indexation, taxonomie ou classement. Concept
Corpus documentaireEnsemble de ressources documentaires relatives à une base de connaissance. En particulier, ensemble des ressources susceptibles d’être indexées automatiquement. DescripteurConcept représenté dans un Thesaurus. Un descripteur est identifié par un terme préférentiel unique dans une langue donnée. On peut lui rattacher des synonymes, variantes, définitions, notes d’application … Dans le langage SKOS, un descripteur est représenté par une instance de la classe Concept. DescriptionLa description d’une chose est un ensemble d’informations la concernant. Les éléments classiques d’une description sont le type de la chose, ses propriétés et des relations avec d’autres choses. Une description est dite « non structurée » quand elle utilise un langage naturel ou une représentation multimédia (graphique, symbole, image …). Une description est dite « structurée » quand elle utilise un format standardisé et contrôlé d’information, comme un tableau ou un document XML. Le format de description est très souvent adapté à un type de chose. En RDF, une description d'une ressource est un ensemble de triplets dont cette ressource est le sujet. Document
Donnée
Entité
Espace de noms
Espace de travailNotion spécifique à Mondeca ITM. Un espace de travail définit l’accès des utilisateurs à une base de connaissance ou à une ontologie. FaitAssertion concernant une ou plusieurs instances dans une base de connaissance. Un fait peut être déclaré explicitement comme un axiome, ou déduit d’autres faits par des règles. GlossaireVocabulaire technique relatif à un domaine ou un métier, présenté en général selon l’ordre alphabétique, avec la définition de chaque terme. GrammaireEnsemble de règles syntaxiques décrivant la façon dont les assertions doivent être formulées pour avoir du sens dans un langage formel. HéritageUne hiérarchie supporte l’héritage si une caractéristique déclarée pour un concept dans la hiérarchie s’applique à tous les descendants de ce concept. Exemples : Héritage des propriétés d’une classe à toutes ses sous-classes :
Indexation par autopostage dans un thesaurus. HiérarchieOrganisation de concepts suivant une relation « parent-enfant » ou « hyperonyme-hyponyme ». Les hiérarchies les plus courantes dans les bases de connaissance sont :
Les hiérarchies les plus utilisées sont des arbres, où chaque concept a au maximum un parent. Dans le cas où un concept peut avoir plusieurs parents, on parle de multi-hiérarchie. HomonymieSituation dans laquelle des concepts distincts sont désignés par le même nom. Cette situation empêche l’utilisation du nom comme identifiant. Un vocabulaire où l’homonymie est interdite définit un espace de noms. IdentifiantPropriété dont la valeur permet d’identifier de façon unique une ressource. Dans les technologies du Web sémantique, les identifiants privilégiés sont les URI. IdentificationProcessus permettant de reconnaître de façon unique une chose à partir d’une représentation ou d’une description. Dans les bases de connaissance, l’identification repose sur l’utilisation de propriétés identifiantes ou de règles d’identification. IndexListe structurée de sujets indexant un corpus documentaire, avec les renvois aux éléments de ce corpus. Dans les publications papier, ces éléments peuvent être des références de documents complets (index d’une bibliothèque), ou des sections de documents (index d’un document particulier). Un index peut être une simple liste alphabétique de termes, ou présenter une structure calquée sur celle du vocabulaire dont il est extrait, par exemple une structure hiérarchique. IndexationRattachement de ressources documentaires à des sujets définis dans un vocabulaire. L’indexation peut être effectuée manuellement par des documentalistes, ou par des outils automatiques appliquant des règles d’indexation. IndividuInstance d’une classe dans le langage OWL. Inférence
InstanceIndividu rattaché à une classe. Par exemple « Pierre est une Personne » se traduit formellement par : L’individu « Pierre » est une instance de la classe «Personne ». Le rattachement d’instances à des classes constitue le peuplement d’une base de connaissance. Langage formelPar opposition au langage naturel, un langage formel utilise une grammaire formelle qui définit les expressions bien formées dans ce langage. Un langage formel peut posséder ou non une sémantique formelle. Logique de descriptionType de logique spécialement destinée à la représentation des bases de connaissance, pour lesquelles elle permet de définir une sémantique formelle, supportant des tâches de raisonnement. La logique de description est un des fondements théoriques du langage OWL. MétadonnéeDonnée typée attachée à une ressource, et en particulier à une ressource documentaire. Dans une démarche de représentation des connaissances, métadonnée est pratiquement synonyme de propriété. MéronymieOrganisation hiérarchique des parties d’un tout, par exemple la subdivision administrative d’un territoire ou d’une entreprise, ou la décomposition d’un ouvrage en chapitres et sections. Nom
Objet
OntologieEnsemble structuré de classes, propriétés et axiomes utilisé pour organiser une base de connaissance. Suivant les auteurs, la définition peut s’étendre aux instances et aux faits, ou seulement aux instances des tables de référence. OWLStandard W3C (Février 2004). Langage de la famille RDF permettant la description d’ontologies. Utilisé pour la représentation externe des ontologies utilisées dans Mondeca ITM. PeuplementCréation d’instances dans une base de connaissance. Le peuplement peut être effectué par des éditeurs humains via des interfaces dédiées (comme celle de ITM), ou la plupart du temps par une migration de base de données existantes. Plan de classementType spécifique de taxonomie, en général utilisé pour les ressources documentaires ayant un type de sujet particulier. Par exemple un « plan de classement Personne » définira des rubriques standard pour le classement des documents concernant une personne donnée, comme « Vie Publique » « Vie privée » « Bibliographie ». PropriétéUne propriété est un concept permettant la description des choses par des assertions dont la chose est le sujet. En particulier en RDF, une propriété est le deuxième élément d’un triplet qui représente une assertion. Le triplet (Bernard, employeur, Mondeca) attribue la valeur « Mondeca » à la propriété « employeur » pour le sujet « Bernard ». Par abus de langage, la valeur attribuée à une propriété.
Propriété identifianteUne propriété est dite identifiante si sa valeur est utilisée pour déterminer si deux choses sont identiques. Si une seule propriété suffit, on parle simplement d’identifiant. Dans le cas général, l’identification nécessite l’égalité de plusieurs propriétés. Par exemple « nom », « prénom », « date de naissance » et « lieu de naissance » forment un ensemble de propriétés identifiantes pour une personne. Published Subject IndicatorAbréviation : PSI En Topic Maps, URI utilisée pour identifier un sujet, et permettant d’accéder à une ressource documentaire publiée contenant une description explicite du sujet pour des utilisateurs humains. Dans le jargon Mondeca, PSI est utilisé par abus de langage pour désigner une URI identifiant un topic, même si cette URI ne correspond à aucune ressource publiée. RaisonnementDans le cadre d’une base de connaissance, les outils de raisonnement utilisent la sémantique formelle pour exécuter des tâches comme le contrôle de cohérence, la classification automatique, l’identification d’instances ou la déduction de faits.
RDF« Resource Description Framework » est un langage destiné au départ à la description formelle des métadonnées des ressources documentaires. Il a évolué pour devenir un langage générique pour la représentation de bases de connaissance interopérables sur le Web, et sert de base à des langages plus spécifiques comme OWL ou SKOS. RéférentEn linguistique, le référent désigne la chose représentée par un signe, et en particulier par un nom. RègleUne règle permet à un système de déclencher une action de raisonnement sur le contenu d’une base de connaissance. La différence entre axiome et règle est fonctionnelle. Les axiomes sont purement statiques et déclaratifs, les règles déclenchent des actions. Une règle peut être la forme dynamique d’un axiome. Exemples
Règle d’identificationRègle permettant de décider si deux choses sont identiques ou non. Les règles d’identification les plus courantes utilisent des propriétés identifiantes. Règle de classification
Les règles de classification peuvent être exprimées en langage naturel et appliquées par des utilisateurs humains, ou exprimées en langage formel pour servir de base à la classification automatique. RessourceDe l’anglais « Resource », par extension de « Web Resource ». Chose identifiée, en particulier par une URI, et décrite dans une base de connaissance. Le mot « Resource » est utilisé dans les acronymes URI et RDF. Ressource documentaireSynonyme : Document
La distinction entre ressource documentaire et ressource abstraite (représentation d’un concept) fait débat, certains auteurs soutenant qu’une telle distinction est non fondée conceptuellement et impossible à mettre en œuvre techniquement.[3] RestrictionAxiome définissant une classe par une condition nécessaire et/ou suffisante sur une propriété. Par exemple la classe de tous « Employé de la Fonction Publique » peut être définie par une restriction sur la valeur de « employeur ». Le langage OWL permet l’expression de différentes espèces de restriction. RubriqueNom d’un concept utilisé dans une taxonomie.
Schéma de conceptsTerme générique défini par le langage SKOS pour désigner tout vocabulaire structuré qui peut être décrit dans ce langage. Sémantique formelleUn langage formel possède une sémantique formelle s’il est construit sur des bases logiques permettant d’attribuer des valeurs de vérité (vrai ou faux) à ses assertions. RDF possède une sémantique formelle, alors qu’aucune n’est définie pour Topic Maps. La sémantique formelle est nécessaire à la mise en place d’outils de raisonnement. SigneEn linguistique, le signe est la représentation d’un référent, c’est-à-dire la chose qu’il désigne, et qui est en dehors de l’espace linguistique. Le signe se décompose, selon l’analyse classique dite du « triangle sémiotique », en un signifiant et un signifié. Le signifiant est la partie visible, le support physique du signe. Le signifié est le concept véhiculé par le signifiant. SKOSLangage RDF destiné à la représentation des thesaurus, taxonomies, et en général de tout autre type de vocabulaire structuré hiérarchiquement et destiné à la classification. Sous-classeVoir Subsomption SubsomptionAxiome de type condition nécessaire traduisant une hiérarchie de classes, comme « Un livre est un document », qui se traduit plus explicitement par l’un des axiomes équivalents suivants:
La subsomption est à la base de l’héritage des propriétés. Si un Document doit avoir exactement une date de publication, alors un Livre possède la même propriété. Sujet
Table de référenceClasse dont les instances forment une liste contrôlée.
Taxonomie
Débat : L’Académie recommande l’usage de « Taxinomie » en considérant que « Taxonomie » est un anglicisme. De fait, le terme recommandé ne semble utilisé que par les puristes, et certains auteurs considèrent que les deux termes n’ont pas exactement le même sens.[4] On se tient ici à l’usage le plus courant, soit environ 90% des occurrences si on en croit Google.[5] Terme
Terme préférentielMot défini dans un Thesaurus, comme identifiant unique d’un descripteur dans une langue donnée. Terminologie
ThesaurusVariante : « Thésaurus » Vocabulaire contrôlé destiné à l’indexation documentaire, formé de termes représentant des descripteurs, et en général structuré par des relations hiérarchiques de générique à spécifique. ThingSuperclasse de toutes les choses dans le langage OWL. « Everything is a Thing ». TopicReprésentation formelle d’un sujet dans les langages de la famille Topic Maps. Topic MapsFamille de langages de représentation des connaissances, normalisé par l’ISO. Comme RDF, les langages Topic Maps utilisent les URI comme identifiants principaux des sujets.
TripletComposant de base du langage RDF, un triplet est constitué de trois éléments (Sujet, Prédicat, Objet). Un triplet est l’assertion d’un fait ou axiome concernant son Sujet. Le Prédicat représente une propriété attachée à ce sujet, et l’Objet est la valeur attribuée à cette propriété. Dans la spécification RDF, Sujet et Prédicat sont des ressources, l’Objet peut être une ressource ou une donnée. TypeUn type est une valeur de propriété commune à un certain nombre de choses, dont la fonction générale est de distinguer ces choses des autres. Le typage principal est en général représenté formellement dans les langages d’ontologie comme l’appartenance à une classe, mais il peut aussi utiliser d’autres propriétés, en particulier lorsqu’un typage multiple est nécessaire. Par exemple un document peut être typé par son format, son thème, ou son utilisation fonctionnelle. Le type principal « Document » sera représenté comme une classe, les autres types « sujet » « thème » et « utilisation fonctionnelle » étant représentés par des propriétés. URIIdentifiant unique d’une ressource pour le Web sémantique. Les URI obéissent à une syntaxe spécifique, ce sont soit des URL qui permettent à la fois d’identifier et d’accéder à la ressource (exemple : adresses http), soit des URN qui sont simplement des noms uniques non associés à un protocole spécifique (exemple : identifiants ISBN). Vocabulaire
NOTES 1. Si tu ne sais plus le nom des choses, leur connaissance aussi est perdue 2. Savoir ce qu’on sait, savoir ce qu’on ne sait pas, voilà le véritable savoir 3. Voir http://fr.wikipedia.org/wiki/Ressource_%28Web%29 4. Voir http://fr.wikipedia.org/wiki/Discuter:Taxinomie#taxinomie_ou_taxonomie_.3F 5. Voir http://www.googlefight.com/index.php?lang=fr_FR&word1=Taxonomie&word2=Taxinomie |