Mieux connaître nos solutions et la terminologie du Web Sémantique

index de fiches

Documentation, Terminologie...

Centre de Ressources

Documentation produits et solutions

..............................................................................

Documentation

Le Blog Mondeca - Partager nos expériences et connaissances

..............................................................................

Le blog de Mondeca Leçon de Choses permet aux équipes Mondeca de partager avec vous des réflexions et expériences et de tester de nouvelles idées. Toutes vos retours, remarques et suggestions sur les articles sont les bienvenus. L'équipe de rédaction.

Terminologie Mondeca de «Assertion» à «Vocabulaire»

..............................................................................

Petite leçon de choses en forme de glossaire

Nomina si nescis, perit et cognitio rerum [1]

Carl von Linné (1707-1778)

On dit que c’est toujours le cordonnier le plus mal chaussé. C’est à contredire cet adage que ce petit document s’efforce. Attaché à la description et à l’organisation efficace du vocabulaire métier de ses clients, Mondeca se doit de donner l’exemple avec son propre vocabulaire, même s’il s’agit là d’un exercice périlleux à plus d’un titre. Mais c’est le propre de Mondeca de ne reculer devant aucun défi conceptuel ou technique.

En effet notre métier concerne des domaines très proches des points de récursivité du langage, où des mots très abstraits et très génériques risquent de se renvoyer les uns aux autres sans vraiment clarifier leur sens. De plus, ces mêmes mots sont souvent employés depuis longtemps dans des sens différents, dans des contextes variés, par des métiers et communautés de pratiques diverses. Mais c’est une caractéristique singulière des technologies de l’information d’amener de plus en plus aujourd’hui les métiers à échanger et fédérer leurs données, un décloisonnement difficile mais salutaire, dont un point de passage obligé est la clarification des vocabulaires de chacun, et la définition de leur interopérabilité. Savoir qu’on parle de la même chose sous des noms divers, ou au contraire qu’on emploie le même nom pour des choses différentes, ou plus subtilement pour des conceptions différentes de la même chose … c’est pour paraphraser Confucius, le « véritable savoir » [2] dans un tel contexte.

Par ailleurs la forme imposée du glossaire, qui doit rester raisonnablement compact, ne facilite pas la tâche. Définir ce qu’est une Chose, un Concept ou une Catégorie en quelques mots semble une gageure, quand tant de philosophes ont écrit tant de pages à ce sujet.

Tout ceci amène à la conclusion évidente que ce glossaire ne prétend être ni exhaustif, ni normatif. Aux définitions académiques, on a préféré les définitions constatées par l’usage, en notant chaque fois que nécessaire l’imprécision ou l’ambiguïté de cet usage.

Bernard Vatant – 22 décembre 2006

Assertion

En mathématiques et en logique, phrase utilisant un langage possédant une sémantique formelle, et dont la valeur de vérité (vrai ou faux) peut être déclarée ou déduite.

Dans une base de connaissance, les assertions sont des axiomes ou des faits déduits de ces axiomes par des règles.

Attribut

Donnée typée attribuée à une chose, autrement dit valeur d’une propriété de cette chose. Par abus de langage, attribut est parfois employé comme synonyme de propriété.

Association

En Topic Maps, représentation formelle d’une relation entre deux ou plusieurs sujets. Les associations permettent de représenter des relations n-aires, c’est-à-dire de relier plusieurs sujets par une seule relation. Les associations sont utilisées dans ITM pour faciliter la navigation et les requêtes dans une base de connaissance.

Autopostage

Dans un corpus documentaire indexé par un vocabulaire hiérarchique de type Thesaurus, accès automatique au contenu indexé par les termes spécifiques d’un terme donné (autopostage descendant) ou par les termes génériques (autopostage ascendant).

Axiome

Assertion déclarée a priori comme vraie. On utilise le terme en logique de description pour désigner les assertions déclarées dans une ontologie, comme par exemple une relation de subsomption, ou une restriction concernant une propriété.

Par extension, mais plus rarement, on emploie le terme pour désigner une assertion déclarée a priori vraie pour une instance, par exemple « Pierre est une Personne ». Par contre, si la même assertion est déduite par une règle, ce n’est pas un axiome.

Base de connaissance

Représentation, en général dans une base de données, d’un ensemble de faits décrits suivant une ontologie commune. Suivant les auteurs, une base de connaissance comprend ou non la description des concepts de l’ontologie, ou seulement les faits concernant les instances.

Dans ITM, on appelle aussi base de connaissance un espace de travail contrôlé par une ontologie, elle-même définie dans un autre espace de travail. Dans un tel espace de travail, l’utilisateur a accès à l’ontologie en lecture seule, et il peut créer des instances et des faits conformes à cette ontologie, via des interfaces dynamiques contrôlées par cette ontologie.

La notion de base de connaissance est aussi définie de façon formelle en logique de description.

Catégorie

  1. En philosophie, synonyme de concept.
  2. En langage courant, employé de façon informelle pour classe, ou rubrique de taxonomie.

Chose

Terme générique désignant tout ce qui est susceptible d’être représenté, identifié ou décrit dans un système d’information, et en particulier dans une base de connaissance. Dans ce cadre, une chose est le référent d’un nom ou identifiant (signifiant) dont le signifié est un concept décrit formellement.

Classe

Représentation formelle d’un type dans une ontologie. Les classes sont organisées par des relations hiérarchiques de classe à sous-classe, ou axiomes de subsomption, définissant l’héritage des propriétés.

Classe énumérée

Synonyme utilisé en OWL pour Table de référence. Une classe énumérée définit la liste, finie et contrôlée, de ses instances.

Classement

Application d’un système de classification à un ensemble de ressources. En particulier, affectation de ressources documentaires à des rubriques dans un plan de classement ou une taxonomie.

Classification

1. Dans son sens original en biologie, système de classes ou taxons organisant les espèces d’êtres vivants. On emploie aujourd’hui plutôt « Systématique » dans ce sens.

2. Dans le monde documentaire, terme souvent employé informellement pour indexation, taxonomie ou classement.

Concept

  1. Représentation d’une chose dans un langage, et en particulier dans un langage formel.
  2. En particulier, élément d’une ontologie, représentant une chose abstraite comme une classe ou une propriété, par opposition aux instances représentant des objets individuels.
  3. Classe fondamentale du langage SKOS, équivalente à descripteur.

Corpus documentaire

Ensemble de ressources documentaires relatives à une base de connaissance. En particulier, ensemble des ressources susceptibles d’être indexées automatiquement.

Descripteur

Concept représenté dans un Thesaurus. Un descripteur est identifié par un terme préférentiel unique dans une langue donnée. On peut lui rattacher des synonymes, variantes, définitions, notes d’application …

Dans le langage SKOS, un descripteur est représenté par une instance de la classe Concept.

Description

La description d’une chose est un ensemble d’informations la concernant. Les éléments classiques d’une description sont le type de la chose, ses propriétés et des relations avec d’autres choses.

Une description est dite « non structurée » quand elle utilise un langage naturel ou une représentation multimédia (graphique, symbole, image …).

Une description est dite « structurée » quand elle utilise un format standardisé et contrôlé d’information, comme un tableau ou un document XML. Le format de description est très souvent adapté à un type de chose.

En RDF, une description d'une ressource est un ensemble de triplets dont cette ressource est le sujet.

Document

Donnée

  1. Elément d’information stocké dans un système informatique
  2. Plus particulièrement, en RDF, valeur de l’objet d’un triplet qui n’est pas une ressource. Une telle donnée peut avoir un type physique précis (nombre entier, date …)

Entité

  1. Nom savant employé pour Chose en philosophie et dans certains langages formels.
  2. Entité nommée : terme employé par les outils d’extraction linguistique pour désigner les individus, et particulièrement les éléments de tables de référence.

Espace de noms

  1. Vocabulaire où chaque nom est utilisé une seule fois avec une sémantique unique.
  2. En XML, partie commune à toutes les URI définis dans un même vocabulaire.

Espace de travail

Notion spécifique à Mondeca ITM. Un espace de travail définit l’accès des utilisateurs à une base de connaissance ou à une ontologie.

Fait

Assertion concernant une ou plusieurs instances dans une base de connaissance. Un fait peut être déclaré explicitement comme un axiome, ou déduit d’autres faits par des règles.

Glossaire

Vocabulaire technique relatif à un domaine ou un métier, présenté en général selon l’ordre alphabétique, avec la définition de chaque terme.

Grammaire

Ensemble de règles syntaxiques décrivant la façon dont les assertions doivent être formulées pour avoir du sens dans un langage formel.

Héritage

Une hiérarchie supporte l’héritage si une caractéristique déclarée pour un concept dans la hiérarchie s’applique à tous les descendants de ce concept.

Exemples :

Héritage des propriétés d’une classe à toutes ses sous-classes :

  • Propriété attachée à une classe : "Un Vertébré possède un squelette"
  • Subsomption : "Un Mammifère est un Vertébré"
  • Héritage : "Un Mammifère possède un squelette"

Indexation par autopostage dans un thesaurus.

Hiérarchie

Organisation de concepts suivant une relation « parent-enfant » ou « hyperonyme-hyponyme ».

Les hiérarchies les plus courantes dans les bases de connaissance sont :

  • Les relations de subsomption entre classes d’une ontologie
  • Les relations générique-spécifique entre descripteurs d’un thesaurus
  • Les relations de rubrique à sous-rubrique dans une taxonomie
  • Les relations de méronymie

Les hiérarchies les plus utilisées sont des arbres, où chaque concept a au maximum un parent. Dans le cas où un concept peut avoir plusieurs parents, on parle de multi-hiérarchie.

Homonymie

Situation dans laquelle des concepts distincts sont désignés par le même nom. Cette situation empêche l’utilisation du nom comme identifiant.

Un vocabulaire où l’homonymie est interdite définit un espace de noms.

Identifiant

Propriété dont la valeur permet d’identifier de façon unique une ressource. Dans les technologies du Web sémantique, les identifiants privilégiés sont les URI.

Identification

Processus permettant de reconnaître de façon unique une chose à partir d’une représentation ou d’une description. Dans les bases de connaissance, l’identification repose sur l’utilisation de propriétés identifiantes ou de règles d’identification.

Index

Liste structurée de sujets indexant un corpus documentaire, avec les renvois aux éléments de ce corpus. Dans les publications papier, ces éléments peuvent être des références de documents complets (index d’une bibliothèque), ou des sections de documents (index d’un document particulier). Un index peut être une simple liste alphabétique de termes, ou présenter une structure calquée sur celle du vocabulaire dont il est extrait, par exemple une structure hiérarchique.

Indexation

Rattachement de ressources documentaires à des sujets définis dans un vocabulaire. L’indexation peut être effectuée manuellement par des documentalistes, ou par des outils automatiques appliquant des règles d’indexation.

Individu

Instance d’une classe dans le langage OWL.

Inférence

Instance

Individu rattaché à une classe. Par exemple « Pierre est une Personne » se traduit formellement par : L’individu « Pierre » est une instance de la classe «Personne ». Le rattachement d’instances à des classes constitue le peuplement d’une base de connaissance.

Langage formel

Par opposition au langage naturel, un langage formel utilise une grammaire formelle qui définit les expressions bien formées dans ce langage. Un langage formel peut posséder ou non une sémantique formelle.

Logique de description

Type de logique spécialement destinée à la représentation des bases de connaissance, pour lesquelles elle permet de définir une sémantique formelle, supportant des tâches de raisonnement. La logique de description est un des fondements théoriques du langage OWL.

Métadonnée

Donnée typée attachée à une ressource, et en particulier à une ressource documentaire. Dans une démarche de représentation des connaissances, métadonnée est pratiquement synonyme de propriété.

Méronymie

Organisation hiérarchique des parties d’un tout, par exemple la subdivision administrative d’un territoire ou d’une entreprise, ou la décomposition d’un ouvrage en chapitres et sections.

Nom

  1. Propriété identifiante utilisé dans la plupart des langages de description. Un nom n’est pas à lui seul un identifiant, si les langages supportent l’homonymie.
  2. En linguistique le nom est le type le plus commun de signifiant.

Objet

  1. Elément d’une base de connaissance. On dit aussi « objet métier ».
  2. Troisième élément d’un triplet RDF, ou valeur d’une propriété.

Ontologie

Ensemble structuré de classes, propriétés et axiomes utilisé pour organiser une base de connaissance. Suivant les auteurs, la définition peut s’étendre aux instances et aux faits, ou seulement aux instances des tables de référence.

OWL

Standard W3C (Février 2004). Langage de la famille RDF permettant la description d’ontologies. Utilisé pour la représentation externe des ontologies utilisées dans Mondeca ITM.

Peuplement

Création d’instances dans une base de connaissance. Le peuplement peut être effectué par des éditeurs humains via des interfaces dédiées (comme celle de ITM), ou la plupart du temps par une migration de base de données existantes.

Plan de classement

Type spécifique de taxonomie, en général utilisé pour les ressources documentaires ayant un type de sujet particulier. Par exemple un « plan de classement Personne » définira des rubriques standard pour le classement des documents concernant une personne donnée, comme « Vie Publique » « Vie privée » « Bibliographie ».

Propriété

Une propriété est un concept permettant la description des choses par des assertions dont la chose est le sujet. En particulier en RDF, une propriété est le deuxième élément d’un triplet qui représente une assertion. Le triplet (Bernard, employeur, Mondeca) attribue la valeur « Mondeca » à la propriété « employeur » pour le sujet « Bernard ».

Par abus de langage, la valeur attribuée à une propriété.

Propriété identifiante

Une propriété est dite identifiante si sa valeur est utilisée pour déterminer si deux choses sont identiques. Si une seule propriété suffit, on parle simplement d’identifiant. Dans le cas général, l’identification nécessite l’égalité de plusieurs propriétés.

Par exemple « nom », « prénom », « date de naissance » et « lieu de naissance » forment un ensemble de propriétés identifiantes pour une personne.

Published Subject Indicator

Abréviation : PSI

En Topic Maps, URI utilisée pour identifier un sujet, et permettant d’accéder à une ressource documentaire publiée contenant une description explicite du sujet pour des utilisateurs humains.

Dans le jargon Mondeca, PSI est utilisé par abus de langage pour désigner une URI identifiant un topic, même si cette URI ne correspond à aucune ressource publiée.

Raisonnement

Dans le cadre d’une base de connaissance, les outils de raisonnement utilisent la sémantique formelle pour exécuter des tâches comme le contrôle de cohérence, la classification automatique, l’identification d’instances ou la déduction de faits.

RDF

« Resource Description Framework » est un langage destiné au départ à la description formelle des métadonnées des ressources documentaires. Il a évolué pour devenir un langage générique pour la représentation de bases de connaissance interopérables sur le Web, et sert de base à des langages plus spécifiques comme OWL ou SKOS.

Référent

En linguistique, le référent désigne la chose représentée par un signe, et en particulier par un nom.

Règle

Une règle permet à un système de déclencher une action de raisonnement sur le contenu d’une base de connaissance.

La différence entre axiome et règle est fonctionnelle. Les axiomes sont purement statiques et déclaratifs, les règles déclenchent des actions. Une règle peut être la forme dynamique d’un axiome.

Exemples

  • « L’employeur d’une Personne est une Organisation » est un axiome reliant les classes « Personne » et « Organisation » par la propriété « employeur ».
  • « Si X est une Personne et Y employeur de X, alors Y est une Organisation » exprime la même sémantique sous forme de règle.

Règle d’identification

Règle permettant de décider si deux choses sont identiques ou non. Les règles d’identification les plus courantes utilisent des propriétés identifiantes.

Règle de classification

  1. Règle définissant les conditions à laquelle une ressource doit être rattachée à une classe donnée.
  2. Pra extension, une règle d’indexation, indique les conditions à laquelle une ressource a pour sujet un concept donné, et une règle de classement indique à quelle(s) rubrique(s) de taxonomie une ressource doit être attachée.

Les règles de classification peuvent être exprimées en langage naturel et appliquées par des utilisateurs humains, ou exprimées en langage formel pour servir de base à la classification automatique.

Ressource

De l’anglais « Resource », par extension de « Web Resource ». Chose identifiée, en particulier par une URI, et décrite dans une base de connaissance. Le mot « Resource » est utilisé dans les acronymes URI et RDF.

Ressource documentaire

Synonyme : Document

  1. Ressource représentant un contenu d’information ayant un support physique : texte, fichier PDF, page Web, image, son, multimédia …
  2. En particulier, en RDF, ressource accessible sur le Web via son URL.

La distinction entre ressource documentaire et ressource abstraite (représentation d’un concept) fait débat, certains auteurs soutenant qu’une telle distinction est non fondée conceptuellement et impossible à mettre en œuvre techniquement.[3]

Restriction

Axiome définissant une classe par une condition nécessaire et/ou suffisante sur une propriété. Par exemple la classe de tous « Employé de la Fonction Publique » peut être définie par une restriction sur la valeur de « employeur ».

Le langage OWL permet l’expression de différentes espèces de restriction.

Rubrique

Nom d’un concept utilisé dans une taxonomie.

Schéma de concepts

Terme générique défini par le langage SKOS pour désigner tout vocabulaire structuré qui peut être décrit dans ce langage.

Sémantique formelle

Un langage formel possède une sémantique formelle s’il est construit sur des bases logiques permettant d’attribuer des valeurs de vérité (vrai ou faux) à ses assertions. RDF possède une sémantique formelle, alors qu’aucune n’est définie pour Topic Maps.

La sémantique formelle est nécessaire à la mise en place d’outils de raisonnement.

Signe

En linguistique, le signe est la représentation d’un référent, c’est-à-dire la chose qu’il désigne, et qui est en dehors de l’espace linguistique. Le signe se décompose, selon l’analyse classique dite du « triangle sémiotique », en un signifiant et un signifié. Le signifiant est la partie visible, le support physique du signe. Le signifié est le concept véhiculé par le signifiant.

SKOS

Langage RDF destiné à la représentation des thesaurus, taxonomies, et en général de tout autre type de vocabulaire structuré hiérarchiquement et destiné à la classification.

Sous-classe

Voir Subsomption

Subsomption

Axiome de type condition nécessaire traduisant une hiérarchie de classes, comme « Un livre est un document », qui se traduit plus explicitement par l’un des axiomes équivalents suivants:

  • La classe « Livre » est une sous-classe de la classe « Document ».
  • Toute instance de la classe « Livre » est aussi une instance de la classe « Document ».

La subsomption est à la base de l’héritage des propriétés. Si un Document doit avoir exactement une date de publication, alors un Livre possède la même propriété.

Sujet

  1. Concept utilisé pour indexer une ressource documentaire (le sujet du document).
  2. En RDF, premier élément d’un triplet (le sujet de la phrase)
  3. En Topic Maps, le référent d’un topic (le sujet de conversation)

Table de référence

Classe dont les instances forment une liste contrôlée.

Taxonomie

  1. Sens classique : dans les sciences, et d’abord en Biologie, définition d’une hiérarchie de classes permettant la classification systématique des objets du domaine d’étude, en particulier les êtres vivants. Dans ce cadre, une classe au sens défini dans ce glossaire est appelé taxon (pl. taxa), le mot « classe » désignant un niveau particulier de taxon.
  2. Dans les technologies de l’information, taxonomie a pris un sens plus vague. Il peut désigner suivant les auteurs une ontologie simple, réduite à une hiérarchie de classes, ou un plan de classement documentaire, en particulier utilisé dans les interfaces Web. Dans ce deuxième sens, les concepts utilisés sont généralement appelés rubriques ou catégories, et plus rarement classes.

Débat : L’Académie recommande l’usage de « Taxinomie » en considérant que « Taxonomie » est un anglicisme. De fait, le terme recommandé ne semble utilisé que par les puristes, et certains auteurs considèrent que les deux termes n’ont pas exactement le même sens.[4] On se tient ici à l’usage le plus courant, soit environ 90% des occurrences si on en croit Google.[5]

Terme

  1. Mot appartenant à un vocabulaire contrôlé. Un terme représente en général un concept unique, c’est-à-dire que l’homonymie est interdite.
  2. Par abus de langage, descripteur dans un thesaurus.

Terme préférentiel

Mot défini dans un Thesaurus, comme identifiant unique d’un descripteur dans une langue donnée.

Terminologie

  1. Science de l’étude et de la gestion des vocabulaires spécialisés à un domaine.
  2. Ensemble des termes spécialisés utilisés dans un domaine particulier.

Thesaurus

Variante : « Thésaurus »

Vocabulaire contrôlé destiné à l’indexation documentaire, formé de termes représentant des descripteurs, et en général structuré par des relations hiérarchiques de générique à spécifique.

Thing

Superclasse de toutes les choses dans le langage OWL. « Everything is a Thing ».

Topic

Représentation formelle d’un sujet dans les langages de la famille Topic Maps.

Topic Maps

Famille de langages de représentation des connaissances, normalisé par l’ISO.

Comme RDF, les langages Topic Maps utilisent les URI comme identifiants principaux des sujets.

Triplet

Composant de base du langage RDF, un triplet est constitué de trois éléments (Sujet, Prédicat, Objet). Un triplet est l’assertion d’un fait ou axiome concernant son Sujet. Le Prédicat représente une propriété attachée à ce sujet, et l’Objet est la valeur attribuée à cette propriété. Dans la spécification RDF, Sujet et Prédicat sont des ressources, l’Objet peut être une ressource ou une donnée.

Type

Un type est une valeur de propriété commune à un certain nombre de choses, dont la fonction générale est de distinguer ces choses des autres. Le typage principal est en général représenté formellement dans les langages d’ontologie comme l’appartenance à une classe, mais il peut aussi utiliser d’autres propriétés, en particulier lorsqu’un typage multiple est nécessaire.

Par exemple un document peut être typé par son format, son thème, ou son utilisation fonctionnelle. Le type principal « Document » sera représenté comme une classe, les autres types « sujet » « thème » et « utilisation fonctionnelle » étant représentés par des propriétés.

URI

Identifiant unique d’une ressource pour le Web sémantique. Les URI obéissent à une syntaxe spécifique, ce sont soit des URL qui permettent à la fois d’identifier et d’accéder à la ressource (exemple : adresses http), soit des URN qui sont simplement des noms uniques non associés à un protocole spécifique (exemple : identifiants ISBN).

Vocabulaire

  1. En linguistique : ensemble des mots valides dans un langage
  2. Plus particulièrement : ensemble des termes définis dans une terminologie

NOTES

1. Si tu ne sais plus le nom des choses, leur connaissance aussi est perdue

2. Savoir ce qu’on sait, savoir ce qu’on ne sait pas, voilà le véritable savoir

3. Voir http://fr.wikipedia.org/wiki/Ressource_%28Web%29

4. Voir http://fr.wikipedia.org/wiki/Discuter:Taxinomie#taxinomie_ou_taxonomie_.3F

5. Voir http://www.googlefight.com/index.php?lang=fr_FR&word1=Taxonomie&word2=Taxinomie