VisualEditor:Test

Ce langage est appelé métadonnées.

Il s'agit de données décrivant des données, ou metadata

L'enjeu des métadonnées n'émerge pas avec le web : Ce dernière est de longue date une question ouverte pour le livre papier, afin de faciliter la gestion des stocks, les achats, le catalogage..

Ainsi, les acteurs de la chaine du livre ont à cette époque déjà à leur disposition des standards de métadonnée dédiés à leur back office, c'est à dire à la gestion en interne des flux physiques des ouvrages.

Ces standards comprennent entre autre l'ISBN, (identifiant international d'un ouvrage dans une édition donnée), la norme ONIX (norme d'échange de données relatives aux ouvrages fondée sur XML)...

L'objectif assumé de ces standards est la description et l'identification d'objets physiques, manipulables. Avec le web, le rôle des métadonnées évolue.

Elles étaient déjà l'input permettant à des SIGB (système intégré de gestion de bibliothèque) de partager et de traiter cette information. La librairie du congrès Américain avait développé dans les années 1960 le format MARC (Machine-Readable Cataloging), le standard de description bibliographique.

Etendre à tout le web un format unique de métadonnées conçu pour les livres n'aurait pas fonctionné du fait de la disparité des supports et des médias qu'on retrouve sur internet. Il n'aurait pas fait sens d'indexer de la même façon un film, une image, une émission de radio, une carte géographique ou encore un curriculum vitae.

Le parallèle à été fait par Amine Sennouni (2017) entre internet et l'intelligence artificielle relativement à cette question : "Comment exprimer de façon informatique des données hétérogènes afin que les machines puissent procéder à des inférences logiques, comme pour les systèmes experts ?" Tim Berners-Lee, avec le web sémantique, à eu l'idée d'introduire un langage de format de métadonnées suffisamment simple et générique pour lier toutes les ressources présentes sur le réseau, mais également toutes données de bases de données relationnelles. Cette unité fondamentale du système se nomme RDF (Resource Description Framework), format d’expression des données qui sera standardisé par l’instance du W3C dès 1994. RDF repose sur la structure logique de prédicat , ou triplet, une sorte de phrase de grammaire simple : sujet, verbe, complément. Par exemple : Jean Luc Mélenchon est l'auteur de l'avenir en commun