Etapes de l'indexation

Une indexation performante est le résultat d'une analyse de contenu du document qui doit se faire à trois niveaux : niveau conceptuel, niveau du langage naturel, niveau du langage documentaire.

1. Niveau conceptuel

La reconnaissance des concepts suppose une prise de connaissance globale du document.

Pour un document imprimé, on s'appuiera sur :

  • le titre, s'il est significatif ;
  • le sommaire, les sous-titres s'ils existent ;
  • l'introduction, la conclusion du document ;
  • les notions mises en valeur par certains artifices typographiques.

Pour un document audiovisuel, on s'appuiera sur :

  • ses documents d'accompagnement ;
  • l'analyse résultant de son audition ou de son visionnement.

L'indexeur répondra à un certain nombre de questions, celles que poserait un utilisateur :

  • de qui, de quoi parle le document ?
  • de quel point de vue ?
  • quelle zone géographique et quelle période l'information présente dans le document concerne-t-elle ?

Par exemple, un document peut traiter :

  • des enfants handicapés (= quoi ?) ;
  • de leur cursus scolaire (= de quel point de vue ?) ;
  • en France (= où ?).

2. Niveau du langage naturel

Les concepts ainsi définis seront traduits dans un premier temps en mots-clés (handicapé physique, France, cursus scolaire).
Multiplier les mots-clés correspondant à un même concept peut être utile : ils constitueront autant d'entrées dans le thésaurus (cursus scolaire, scolarisation, par exemple).

3. Niveau du langage documentaire

La traduction des concepts représentés par des mots-clés en descripteurs du thésaurus est l'opération d'indexation proprement dite.