Une indexation performante est le résultat d'une analyse de contenu du document qui doit se faire à trois niveaux : niveau conceptuel, niveau du langage naturel, niveau du langage documentaire.
La reconnaissance des concepts suppose une prise de connaissance globale du document.
Pour un document imprimé, on s'appuiera sur :
Pour un document audiovisuel, on s'appuiera sur :
L'indexeur répondra à un certain nombre de questions, celles que poserait un utilisateur :
Par exemple, un document peut traiter :
Les concepts ainsi définis seront traduits dans un premier temps en mots-clés (handicapé physique, France, cursus scolaire).
Multiplier les mots-clés correspondant à un même concept peut être utile : ils constitueront autant d'entrées dans le thésaurus (cursus scolaire, scolarisation, par exemple).
La traduction des concepts représentés par des mots-clés en descripteurs du thésaurus est l'opération d'indexation proprement dite.
| < Préc | Suivant > |
|---|