Indexierung
Indexierung (techn. auch Indizierung) umfasst das Kennzeichnen eines Dokumentes mittels Deskriptoren (Schlagworten). Durch das Hinzufügen von Metadaten werden Dokumente kategorisiert und sind so leichter auffindbar. Es wird zum einen zwischen freier und kontrollierter, zum anderen zwischen manueller und automatischer Indexierung unterschieden.
Freie Indexierung
Beim freien Indexieren werden die Schlagworte beliebig gewählt. Hierzu gehört bspw. das Social Tagging, auch Collaborative Tagging, wobei etwa Wort-, Bild- oder Tondokumenten gemeinschaftlich Schlagworte (Tags) zugeordnet werden.[1] Zusammengefasst ergeben die Tags eine sog. Folksonomy und können in einer Wortwolke (Tag Cloud) dargestellt werden. Beispiele für Social Tagging sind die Plattformen Flickr und Delicious. Ein weiteres Beispiel freien Indexierens ist die Nutzung von Hashtags (#), etwa auf Twitter, Facebook oder auch Google+.
Kontrollierte Indexierung
Beim kontrollierten Indexieren wird einem Schlagwortverzeichnis oder Thesaurus gefolgt. Beispiel hierfür ist die Gemeinsame Normdatei (GND), die von zahlreichen Bibliotheken und Museen zur Kategorisierung verwendet wird.[2] Beruhend auf einer manuellen Indexierung werden bspw. Bücher mit Schlagworten versehen, die von einem Indexierer aus einem Schlagwortverzeichnis ausgewählt werden. Wird diesem Verzeichnis entsprechendes Buch zugeordnet, handelt es sich um einen Schlagwortkatalog. Manuelle Schlagwortkataloge sind etwa Zettelkästen.
Automatische Indexierung
Beim automatischen Indexieren werden meist aus einem Volltext sämtliche Stichworte herausgesucht und gelistet. Der dabei entstehende Index kann mittels verschiedener Verfahren reduziert werden – bspw. durch eine Auswahl von Worthäufigkeiten oder das sog. Stemming, d.h. die Rückführung verschiedener Stichworte auf einen gemeinsamen Wortstamm. Bekanntestes Beispiel für einen automatisch erstellten Index ist der Google-Index.[3]
Manuelle Indexierung
Beim manuellen Indexieren weist eine Person (Indexierer) einem Dokument möglichst inhaltlich passende Schlagworte (Deskriptoren) zu. In der Praxis ist die manuelle Indexierung sehr verbreitet, bspw. beim Tagging von Blogbeiträgen oder dem Einsatz von Hashtags auf Twitter. Meist erfolgt auch Social Tagging manuell.
Halbautomatische Indexierung
Von halbautomatischer Indexierung wird gesprochen, wenn sich an die meist EDV-gestützte automatische Indexierung bspw. eine manuelle Auswahl von Deskriptoren anschließt.
Stichwort vs. Schlagwort vs. Keyword
Der Unterschied zwischen Stichworten und Schlagworten (auch Tags) besteht darin, dass Stichworte im zu indizierenden Dokument enthalten sind, Schlagworte hingegen dem Dokument hinzugefügt werden können. Ein Bilddokument kann somit im engeren Sinne keine Stichworte enthalten, jedoch mit Schlagworten versehen werden. Ein Keyword hingegen ist ein Schlüsselwort, das zur systematischen Suche verwendet wird. Keywords umfassen damit sowohl Stichworte als auch Schlagworte. Im Bereich der Suchmaschinenoptimierung (SEO) werden Keywords bspw. im Quelltext einer Programmiersprache hinterlegt und durch entsprechende Eingabe in eine Suchmaschine können diese vom Nutzer aufgefunden werden.
Weiterführende Weblinks
[1] Financal Times Lexicon: „Social tag“.