Deep Web
Das Deep Web ist die Bezeichnung für Webseiten, die zwar prinzipiell zugänglich sind, von den Crawlern der Suchmaschinen aber nicht erfasst werden. Das Nichterfassen kann dabei daraus resultieren, dass entweder der Crawler einzelne Seiten nicht tief genug durchsucht und indiziert, oder andererseits der Crawler am Zugang gehindert wird, so dass er Teile von Webseiten oder diese in ihrer Gänze nicht erfassen kann.
Allgemein
Das Deep Web beinhaltet Webseiten die bewusst oder unbewusst den Zugang für die Allgemeinheit verweigern. Durch unzureichende Verlinkungen auf die Homepage kann sie durch öffentliche Suchmaschinen nicht gefunden werden. Eine Bergmann-Studie aus dem Jahr 2011 ergab, dass mehr als 200.000 sogenannte Deep Web Webseiten existieren.
Das Deep Web wird in 2 grobe Bereiche untergliedert: Der erste umfasst die nicht frei zugänglichen Webseiten. Diese sind vom Webmaster durch Passwörter geschützt und enthalten sensible Daten (z. B. Intranets, Grafiken, vertrauliche Dokumente). Diese müssen durch den Webmaster vor Ansicht freigegeben werden.
Der zweite Bereich umfasst Webseiten die aus technischen Gründen von den Suchmaschinen nicht erfasst werden können. Dies sind zum Beispiel Seiten die Grafikformate oder Nicht-Standardformate wie Flash etc. Große Dokumente die zum Teil nicht von den Suchmaschinen erfasst werden können bleiben so unsichtbar.
Das Deep Web sollte nur mit Vorsicht genutzt werden, da mit diesem auch sehr viel Missbrauch getrieben wird. Organisationen nutzen es zur Propaganda und Cyberkriminelle veröffentlichen hier ihre Webseiten. Die genaue Vorgehensweise bezüglich der Rankings im Deep Web ist noch nicht genaustens erforscht. Allerdings befassen sich immer häufiger SEO-Spezialisten mit Strategien die die Suchergebnisse im Deep Web mit berücksichtigen.