Nicht wirklich ein Google Hack aber dennoch gut zu wissen. Vorallem wenn es um die Optimierung (SEO) von Webseiten geht. Hier nun eine Beschreibung der wichtigsten META-Tags.
Wenn Sie alle Robots davon abhalten wollen, die individuellen Seiten Ihrer Website zu indizieren, können Sie folgendes Meta-Tag-Element in den HTML-Code Ihrer Seite aufnehmen:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
Wenn Sie allen Robots außer Googles Robot erlauben wollen, individuelle Seiten von Ihrer Website zu indizieren, benutzen Sie bitte folgenden Tag:
<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
Ein „Snippet“ ist ein Auszug aus den Ergebnisseiten, der alle Suchbegriffe enthält. Mit diesem Auszug kann der Benutzer den Kontext sehen, in dem die Suchbegriffe auf einer Webseite erscheinen, bevor er auf das Suchergebnis klickt. Die meisten Benutzer klicken lieber auf ein Suchergebnis, wenn es mit Snippets verbunden ist.
Wenn Sie verhindern wollen, dass Google Snippets von Ihren Seiten anzeigt, benutzen Sie bitte folgenden Tag:
<META NAME="GOOGLEBOT" CONTENT="NOSNIPPET">
Von vielen Dokumenten, die während des Web-Durchgangs verfügbar sind, speichert Google den Text. Dies ermöglicht Ihnen als Benutzer den Erhalt einer Seite, von der das Original nicht erreichbar ist (weil der Web-Server der Seite z.B. zeitweise nicht zur Verfügung steht). Die Seite im Cache erscheint dem Benutzer genau so, wie Google sie beim Web-Durchgang vorgefunden hat. Sie enthält außerdem eine Anmerkung (ganz oben), die anzeigt, dass es sich um die Cache-Version der Seite handelt.
Wenn Sie alle Robots davon abhalten wollen, Inhalt von Ihrer Website zu archivieren, benutzen Sie bitte den NOARCHIVE-Meta-Tag. Setzen Sie diesen Tag wie folgt in den <HEAD>-Bereich Ihres Dokuments ein:
<META NAME="ROBOTS" CONTENT="NOARCHIVE">
Wenn Sie anderen Robots erlauben wollen, Ihre Seiteninhalte zu archivieren und nur Googles Robot daran hindern wollen, eine Seite in den Cache aufzunehmen, benutzen Sie bitte folgenden Tag:
<META NAME="GOOGLEBOT" CONTENT="NOARCHIVE">
Google aktualisiert seinen Index regelmäßig. Bei einem Web-Durchgang findet Google neue Seiten, legt tote Links ab und aktualisiert Links automatisch. Links, die veraltet sind, werden jetzt beim nächsten Web-Durchgang aus dem Index meistens „entfernt“.
Der Meta-Tag „description“ wird von Google im Suchergebnis nur dann angezeigt wenn die Snippets mittels „NOSNIPPET“ abgeschaltet wurden oder wenn die gesuchten Keywörter auf der Webseite zu weit auseinander sind und Google einen Snippet nicht sauber zuordnen kann.
<META NAME="DESCRIPTION" CONTENT="Kurzbescheibung des Seiten Inhaltes">
Dieser Meta Tag versorgt die Spider der Suchmaschinen mit Informationen zwecks Suchbegriffen. Hier geben Sie die Begriffe getrennt durch Komma an, unter welcher Sie gefunden werden möchten.
<META NAME="KEYWORDS" CONTENT="a,b,c,d,e,f,g,h">
Dieser Tag definiert den erneuten Besuch des Spiders. Im obigen Beispiel kommt der Spider der Suchmaschine nach 14 Tagen wieder auf Ihre Seite und durchsucht diese nach Aktualisierungen.
<META NAME="REVISIT-AFTER" CONTENT="14 days"> oder <META NAME="REVISIT-AFTER" CONTENT="2 month">
Da viele grosse Suchmaschinen Ihre Seite automatisch abklappern, ist der Tag zwar fast unnötig, sollte aber mit angegeben werden. Kleinere Suchmaschinen kommen nur wieder vorbei wenn Sie dies in diesem Meta Tag definiert haben.
Wenn Sie ein Bild aus dem Bilderindex von Google entfernen wollen, benötigen Sie hierfür die Zusammenarbeit mit dem Webmaster Ihrer Website. Bitten Sie den Webmaster, eine robots.txt-Datei auf die Root-Ebene des Website-Servers zu legen.
Wenn www.yoursite.de/images/dogs.jpg Ihre Website ist und Sie nicht wollen, dass Google die „dogs.jpg“-Bilder aufnimmt, müssen Sie eine Seite mit dem Namen „www.yoursite.de/robots.txt“ erstellen und mit folgendem Text versehen:
User-Agent: Googlebot-Image Disallow: /images/dogs.jpg
Um alle Bilder Ihrer Web-Site aus dem Index zu entfernen, müssen Sie die folgende robots.txt-Datei in das Root-Verzeichnis Ihres Servers legen:
User-Agent: Googlebot-Image Disallow: /
Wenn Ihr mehr Informationen über die robots.txt-Datei und der Anwendung benötigt: http://www.google.de/webmasters/