Malte Landwehr

Blog von Malte Landwehr

11.02.2010 | 20:42

Freitag.de platziert Robots.txt falsch

Freitag.de scheitert schon an den Grundlagen der Suchmaschinenoptimierung und platziert die Robots.txt-Datei falsch.

Es soll ja vorkommen, dass Menschen sich selber googeln. Ich bin einer davon und war leicht verwundert als ich bei einer Suche nach meinem Namen eine Unterseite der Domain z1.application2.kba.d9t.de erblickte, deren Title- und Description den Eindruck erweckten, es handle sich um ein Blog von mir. Nach einem Klick war klar: Es ist mein vor kurzem angelegtes Profil auf Freitag.de

Mein Profil

Mein Freitag.de-Profil sollte eigentlich unter der folgenden URL aufrufbar sein:

freitag.de/community/profiles/blogs/mlandwehr

doch bei Google läuft es unter

z1.application2.kba.d9t.de/freitag/community/blogs/mlandwehr

Und tatsächlich: Unter dieser merkwürdigen Domain ist die gesamte Freitag.de Internetpräsenz aufrufbar.

Zahlen & Fakten

Mithilfe der folgenden Google Abfrage kann man feststellen, wie viele Unterseiten einer (Sub)Domain im Index von Google sind.

site:z1.application2.kba.d9t.de

Das Ergebnis einer site:-Abfrage bei Google.

Ich habe für Freitag.de und die Mirrors von d9t die folgenden Werte ermittelt:

  •  332.000 unter freitag.de
  • 35.200 unter z1.application2.kba.d9t.de
  • 1.370 unter z2.application2.kba.d9t.de
  • 955 unter z4.application2.kba.d9t.de
  • 1 unter z8.application2.kba.d9t.de

Die Anzahl der Suchergebnisse für z1.application2.kba.d9t.de

Ursache

Offensichtlich legt der Webhoster von Freitag.de (die D9T GmbH) diverse Subdomains an (ob da jetzt einzelne Server, Mirrors, Load-Balancer, Cluster, Backup-Server oder was auch immer hinter hängen ist aus Googles Sicht egal) und diese werden in Google gefüttert.

Fehler & Lösung

Unter z1.application2.kba.d9t.de/freitag/robots.txt findet sich eine Datei mit folgendem Inhalt:

User-agent: *
Disallow: /

Die Robots.txt dient der Kommunikation mit dem Crawler einer Suchmaschine. Und diese hier sagt eindeutig: Für jeden Bot sind alle Inhalte verboten. Es gibt nur ein Problem:

DIE ROBOTS.TXT GEHÖRT INS ROOT VERZEICHNIS!

Hier liegt sie jedoch im Unterordner /freitag/. Würde man sie einfach nach z1.application2.kba.d9t.de/robots.txt verschieben, so würde diese Subdomain wieder aus dem Google-Index verschwinden. Weiter Informationen hierzu liefert Google in seiner Webmaser Hilfe.

Es gibt jedoch auch zwei alternative und wesentlich elegantere Lösungsansätze.

Die Lösung über die Base-Adresse der Links

Surfe ich auf z1.application2.kba.d9t.de/freitag, werden alle internen Links automatisch an diese Subdomain angepasst. Dies ließe sich einfach beheben, wenn man als Base-URL immer www.freitag.de festsetzen würde.

Die Lösung über rel="cannonical"

Für den Fall, dass ein Inhalt unter mehr als einer URL zu finden ist, gibt es einen speziellen HTML Tag: rel="cannonical". Warum und wie man ihn einsetzt erklärt Google selbst in seiner Webmaster Hilfe.

 
Senden Bookmarken Drucken
Kommentare
elcario schrieb am 11.02.2010 um 22:27
Hey Malte,

mir ist es bisher zwar nicht aufgefallen, aber du hast natürlich vollkommen recht. Schon ein bisschen peinlich für eine solch große Online-Präsens.

Hoffe dein Beitrag trägt Früchte!
ich schrieb am 12.02.2010 um 10:52
Ich werde jetzt immer z1.application2.kba.d9t.de in meinem Browser eingeben, wenn ich die hiesige Online-Gegenwart besuchen möchte. Das kann man sich ohnehin besser merken als dieses umständliche freitag.de (wer sich das nur wieder ausgedacht hat?)! Das ist natürlich mindestens genauso peinlich, wie das kleine 1x1 (DIE ROBOTS.TXT GEHÖRT INS ROOT VERZEICHNIS!) nicht zu beherrschen.
Malte Landwehr
Malte Landwer ist Informatik-Student, Internet-Unternehmer und Blogger.
Ort:
Münster
Mitglied seit:
2 Jahre 1 Woche
Zuletzt aktiv:
12.02.2010
Status:
Blogger
Aktivität:
Beiträge: 1
Kommentare: 8
Mein Web:
Logbuch
16:08
merdeister hat gerade einen Kommentar geschrieben.
16:02
merdeister hat gerade einen Kommentar geschrieben.
16:02
rolf netzmann hat gerade einen Kommentar geschrieben.
16:01
merdeister hat gerade einen Kommentar geschrieben.
15:59
Jacob Jung hat gerade einen Blogbeitrag erstellt.
Liebeshandlung - Eugenides

Berlinale

Freitag_Salon

PortletSalon_120216.png

Christian Kracht Imperium Kiepenheuer & Witsch 2012

256 Seiten. Gebunden.

18,99
 
In seinem neuen Roman erzählt Christian Kracht eine Aussteigergeschichte in den deutschen Kolonien der Südsee, indem er virtuos und gut gelaunt mit den Formen des historischen Abenteuerromans spielt - und erschafft so zugleich eine erstaunliche, immer wieder auch komische Studie über die Zerbrechlichkeit und Vermessenheit menschlichen Handelns >> mehr
Occupy

portlet_occupy.png

Rote Perlen

wir müssen reden

IGEL

portlet_IGEL.png

Probe-Abo

probeabo260x120.jpg

Aktuelle Ausgabe bestellen
Café Moskau

Ausgabe 07/12
16.02.2012

keine Versandkosten
kein Aufpreis

Einzelpreis: 3.60 €

>> bestellen
Arte

portlet_arte+zeile.pngportlet_arte+zeile.png

der Freitag Kollektion

Freitag-Kollektion_05_06.jpg

Freitag-Buchshop.png

 
 
 
 
© der Freitag Mediengesellschaft mbH & Co. KG