XML Sitemap

 

Die XML Sitemap ermöglicht es, die Seiten einer Webseite verschiedenen Suchmaschinen und anderen Diensten zur Verfügung zu stellen. Sie folgt einem wohldefinierten Schema, kann maschinell ausgelesen werden und ist, wie der Name schon sagt, in XML verfasst.

 

Sinn und Zweck der XML Sitemap

Suchmaschinen wie Google, Yahoo oder Bing können dank der Auflistung die Struktur einer Webseite einfach erfassen. Ohne diese sind sie gezwungen, den internen Links einer Webseite zu folgen und so jede Seite zu katalogisieren zu versuchen. Die Verwendung einer Sitemap hat verschiedene Vorteile:

  • Alle Seiten werden indexiert, auch wenn kein Link auf die Seite führt.
  • Es kann eine Prioritisierung der Seiten durchgeführt werden.
  • Die Suchmaschine fragt eine Datei öfter ab als eine ganze Webseite zu verarbeiten.
  • Mit der Zeitangabe und der Frequenzangabe kann der Suchmaschinenbot in begrenztem Masse beeinflusst werden.

 

XML Sitemap erstellen und registrieren

Die XML Sitemap wird von modernen CMS oft automatisch generiert. Es existieren auch Webdienste (www.xml-sitemaps.com) oder Programme (gnuCrawl&Map), welche diese Funktion übernehmen können. Die Datei muss gegebenenfalls noch im robots.txt aufgeführt werden. So wird sie beim nächsten Besuch vom Bot genutzt. Google und andere Suchmaschinen bieten zudem die Möglichkeit, über Webmaster Tools die Sitemap zu registrieren.

 

Ein Beispiel einer XML Sitemap

Eine XML Sitemap könnte beispielsweise so aussehen:

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
    <url>
        <loc>http://www.iqual.ch</loc>
        <lastmod>2014-02-27T00:00:00Z</lastmod>
        <changefreq>daily</changefreq>
        <priority>1</priority>
    </url>
    <url>
        <loc>http://www.iqual.ch/de/webseiten-optimierung/website-analyse</loc>
        <lastmod>2014-02-09T00:00:00Z</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.3</priority>
    </url>
    <url>
        <loc>http://www.iqual.ch/de/webseiten-optimierung/web-analytics</loc>
        <lastmod>2013-12-16T00:00:00Z</lastmod>
        <changefreq>weekly</changefreq>
        <priority>0.5</priority>
    </url>
</urlset>

 

Die Strukturierung der Datei wird bereits im Artikel XML besprochen. Nachfolgend werden nur kurz die Bedeutung der einzelnen Tags aufgelistet:

  • <urlset> öffnet eine Liste von Einträgen im Format <url> und gibt das Schema an.
  • <url> umfasst alle Angaben für eine eindeutige Seite auf der Webseite.
  • <loc> gibt die URL der Seite an.
  • <lastmod> enthält das Datum und die Zeit der letzten Änderung (gemäss W3C Dateformat).
  • <changefreq> gibt eine ungefähre Änderungshäufigkeit an (always, hourly, daily, weekly, monthly, yearly, never).
  • <priority> definiert die relative Wichtigkeit dieser Seite innerhalb der Webseite (0.0 bis 1.0).


Ursprung und weitere Informationen

Das Protokoll wurde von Google, Yahoo und Microsoft 2006 definiert und ist seither unverändert. Auf der Seite www.sitemaps.org kann der Standard im Detail studiert werden.

 

Kategorie: Suchmaschinenoptimierung, Webentwicklung, Content Management System (CMS)