Hvad er et XML sitemap?

af Morten Empeño


Skrevet Wednesday, July 12, 2017


Hvad er et XML sitemap?

Et XML sitemap er en fil, som ganske kort og systematisk beskriver filerne på din hjemmeside. Med et XML sitemap kan du fortælle Google og andre søgemaskiner, hvilke sider der er på din hjemmeside, og hvornår de sidst er ændret.

Hvorfor skal du have et XML sitemap?

Søgemaskinerne crawler internettet med jævne mellemrum, og hver hjemmeside har stillet et begrænset tidsrum til rådighed fra søgemaskinerne. Derfor er det en rigtig god idé at fortælle Google og de andre søgemaskiner, hvilke sider der findes på dit website, og hvilke sider der er opdateret sidst. På den måde vil søgemaskinerne bruge den tid, der er til rådighed til netop dit site, på det nyeste indhold, og forhåbentlig vil de nyeste ændringer og tilføjelser til din hjemmeside blive registreret, og du kan høste fordel af dette i form af en bedre ranking på det nyeste indhold.
Alle hjemmesider af en vis størrelse bør altså have et xml sitemap.

Et XML Sitemap hjælper altså søgemaskinerne med at finde alle siderne på et website. Uden denne hjælp ville søgemaskinerne med stor sandsynlighed ikke opdage alle siderne på en given hjemmeside. 

Indeksering

Af ovenstående kan man måske tro, at et XML sitemap sikrer, at dine sider indekseres hos Google og andre søgemaskiner. Her er det nødvendigt at understrege, at Google ikke indekserer dine sider, bare fordi du beder om det. Google vil indeksere dine sider, hvis de finder dem, crawler dem og hvis de herefter bedømmer, at siden har en kvalitet, der berettiger til indeksering. Så dine sider på dit website bliver altså ikke indekseret, blot fordi du i et XML sitemap fortæller Google, at du har en side, der lever på en specifik url.

Ved at submitte et XML sitemap til Google Console, giver du Google information om at du har en side på en bestemt url og at du bedømmer, at siden er af høj kvalitet, så den er berettiget til at være en landing page for besøgende. - men det er ikke mere end det. Det kan sammenlignes med, at du kan gøre tilsvarende i din navigation på dit website. Det er egentlig også bare en liste af urls - selve navigationen fortæller ikke noget om kvaliteten af de sider, der er i listen.

XML Sitemap, Robots.txt og noindex

Du skal have overblik over dit XML Sitemap, din robots.txt fil og hvordan du bruger noindexpå dine sider. Du skal være konsistent. Hvis du eksempelvis blokerer en side i din robots.txt, men på samme tid har denne side inkluderet i dit XML sitemap, giver du Google modstridende oplysninger. Dit XML sitemap oplyser Google om, at der er en side af god kvalitet, som bør indekseres, mens din robots.txt siger, at den samme side ikke skal indekseres. Så helt kort sagt: du skal ikke inkludere en side i dit XML sitemap, og have samme side dekoreret med et noindex meta robots tag.

Hvordan ser et XML sitemap ud?

EMPENO har en hjemmeside (måske læser du netop denne tekst fra vores hjemmeside).
EMPENOs hjemmeside findes på https://www.empeno.dk
Vores XML sitemap findes på https://www.empeno.dk/sitemap.xml
Da vi lige startede med at bygge EMPENOs website, så xml sitemap således ud:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.empeno.dk/</loc>
<lastmod>2017-08-11T05:23:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/seo/</loc>
<lastmod>2017-09-03T05:56:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/cases/</loc>
<lastmod>2017-07-24T05:40:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/blog/</loc>
<lastmod>2017-08-10T06:41:00+00:00</lastmod>
</url>
<url>
<loc>
http://www.empeno.dk/blog/overraskende-seo-resultat/
</loc>
<lastmod>2017-08-10T06:49:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/blog/gratis-seo-tools/</loc>
<lastmod>2017-08-10T06:41:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/blog/hastighedsoptimering/</loc>
<lastmod>2017-08-10T06:41:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/blog/hvad-er-xml-sitemap/</loc>
<lastmod>2017-08-10T06:41:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/blog/seo-for-begyndere/</loc>
<lastmod>2017-08-10T06:41:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/vision/</loc>
<lastmod>2017-07-24T03:53:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/kontakt/</loc>
<lastmod>2017-07-24T03:53:00+00:00</lastmod>
</url>
<url>
<loc>http://www.empeno.dk/mortenempeno/</loc>
<lastmod>2017-07-23T06:29:00+00:00</lastmod>
</url>
</urlset>

Dette er en meget forsimplet version af et XML Sitemap. Typisk vil der være flere sider, og hver side vil have flere oplysninger. Som det ses, kan et XML Sitemap indeholde en URL og informationer om, hvornår denne URL sidst er opdateret. Men du kan også have yderligere informationer, der fortæller hvor ofte hjemmesiden ændres, og hvor vigtige hver side er i forhold til de andre sider på hjemmesiden. Alle disse infromationer hjælper søgemaskinerne med at forstå dit website, og crawle det på bedst mulig vis.

Det er meget normalt at have sit sitemap til at ligge i roden af sit website, og med et navn på filen, der hedder sitemap.xml. På en lang række websites, vil du altså finde et XML sitemap på www.domænenavn.dk/sitemap.xml

Kan man kalde sin XML Sitemap hvad man vil?

Man kan dog sagtens kalde den fil, der udgør xml sitemap noget andet end xml sitemap. De fleste mere seriøse websites, har en fil der hedder robots.txt. I denne fil kan man angive placeringen af sin sitemap fil. Det kan gøres med en enkelt linje i robots.txt filen, og det kan se således ud:
Sitemap: http://www.example.com/sitemap.xml

Dynamisk XML Sitemap

Når du får udviklet en hjemmeside, bør du sikre dig, at hjemesiden indeholder et CMS system, og at der genereres et dynamisk sitemap baseret på indholdet i dit CMS system. CMS systemet er det system, der bruges når du indtaster dit indhold, vælger hvilke billeder, der skal være på hvilke sider mv. Der findes en lang række CMS systemer som eksempelvis Umbraco, Sitecore, WordPress mv.

Forestil dig, at du har lavet en ny side på dit website - i dit CMS system. Det ville være uheldigt, at du herefter manuelt skulle opdatere dit XML Sitemap - altså at du manuelt skulle indsætte de linjer, der ville være relevant i XML filen - og at du herefter selv skulle uploade den til det rigtige sted, for at Google og andre søgemaskiner ville kunne fiden den. Derfor bør du sikre dig, at de software udviklere, der har lavet dit website, har lavet din hjemmeside således, at dette sker helt automatisk. En ny side, eller en rettelse på en eksisterende side, bør automatisk genere et opdateret XML Sitemap, så Google ved at din hjemmeside har fået nyt indhold, og således at dette indhold bliver indekseret, så brugerne kan finde det. 

Kompliceret?

Synes det, at det lyder komplekst? Vil du gerne være sikker på at du har et XML Sitemap, og at det fungerer korrekt? Har du andre spørgsmål, der ikke blev besvaret i denne artikel?

Ja - så er du naturligvis velkommen til at ringe eller skrive til os, og så skal vi gøre vores bedste, for at hjælpe dig.