Hvad er dobbelt indhold – Duplicate Content

Duplicate Content betyder som ordene siger duplikeret indhold. Duplikeret indhold er når to næstens ens tekster opstår på forskellige URL adresser, hvad enten det er internt på samme domæne eller på flere forskellige domæner.
Synonymer: dublicate content, dublicated content, duplicate content google, duplicate content penalty, duplicate content seo, Dobbelt indhold, dublikeret indhold, DC
hvad er duplicate content dobbelt indhold

Der er forskellige meninger omkring Duplicate content, og det er et emne som jeg blandt andet, har diskuteret med rigtig mange mennesker. Nogle går ikke så meget op i det, mens vi hos kim-tetzlaff.dk går rigtig meget op i det.

Google selv har den mening at duplikeret indhold ikke skal forekomme. Og gør det så alligevel det, vil der også være en såkaldt Duplicate Content straf (duplicate content penalty) forbundet med dette. I nogle tilfælde endda en større straf i form af det at blive taget af Google for at prøve at snyde, men så skal det også være rigtig slemt.

Hvordan defineres Duplicate Content (identiske sider)?

Duplikeret indhold er det at stort set det samme indhold går igen på flere forskellige web adresser. Jeg skriver stort set, fordi der i DC godt kan være mindre tekstændringer, og stadig være duplikeret indhold.

Hvilke DC problematikker findes der?

Vi kan klart ikke komme ind på alle de punkter hvor der kan opstå Duplicate Content, men her er en liste over de mest normale steder hvor identiske sider kan opstå. Og hvor rigtig mange webhuse, cms huse, webbureauer og programmører laver fejl.

  • Hjemmesiden med og uden www
    Kan hjemmesiden tilgås både via domænet med www og domænet uden www, så er der stor risiko for at alle dine sider vil blive anset som værende duplicate content.
  • Tomme sider, eller pladsholdere
    Har du en del sider som fungerer som pladsholdere og ikke har noget indhold, kan dette også blive anset som værende identisk indhold
  • Printervenlige sider
    Har du en printvenlig side som åbner en ny side hvor kun det der skal printes er vist, så er der også her en risiko for duplikeret indhold
  • Flere produktvarianter
    Har du en shop hvor der er flere produktvarianter, fx rød, blå, grøn. Og disse ikke har unikt indhold, kan der også her være en risiko for Duplicate Content
  • Brugervenlige og søgemaskinevenlige URL adresser
    Har du en dynamisk side som tager brug af fx URL omskrivning, så webadressen bliver læsevenlig, kan der være en stor risiko for duplicate content. Og samtidig er der også uanede muligheder for at generere DC hvis ikke man som programmør har taget højde for det da man byggede hjemmesiden. Og her fejler rigtig mange hjemmesider.
  • Kopieret indhold
    Har du kopieret noget tekst fra en anden hjemmeside og brugt den på din eller en helt tredje hjemmeside, så er der også en risiko for identiske sider.

Når man har med Duplicate content at gøre, skal man som udvikler kunne se frem og ikke mindst se de huller hvor der kan blive skabt DC.

Prøv fx at skrive dit ”ditdomæne.dk/?” i adresselinjen, uden citationstegn.
Vises forsiden er det duplikeret indhold, og så skulle du derefter prøve at skrive ”ditdomæne.dk/?abc=DC” Ja som du nok kan se er der nok ubegrænset antal metoder til at generere duplicate content.

Vises forsiden ikke, men i stedet en fejlside med korrekt opsat header, er du nået ret langt i kampen mod DC.

Hvad er straffen for Duplicate Content?

Man taler egentlig ikke om en reel DC straf, men mere en filtrering af søgeresultater, da Google gerne vil give deres brugere det bedste søgeresultat. Problematikken med denne filtrering er at man ikke skal lade Google bestemme hvilke sider der skal filtreres fra, og har man Duplicate Content, kan man være sikker på at Google gør det. Og de gør det helt sikkert ikke som du gerne ville have det.

Jeg har dog oplevet gennem tests, at søgeresultater som før lå på side 1 på Google, blev sendt helt ned på side 10 og mere. Så man kan godt i nogle tilfælde tale om en straf, for er man som bekendt ikke at finde på side 1 er det tvivlsomt hvor mange der vil klikke sig ind på din hjemmeside.

I nogle få tilfælde kan det komme på tale at man reelt bliver straffet, da Google ryder op i deres databaser nogen gange, og er der fx sider med DC, kan man risikere at alle de identiske sider, inklusiv originalen bliver slettet. Og så er siden jo slet ikke til at finde nogen steder på Google.

Hvordan undgår man identiske sider?

Jo i grunden kan man sige at man kan lave form for ”Catch All” metode, som går ind og kigger på findes det eller findes det ikke. Kort sagt handler det om at tage kontrollen og sætte nogle regler for hvad der er tilladt, og hvad man gør hvis reglerne bliver brudt.

Her er nogle få eksempler som vi selv bruger:

  • 301 redirect fra domænet uden www til domænet med www
  • 301 redirect fra www.kim-tetzlaff.dk/index.php til www.kim-tetzlaff.dk
  • Findes siden ikke, 301 redirect til den mest relevante side, findes der ikke en relevant side, 301 redirect til forsiden
  • Printvenlige sider bliver lavet med CSS
  • Manuel 301 redirect af bestemte URL’er
  • Osv.

Ovenstående punkter er bare noget af det du skal gøre for at sikre mod Duplicate Content. Vores SEO CMS bruger Catch All metoden til at fjerne risikoen for duplikeret indhold.

kim tetzlaff

Om forfatteren

Se mere Kim Tetzlaff

Jeg har siden 1995 arbejdet med og haft stor fokus på Teknisk SEO og hastighed på hjemmesider. Jeg er programmør, nørd og stolt af det. Jeg bygger hjemmesider, hastighedsoptimere, ser på det SEO tekniske og det er mere end 25 års erfaring der ligger bag – Du er i gode hænder når jeg laver noget for dig 🙂

Skriv en kommentar

Kategorier og tags på dette indlæg

,

Måske du også vil læse disse indlæg

Ja, jeg har også skrevet andre indlæg som måske kunne have din interesse