Duplicate content is voor veel webmasters een schrikbeeld. Met “duplicate content” wordt gedoeld op het meerdere malen publiceren van dezelfde informatie. Google hanteert een strikt beleid op dit gebied. Wanneer opzettelijk wordt geprobeerd om zoekmachines te manipuleren met dubbele content mag de overtreder rekenen op een “duplicate content penalty”, wat zelfs zover kan gaan als het verwijderen van de site uit de zoekresultaten.
Valide oorzaken van duplicate content
Duplicate content is zeker niet in alle gevallen gericht op het manipuleren van zoekmachines. Het meerdere malen publiceren van eigen nieuws op sites “uit de eigen stal” valt bijvoorbeeld wel onder de noemer “duplicate content”, maar wordt door Google zeker niet bestraft. In een recente post op Google’s Webmaster Central Blog, Demystifying the "duplicate content penalty", heeft Google nog eens goed uitgelegd wat er nu eigenlijk wel en niet mag.

Duplicate content door URL rewriting
Een belangrijke bron van duplicate content wordt gevormd door zoekmachine-vriendelijke URL’s. Bij URL rewriting wordt een complexe URL vervangen door een voor zoekmachines begrijpelijke URL waarin belangrijke zoekwoorden zijn verwerkt. Wanneer zowel de oorspronkelijke URL als de herschreven URL is geïndexeerd door Google, is dezelfde informatie dus meerdere malen aanwezig in Google. Google zal dan proberen om te bepalen welke informatie in de zoekresultaten moet worden getoond.
Er kunnen diverse maatregelen worden genomen om Google hierbij te sturen, bijvoorbeeld door in de Google Sitemap aan te geven wat de actuele versie is van de pagina. Dit zijn echter feitelijk lapmiddelen. Veel beter is om het probleem aan te pakken bij de bron: het CMS en de website.
SiteManager CMS en duplicate content
SiteManager heeft structurele oplossing voor het probleem van duplicate content door URL rewriting. Bij elke opgevraagde pagina wordt gecontroleerd of het adres dat is gebruikt nog gelijk is aan het actuele herschreven adres van een pagina. Als het actuele adres afwijkt van het opgevraagde adres wordt er automatisch een permanente doorverwijzing (301-redirect) naar de actuele URL gezet.
Deze aanpak werkt uiteraard óók als een URL wordt gewijzigd in het kader van een zoekmachine-optimalisatietraject. URL’s kunnen dus worden gewijzigd en geoptimaliseerd zonder nadelige gevolgen voor zoekmachine-posities.
De SiteManager standaard aanpak van duplicate content als gevolg van URL rewriting is uniek in CMS land. De aandacht voor dit onderwerp is een goede illustratie van de focus op zoekmachine-optimalisatie van SiteManager CMS.