Quais são os erros mais comuns que causam duplicação de conteúdo ?
Duplicação de conteúdo é um problema que afeta a maioria dos sites (estamos falando de 60%). É possível falar de duplicação, quando o conteúdo é indexável em várias URLs.
Por exemplo, a página inicial de um site é frequentemente acessível das duas maneiras :
domaine.com
domaine.com/index.php (ou /home...)
Todas as páginas de um site também são duplicadas regularmente por meio da ausência (ou adição) do subdomínio www.
www.domaine.com/page.html
http://domaine.com/page.html
A segurança dos sites (os « https ») exigida pelo Google por um longo tempo você também pode, entretanto, fortalecer a duplicata.
Ex : Eu tenho um site em https declarado em https://www. Se eu não configurar redirecionamentos para essa url principal, ele também estará acessível em https (sem www) e/ou http (com ou sem www.). Portanto, em vez de oferecer aos mecanismos 1 site próprio e exclusivo, você pode (entretanto) oferecer até 4 vezes o mesmo! Uma linda (e atual) bola no pé.
O terceiro problema mais comum é a indexação do site por meio de todas as extensões (TLD) compradas :
www.domaine.fr
www.domaine.com
Mais uma vez, você tem que redirecionar (em 301, chamado redirecionamento permanente) todos os nomes de domínios anexados para o seu NDD principal, a fim de evitar duplicatas.
Ex : Eu escolhi um NDD .fr para ser visível principalmente em francês e, para proteger a minha marca, comprei o NDD em .com, .net (e/ou, por exemplo, minha marca-cidade ou pays.fr).
É essencial que eu redirecione todos os NDDs para o meu NDD principal em 301. Portanto, se você seguiu corretamente, para o NDD canônico assim geralmente em https com ou sem www.
Outros problemas comuns estão relacionados à indexação pelo Google da versão de pré-produção/aceitação. (teste e validação antes de entrar on-line) ou ainda URLs contendo parâmetros de rastreamento. Portanto, desconfie, devemos favorecer uma versão de pré-produção acessível apenas por login/senha e, portanto, invisível do Google. Um bom fornecedor de serviços pensará sobre isso, e não um mau.
Por último, os links internos que não são consistentes em todo o site constituem um outro erro grave e relativamente pernicioso. Portanto, não crie um link para criar um link passando pela cozinha tailandesa para bolas de boliche. Você precisa direcionar seu conteúdo. É preciso também evitar links quebrados (404) ou outros problemas desaprovados pelos mecanismos.
Assim, para acessar, por exemplo, a ficha do produto de um site de comércio eletrônico, podem ser oferecidos várias URLs (cuidado com alguns CMS) :
www.domaine.com/categorie/produit.html
www.domaine.com/produit.html
As agências Web raramente são conscientizadas ou mesmo sensíveis a esses problemas delicados e demorados. O referenciador raramente atrai os desenvolvedores (« Ah você me conhece, o desempenho » « Tenho outra coisa para lidar do que o Google »).
Portanto, é conveniente estar muito atento, mesmo que, de acordo com o Google, a duplicação de conteúdo não seja um grande problema ... ou pelo menos não seja um problema de penalidade ao contrário da legenda.