terça-feira, 4 de março de 2008

Novo método do Google para detectar conteúdo duplicado

(Google's new method to detect duplicate content - Axandra Search Engine Facts - versão brasileira por Alexis Kauffmann)

Google não gosta de conteúdo duplicado. O motivo para isso é que os primeiros 10 resultados de pesquisa devem oferecer aos usuários um cardápio de páginas web diferentes.

O novo pedido de patente do Google para conteúdo duplicado descreve um novo método pelo qual o Google tenta evitar que seus usuários encontrem conteúdo redundantes  nas páginas de resultados.

Conteúdo pode ser duplicado por uma série de razões

Há muitas razões pelas quais um conteúdo pode ser duplicado ou porque os documentos podem ser muito semelhantes:

  1. O conteúdo de uma página web é disponibilizado em diferentes formatos: página web, versão para impressão, PDF, página para telefone celular, etc.
  2. O conteúdo da página é syndicated, por exemplo, artigos, notícias ou posts de blogs.
  3. O sistema de gerenciamento de conteúdo (CMS) exibe o mesmo conteúdo em locais diferentes. Por exemplo, um item de produto pode ser encontrado na categoria "cor" e na categoria "tamanho".
  4. O proprietário do website oferece sites-espelhos para assegurar-se de que o site não fique lento em caso de múltiplos acessos à mesma página ao mesmo tempo.
  5. Alguém roubou o conteúdo da página para reprodui-lo em outros websites.

Para evitar a exibição do mesmo conteúdo mais de uma vez nos resultados de pesquisa, as ferramentas-de-busca tentam detectar essas páginas duplicadas.

O que há no pedido de patente?

O aplicativo patenteado descreve como o Google tenta detectar conteúdo duplicado ou muito semelhante em diferentes endereços web. Parece que o Google deverá combinar diferentes métodos já existentes para detectar novo conteúdo duplicado para identificar mais duplicatas ainda na Internet.

O novo pedido de patente mostra que o Google encara com seriedade a questão do conteúdo duplicado. O novo pedido de patente é apenas o passo mais recente nas tentativas do Google para detectar conteúdo duplicado. Por exemplo, os passos anteriores podem ser encontrados aqui (PDF) e aqui.

O que o Google faz quando detecta conteúdo duplicado?

É difícil dizer o que o Google fará quando encontrar páginas duplicadas. Há muito conteúdo duplicado que é usado para propósitos legítimos.

Se o Google apenas remover as páginas duplicadas dos resultados para uma pesquisa específica, tudo bem. Se o Google penalizar as páginas duplicadas removendo-as completamente do índice, o Google corre o risco de perder relevância para pesquisas muito específicas e pode também penalizar as páginas erradas.

É provável que o Google vá Google escolher a página com a melhor reputação e os melhores links de retorno para os resultados de pesquisa se encontrar mais de uma página com  o mesmo conteúdo.

O que isto significa para seu website?

Se você quer rankings elevados, é mais fácil conseguir isso com conteúdo único. Tente usar o máximo de conteúdo original possível em suas páginas web.

Se o seu website precisa usar o mesmo conteúdo de outro website, certifique-se de que seu website tem melhores links de retorno do que os outros websites que apresentam o mesmo conteúdo.

Blogged with Flock

Nenhum comentário: