martes, 16 de diciembre de 2014

Detectar contenido duplicado

De Adrián Coutin

No cabe duda que las Google Search Console es un utilitario que llegó para quedarse y que podemos utitlizar para detectar el contenido duplicado. Por otro lado todos sabemos el problema que nos genera el contenido duplicado para el posicionamiento de los sitios Web.

Son innumerables los problemas y errores que podemos detectar usando las opciones disponibles las Herramientas de Google Webmaster (GWT, siglas en inglés y ahora Google Search Console).

Aquí les expongo algunas algunas ideas que les pueden ayudar a detectar problemas con el contenido duplicado y escaso, una de las causas de Google Panda.

Veamos los elementos más importantes del Panel de Control.

Muestra la información general sobre el funcionamiento de la Web de acuerdo a Google Search Console
Google Search Console: Información General de un sitio Web

La pantalla de inicio nos muestra los principales datos del funcionamiento de la Web y el acceso a las informaciones que nos brinda GWT:
  • Mensajes del sitio
  • Aspectos de la Búsqueda
  • Tráfico de Búsqueda
  • Rastreo 
  • Problemas de Seguridad
  • Otros recursos
Veamos cómo podemos conocer el contenido duplicado y escaso reportado por el propio Google.

Aspecto de la Búsqueda - Mejoras del HTML: Contenido Dupliado

De forma simple y sencilla nos podemos informar de todos los problemas con títulos, meta descripciones, y contenido que no es indexable por el buscador. 

Ayuda a Detectar contenido duplicado
Google Search Console: Mejoras del HTML


Las meta descripciones y títulos duplicados permiten detectar contenido duplicado que afecta la valoración de los sitios Web.

Pongamos el siguiente ejemplo:

Tienes una Web de 200 páginas y utilizas un gestor de contenido (CMS) cuya administración y gestión no dominas muy bien. Revisas GWT y te encuentras con que hay más de 100 páginas con meta descripciones y títulos repetidos.

Tener una Web con 200 páginas y que existan más de 100 páginas con títulos y meta descripciones duplicadas puede ser un serio problema con Google.

Puede que tengas replicadas muchas páginas, el peor de los casos, o puede que sólo sean los títulos que, por una incorrecta instalación del CMS, están siendo  replicándos en todas las páginas.

 Otra causa pueden ser las paginaciones (páginas sucesivas que muestran títulos y breves descripciones del producto y/o servicio o simplemente posts que brindas en blog) y que, en muchos casos, reproducen el título de la página principal.

Manos a la obra, debes reducir al mínimo el contenido duplicado.

Si la causa es una replicación de títulos del CMS que estés usando busca toda la información relacionada con el SEO de ese CMS. Drupal posee excelentes módulos que te evitan duplicaciones de contenidos en títulos, meta descripciones, etc.

Si posee paginaciones debes activar el uso de direcciones canonical. Aquí puedes encontrar toda la información sobre Cómo usar direcciones URL canonical

Finalmente comentarles sobre una información clave disponible en esta opción: Contenido no indexable. 

Muestra detalle sobre información del contenido que Google no puede indexar
Google Search Console: Contenido no indexable

Si, en muchas ocasiones estamos tan enfrascados en tareas complejas como la usabilidad y el diseño de la Web y olvidamos revisar y comprobar que el contenido de nuestras páginas sea indexable por los motores de búsquedas.

Algunos de los problemas que pueden causar que el contenido no sea indexable:

No hay enlaces hacia esas páginas, los textos aparecen incluidos solamente en en imágenes, (recuerden que los buscadores necesitan texto legible por ordenadores, etc.) Los desarrollos Web soportados solamente en Flash pueden generar estas situaciones.

No hay comentarios:

Publicar un comentario en la entrada