jueves, 3 de abril de 2014

Los errores 404 Leves - No son tan leves


La Herramientas para Webmasters de Google en su sección de Errores de Rastreo nos informa los Errores de URL errores encontrados en el procesamiento de las URL que componen un sitio Web.



En este caso observamos que Google Webmaster nos informa de 3 tipos de errores. En este caso se trata de un sitio Web de pruebas con bastantes errores en todas sus variantes: Error del servidor, Error 404 leve, y  No se encuentran.

Concentremos el tema en el Error 404 leve.

¿En qué consiste este tipo de error? De acuerdo a la propia ayuda de la Herramienta de Google Webmaster se trata de que "la URL de destino no existe y el servidor no devuelve un error 404 (archivo no encontrado)".

Son páginas Web que de acuerdo a su contenido deben dar 404 o 410 a los ojos del buscador y responden 200 lo cual puede ser indicativo de una grave infracción si su número es elevado. Haces trabajar más tiempo a googlebot.

El ejemplo más común es con las páginas de resultados de un motor interno de búsqueda. Si estas páginas tienen contenido responden en el código de estado HTTP  con 200 y no hay ningún problema, pero aquellas que no muestran resultados, sólo informan que no hay resultados para la búsqueda que se ha solicitado deben responder con el código de estado 404 o 410, es decir, no se encuentra el resultado.

¿Por qué Google considera que las páginas sin resultados deben responder 404 o 410? Por diversas razones:

- Googlebot no debe procesar estas páginas. Significa tiempo de trabajo del spider en páginas sin valor.

- Al procesar estas páginas Google las consideras páginas duplicadas y sin valor, enviándolas al índice suplementario de dicho buscador afectando la calidad de optimización del sitio Web.

¿Es un error muy frecuente?

Si, muchas veces no se tiene en cuenta a la hora de generar las páginas de resultados y suele pasar  desapercibido para los spiders también. Son páginas que, por lo general, no son enlazadas, tienen una vida limitada.

El problema surge cuando se colocan enlaces hacia estas páginas y posteriormente se modifica el contenido en la Web.

Ejemplo. 
  1. El motor interno ofrece resultados por un tipo de búsqueda. Alguien coloca enlaces hacia estas páginas, suele ocurrir en foros. La o las páginas tienen contenido y responde 200 lo cual no tiene ningún inconveniente.
  2. Se modifica el contenido de la Web y ya el contenido de las páginas dejan de mostrar resultados.
  3. Se mantienen los enlaces y googlebot sigue accediendo a los enlaces que responden 200 y no hay contenido. Aquí tenemos un error leve 404. Si son pocas páginas no tendremos problemas si son muchas páginas tendremos problemas.
Este es un simple ejemplo de los errores 404 Leves que son reportados en la herramienta de Google Webmaster pero por supuesto que existen más situaciones sobre todo cuando trabajamos con Web dinámicas.
Puedes encontrar más información de este error en: Errores 404 leves

1 comentario:

  1. Después de la entrada de Panda 4.0 y Panda 4.1 se han detectados incrementos de este reporte. Son páginas sin apenas contenidos o páginas de resultados de búsquedas enlazadas dentro de los esquemas de navegación del sitio Web.

    Estas páginas no deben estar procesadas por Google. Si las necesitas utiliza las metatags 'noindex, nofollow' y asi Google no procesará este contenido.

    ResponderEliminar